xCellx 的详细使用方法和结果分析
理论知识:
组织是由不同谱系和亚型的细胞类型组成的复杂环境,每种细胞都有自己独特的转录组。因此,批量转录组分析是细胞类型特异性基因表达的总和加权的细胞类型比例在给定的样本。去卷积的基因表达谱允许重建组织的细胞组成。Xcell 是一个强大的计算方法,转换基因表达谱为丰富分数的64免疫和基质细胞类型跨样本。
不同受试者细胞类型组成的差异可以确定疾病的细胞靶点,并提出新的治疗策略。此外,调整这些变异可以检测真正的基因表达差异,并提高解释下游分析。
1.安装xCell
Xcell 是在 r 中开发的,用于运行 xcell 的 r 包可以作为 github 存储库中的开源代码使用 (https://github.com/dviraran/xCell)
安装 r 是一个先决条件(https://www.r-project.org/) ,rstudio 是运行 r 脚本的推荐环境(https://www.rstudio.com/)。
要安装 xcell r 包,下面的所有命令都应该在 r 环境中输入:
如果 devtools 包以前没有安装,首先安装它:
install.packages('devtools')
从 github 安装当前的 xcell 版本:
devtools::install_github('dviraran/xCell')
Xcell 包装依赖于以下包装: 生物导体包装ーGSVA,GSEABase。
if (!requireNamespace("BiocManager", quietly = TRUE))
install.packages("BiocManager")
BiocManager::install(c("GSVA","GSEABase"), version = "3.8")
CRAN packages—pracma, utils, stats, MASS, digest, curl,
quadprog.
install.packages('pracma', 'utils', ' stats', 'MASS',
'digest', 'curl', 'quadprog')
以上为xCell说明文档的安装说明,以下为网络上的方法(用以下即可)。
install.packages('Rcpp') #########安装各类程序包
devtools::install_github('dviraran/xCell')
library(xCell)
2.输入文件
文件格式:Xcell 的输入是来自人类混合样本的基因表达矩阵。应该在运行 xcell 函数之前读取它。矩阵应该是基因作为行名,列是样本。如果基因表达式是一个标签分隔的文件,可以使用下面的调用来读取它:
expr = read.table(file.name, header=TRUE, row.names=1, as.is=TRUE, sep='\t')
如果基因表达数据来自微阵列,就不需要标准化。如果基因表达数据来自一个测序平台,数值必须被归一化为基因长度(例如,rpkm,tpm,fpkm)。Xcell 使用表达式级别排序,而不使用实际值,因此进一步的规范化不会产生影响。
3.xCell Pipeline
Xcell 管道由三个步骤组成,它们在 r 包中也表示为函数:
1. rawEnrichmentAnalysis
xCell.data$genes
作为最低要求,输入基因表达矩阵至少需要5000个基因,但共用基因数目太少可能会影响结果的准确性。
Xcell 为每种单元格类型使用多个签名。总共有489个特征符合64种细胞类型。完整的签名列表可在以下网址找到:
xCell.data$signatures
得分计算使用单样本基因集富集分析(ssGSVA)。对于每个单元格类型,计算来自多个相应签名的多个得分的平均值。最后,平均分数被移动,使得每个单元格类型的最小分数为零。
scores = rawEnrichmentAnalysis(expr, signatures,
genes, file.name, parallel.sz, parallel.type = "SOCK")
2. transformScores
这个函数用于将得分从原始浓缩得分转换为类似百分比的线性尺度,xcell 使用预先计算的校准参数进行转换。Xcell 使用不同的参数设置基于序列的基因表达值和基于微阵列的值(有关调整校准参数的信息,请参阅注3)。基于序列的值的参数可以在下面找到:
xCell.data$spill$fv
对于基于微阵列的数据:
xCell.data$spill.array$fv
函数的用法如下:
tscores = transformScores(scores, fit.vals, scale, fn)
‘scores’是 rawenrichmentanalysis 的输出; ‘ fit.vals’是上面描述的校准参数; 如果符合逻辑,则是否按比例缩放转换后的分数(默认值为 true 并推荐使用)。
3. spillOver
spillOver(transformedScores, K, alpha = 0.5, file.name = NULL)
usage
xCellAnalysis(expr, signatures = NULL, genes = NULL, spill= NULL, rnaseq = TRUE, file.name = NULL, scale = TRUE, alpha =0.5, save.raw = FALSE, parallel.sz = 4, parallel.type = "SOCK",cell.types.use =NULL)
可简化为
exprMatrix = read.table("expr",header=TRUE,row.names=1, as.is=TRUE)
4.实例
1)输入样本
在https://github.com/dviraran/xCell/tree/master/vignettes
sdy = readRDS('sdy420.rds')
sdy有两种数据,一种是表达谱,另一种是细胞分数。
raw.scores = rawEnrichmentAnalysis(as.matrix(sdy$expr),
xCell.data$signatures,
xCell.data$genes) #首先生成原始分数
下一步是转换原始分数,并应用溢出补偿。为了获得最佳的结果,最好只对相关的细胞类型进行溢出补偿(例如,如果我们知道混合物中没有巨噬细胞,最好将它们从分析中去除)。因此,我们将分数矩阵子集为仅在CyTOF数据集中也被测量的单元格类型:
cell.types.use = intersect(colnames(xCell.data$spill$K),
rownames(sdy$fcs))
最后一步是补偿溢出效果的分数:
scores = spillOver(transformed.scores,xCell.data$spill.array$K)
请注意,我们在这里使用xCell.data$spill.array数据,因为表达式数据是用微阵列生成的。上面详细介绍的管道也可以使用xCell分析包装器功能同样执行:
scores = xCellAnalysis(sdy$expr, rnaseq=F,cell.types.use = cell.types.use)
使用这些分数,我们现在可以找到细胞分数和细胞类型分数之间的相关性:
library(psych)
library(ggplot2)
fcs = sdy$fcs[rownames(scores),colnames(scores)]
res = corr.test(t(scores),t(fcs),adjust='none')
qplot(x=rownames(res$r),y=diag(res$r),
fill=diag(res$p)<0.05,geom='col',
main = 'SDY420 asspciation with immunoprofiling',
ylab = 'Pearson R')+labs(fill="p-value<0.05")+
theme_classic()+
theme(axis.text.x = element_text(angle = 45,hjust = 1))
该代码生成一个条形图(图1a),用于显示xCell分数与免疫分析的预期分数的相关性。我们发现18种细胞类型中的13种存在显著相关性(p值<0.05),7种细胞类型中存在高相关性(R>0.5)。需要注意的是,xCell产生的是富集分数,而不是细胞类型的比例,因此不期望分数会与CyTOF比例相似,只是测量值之间将存在线性相关。
在上面的分析中,我们使用一个细胞子集运行了xCell,而不是所有64种细胞类型。在某些情况下,这可能会提高准确性,因为溢出补偿程序可能会进行过度补偿。因此,我们可以对所有细胞类型进行相同的分析,并与免疫图谱分析进行关联:
上一篇: 隐藏 HTTP 响应头中的服务器和 X-Power-By 信息
下一篇: AppScan 漏洞扫描 - "X-Content-Type-Options" 标头缺失或不安全、"X-XSS-Protection "标头缺失或不安全、跨框架脚本防御缺失或不安全 不安全
推荐阅读
-
多元回归分析:理解相关关系并预测结果 - 一、多元回归分析旨在研究自变量X与因变量Y之间的关联,以揭示Y形成的机制,并利用X进行预测。共有五种常见的回归分析方法,包括线性回归、0‐1回归(逻辑回归)、定序回归、计数回归和生存回归,它们的划分依据是因变量Y的不同类型。因变量还可分为连续数值型变量等多种类别。
-
苹果A15真的太棒了!别选错啦,iPhone 14 Pro A16 性能测试结果出炉,实际提升其实并不大哦!不过,大家肯定更想知道的是,A16 处理器和 A15 处理器相比,性能提升了多少吧?不用担心,我们已经对 A16 的性能进行了详细的测试,并会在本文中告诉大家答案。
-
使用Verilog编程的数字分频器设计:偶数、奇数、小数和半整数分频,以及状态机分频的详细教程与仿真结果
-
汇编语言中的状态标志符(CF、OF、SF、ZF)在运算(ADD、SUB、ADC、SBB)中的响应变化 详细解释: - SF标志位表示有符号数运算结果的正负性,有四种可能的情况: - 当结果的最高位为0,且操作数为正数时,SF为0; - 当结果的最高位为0,且操作数为负数时,SF为1; - 当结果的最高位为1,且操作数为正数时,SF为1; - 当结果的最高位为1,且操作数为负数时,SF为0。 - ZF标志反映结果是否为0,当结果不为0时,ZF为0。 以下是各种SUB运算下标志符的响应情况: - 无符号数和有符号数都溢出: - CF为1,说明无符号数运算存在溢出; - OF为1,说明有符号数运算存在溢出。 | 操作数 | 运算结果 | CF | OF | | --- | --- | --- | --- | | 114 | -147 | 1 | 1 | - 无符号数: - CF为0,说明没有发生解位; - OF为0,说明没有发生溢出。 | 操作数 | 运算结果 | CF | OF | | --- | --- | --- | --- | | 114 | -147 | 0 | 0 | - 有符号数: - CF为1,说明需要解位; - OF为1,说明发生了溢出。 | 操作数 | 运算结果 | CF | OF | | --- | --- | --- | --- | | 114 | -109 | 1 | 1 |
-
【2022新手指南】Java编程进阶之路 - 六、技术架构篇 ### MySQL索引底层解析与优化实战 - 你会讲解MySQL索引的数据结构吗?性能调优技巧知多少? - Redis深度揭秘:你知道多少?从基础到哨兵、主从复制全梳理 - Redis持久化及哨兵模式详解,还有集群搭建和Leader选举黑箱打开 - Zookeeper是个啥?特性和应用场景大公开 - ZooKeeper集群搭建攻略及 Leader选举、读写一致性、共享锁实现细节 - 探究ZooKeeper中的Leader选举机制及其在分布式环境中的作用 - Zab协议深入剖析:原理、功能与在Zookeeper中的核心地位 - RabbitMQ全方位解读:工作模式、消费限流、可靠投递与配置策略 - 设计者视角:RabbitMQ过期时间、死信队列与延时队列实践指南 - RocketMQ特性和应用场景揭示:理解其精髓与差异化优势 - Kafka详细介绍:特性及广泛应用于实时数据处理的场景解析 - ElasticSearch实力揭秘:特性概述与作为搜索引擎的广泛应用 - MongoDB认知升级:非关系型数据库的优势阐述,安装与使用实战教学 - BIO/NIO/AIO网络模型对比:掌握它们的区别与在网络编程中的实际应用 - Netty带你飞:理解其超快速度背后的秘密,包括线程模型分析 - 网络通信黑科技:Netty编解码原理与常用编解码器的应用,Protostuff实战演示 - 解密Netty粘包与拆包现象,怎样有效应对这一常见问题 - 自定义Netty心跳检测机制,轻松调整检测间隔时间的艺术 - Dubbo轻骑兵介绍:核心特性概览,服务降级实战与其实现益处 - Dubbo三大神器解读:本地存根与本地伪装的实战运用与优势呈现 ----------------------- 七、结语与回顾
-
数据挖掘 | 相关性分析] Jaccard相似系数详解,关于相关性的集合(详细案例,附详细代码实现和动手操作,学习资源)
-
异步编程RxJava-介绍-前言 前段时间写了一篇对协程的一些理解,里面提到了不管是协程还是callback,本质上其实提供的是一种异步无阻塞的编程模式;并且介绍了java中对异步无阻赛这种编程模式的支持,主要提到了Future和CompletableFuture;之后有同学在下面留言提到了RxJava,刚好最近在看微服务设计这本书,里面提到了响应式扩展(Reactive extensions,Rx),而RxJava是Rx在JVM上的实现,所有打算对RxJava进一步了解。 RxJava简介 RxJava的官网地址:https://github.com/ReactiveX/RxJava, 其中对RxJava进行了一句话描述:RxJava – Reactive Extensions for the JVM – a library for composing asynchronous and event-based programs using observable sequences for the Java VM. 大意就是:一个在Java VM上使用可观测的序列来组成异步的、基于事件的程序的库。 更详细的说明在Netflix技术博客的一篇文章中描述了RxJava的主要特点: 1.易于并发从而更好的利用服务器的能力。 2.易于有条件的异步执行。 3.一种更好的方式来避免回调地狱。 4.一种响应式方法。 与CompletableFuture对比 之前提到CompletableFuture真正的实现了异步的编程模式,一个比较常见的使用场景: CompletableFuture<Integer> future = CompletableFuture.supplyAsync(耗时函数); Future<Integer> f = future.whenComplete((v, e) -> { System.out.println(v); System.out.println(e); }); System.out.println("other..."); 下面用一个简单的例子来看一下RxJava是如何实现异步的编程模式: Observable<Long> observable = Observable.just(1, 2) .subscribeOn(Schedulers.io).map(new Func1<Integer, Long> { @Override public Long call(Integer t) { try { Thread.sleep(1000); //耗时的操作 } catch (InterruptedException e) { e.printStackTrace; } return (long) (t * 2); } }); observable.subscribe(new Subscriber<Long> { @Override public void onCompleted { System.out.println("onCompleted"); } @Override public void onError(Throwable e) { System.out.println("error" + e); } @Override public void onNext(Long result) { System.out.println("result = " + result); } }); System.out.println("other..."); Func1中以异步的方式执行了一个耗时的操作,Subscriber(观察者)被订阅到Observable(被观察者)中,当耗时操作执行完会回调Subscriber中的onNext方法。 其中的异步方式是在subscribeOn(Schedulers.io)中指定的,Schedulers.io可以理解为每次执行耗时操作都启动一个新的线程。 结构上其实和CompletableFuture很像,都是异步的执行一个耗时的操作,然后在有结果的时候主动告诉我结果。那我们还需要RxJava干嘛,不知道你有没有注意,上面的例子中其实提供2条数据流[1,2],并且处理完任何一个都会主动告诉我,当然这只是它其中的一项功能,RxJava还有很多好用的功能,在下面的内容会进行介绍。 异步观察者模式 上面这段代码有没有发现特别像设计模式中的:观察者模式;首先提供一个被观察者Observable,然后把观察者Subscriber添加到了被观察者列表中; RxJava中一共提供了四种角色:Observable、Observer、Subscriber、Subjects Observables和Subjects是两个被观察者,Observers和Subscribers是观察者; 当然我们也可以查看一下源码,看一下jdk中的Observer和RxJava的Observer jdk中的Observer: public interface Observer { void update(Observable o, Object arg); } RxJava的Observer: public interface Observer<T> { void onCompleted; void onError(Throwable e); void onNext(T t); } 同时可以发现Subscriber是implements Observer的: public abstract class Subscriber<T> implements Observer<T>, Subscription 可以发现RxJava中在Observer中引入了2个新的方法:onCompleted和onError onCompleted:即通知观察者Observable没有更多的数据,事件队列完结 onError:在事件处理过程中出异常时,onError会被触发,同时队列自动终止,不允许再有事件发出。 正是因为RxJava提供了同步和异步两种方式进行事件的处理,个人觉得异步的方式更能体现RxJava的价值,所以这里给他命名为异步观察者模式。 好了,下面正式介绍RxJava的那些灵活的操作符,这里仅仅是简单的介绍和简单的实例,具体用在什么场景下,会在以后的文章中介绍 Maven引入
-
详细讲解 Vue 插槽的使用方法和案例演示,阅读后完全理解
-
Vue 插槽(槽位)的详细信息和使用方法
-
Vue 插槽(槽位)的详细信息和使用方法