MaAsLin2 和 R 的实现
MaAsLin2是下一代MaAsLin(与线性模型的微生物组多变量关联),用于有效确定临床数据和微生物组学特征之间的多变量关联。 MaAsLin2依靠通用线性模型来适应大多数现代流行病学研究设计,包括横断面研究和纵向研究,以及各种过滤,归一化和变换方法。该统计方法可以使用命令行或者R实现。
目录
命令行实现
R实现
准备数据
输出文件
例子
all_results.tsv
significant_results.tsv
命令行实现
- 下载源: MaAsLin2.master.zip
- 解压压缩包:
$ tar xzvf Maaslin2-master.zip
- 安装edgeR and metagenomeSeq包.
- 安装CRAN依赖包:
$ R -q -e "install.packages(c('lmerTest','pbapply','car','dplyr','vegan','chemometrics','ggplot2','pheatmap','hash','logging','data.table','MuMIn','glmmTMB','MASS','cplm','pscl'), repos='http://cran.r-project.org')"
- 安装MaAsLin2包(使用R方程时用):
$ R CMD INSTALL maaslin2
R实现
安装最新版本R包
if(!requireNamespace("BiocManager", quietly = TRUE))
install.packages("BiocManager")
BiocManager::install("Maaslin2")
或
install.packages("devtools")
library("devtools")
install_github("biobakery/Maaslin2")
准备数据
MaAsLin2 需要两个输入文件
- Data文件
- 制表符分割
- 样本为行,要素为列
- 或格式转换
- 文件中的feature包括taxonomy或gene
- Metadata文件
- 制表符分割
- 样本为行,要素为列
- 或格式转换
- metadata包括性别或年龄
数据文件可以包含未包含在元数据文件中的样本(以及相反的情况)。 对于这两种情况,两个文件中都未包含的那些样本将从分析中删除。 同样,在两个文件中,样本的顺序不必相同。
输出文件
MaAsLin2 有两种输出文件: 数据及图片
- 输出文件
-
all_results.tsv
- 返回的data
- q值由小到大排列的结果
- 第一列为metadata和feature的名称
- 接下来两列为模型中的值和系数
- 接下来一列为模型的标准误
-
N
列的为数据点的数目 N.not.zero为非0数据的数目
- pvalue为第二-最后一列
- qvalue为使用矫正方法之后的p值
significant_results.tsv:仅包括P<界值的关联
residuals.rds:每个feature的残差
-
fitted.rds
:每个feature的拟合值 -
ranef.rds
:该文件包含一个数据集,其中包含每个功能的提取随机效果(如果指定了随机效果)。 maaslin2.log:日志
-
- 输出图片
heatmap.pdf:有意义关联的热图
-
[a-z/0-9]+.pdf
- 将为每个重要关联生成一个图。
- 散点图用于连续的元数据。
- 箱形图用于分类数据。
- 绘制的数据点是经过归一化,过滤和变换后的。
例子
文件来源 https://ibdmdb.org/ .
HMP2_taxonomy.tsv
:是制表符分隔的文件,种类是列,样本是行。 它是分类文件的子集,因此仅包括所有样本的物种丰度。
HMP2_metadata.tsv
: 是制表符分隔的文件,其中样本作为行,元数据作为列。 它是元数据文件的子集,因此它仅包含一些字段。
命令行
$ Maaslin2.R --transform=AST --fixed_effects="diagnosis,dysbiosisnonIBD,dysbiosisUC,dysbiosisCD,antibiotics,age" --random_effects="site,subject" --normalization=NONE --standardize=FALSE inst/extdata/HMP2_taxonomy.tsv inst/extdata/HMP2_metadata.tsv demo_output
- 确保提供MaAsLin2可执行文件的完整路径(例./R/Maaslin2.R)
- 例子中:
-
HMP2_taxonomy.tsv
data路径 -
HMP2_metadata.tsv
metadata路径 -
demo_output
输出文件夹
-
R中
library(Maaslin2)
input_data <- system.file(
'extdata','HMP2_taxonomy.tsv', package="Maaslin2")
input_metadata <-system.file(
'extdata','HMP2_metadata.tsv', package="Maaslin2")
fit_data <- Maaslin2(
input_data, input_metadata, 'demo_output', transform = "AST",
fixed_effects = c('diagnosis', 'dysbiosisnonIBD','dysbiosisUC','dysbiosisCD', 'antibiotics', 'age'),
random_effects = c('site', 'subject'),
normalization = 'NONE',
standardize = FALSE)
输出文件:
all_results.tsv
significant_results.tsv
ref:
https://github.com/biobakery/Maaslin2
推荐阅读
-
熊谢刚:容联·云通讯在AI和5G的助推下实现了超越
-
Python实现具备单一目标、多目标、多尺度和自定义特征的KCF跟踪算法实例代码
-
使用opencv3和C++编程语言实现简单目标跟踪的Tracker
-
在线升级:OTA升级的原理和实现方式-操作方式
-
用Python实现2048小游戏(终端升级版)相比上篇 增添了撤回功能和历史最高分数的统计
-
Java 8新特性探究(十三)JavaFX 8新特性以及开发2048游戏-JavaFX历史## 跟java在服务器端和web端成绩相比,桌面一直是java的软肋,于是Sun公司在2008年推出JavaFX,弥补桌面软件的缺陷,请看下图JavaFX一路走过来的改进 从上图看出,一开始推出时候,开发者需使用一种名为JavaFX Script的静态的、声明式的编程语言来开发JavaFX应用程序。因为JavaFX Script将会被编译为Java bytecode,程序员可以使用Java代码代替。 JavaFX 2.0之后的版本摒弃了JavaFX Script语言,而作为一个Java API来使用。因此使用JavaFX平台实现的应用程序将直接通过标准Java代码来实现。 JavaFX 2.0 包含非常丰富的 UI 控件、图形和多媒体特性用于简化可视化应用的开发,WebView可直接在应用中嵌入网页;另外 2.0 版本允许使用 FXML 进行 UI 定义,这是一个脚本化基于 XML 的标识语言。 从JDK 7u6开始,JavaFx就与JDK捆绑在一起了,JavaFX团队称,下一个版本将是8.0,目前所有的工作都已经围绕8.0库进行。这是因为JavaFX将捆绑在Java 8中,因此该团队决定跳过几个版本号,迎头赶上Java 8。 ##JavaFx8的新特性 ## ###全新现代主题:Modena 新的Modena主题来替换原来的Caspian主题。不过在Application的start方法中,可以通过setUserAgentStylesheet(STYLESHEET_CASPIAN)来继续使用Caspian主题。 参考http://fxexperience.com/2013/03/modena-theme-update/ ###JavaFX 3D 在JavaFX8中提供了3D图像处理API,包括Shape3D (Box, Cylinder, MeshView, Sphere子类),SubScene, Material, PickResult, LightBase (AmbientLight 和PointLight子类),SceneAntialiasing等。Camera类也得到了更新。从JavaDoc中可以找到更多信息。 ###富文本 强化了富文本的支持 ###TreeTableView ###日期控件DatePicker 增加日期控件 ###用于 CSS 结构的公共 API
-
实现Linux磁盘挂载和自动开机挂载的方法
-
Python中的大顶堆和小顶堆:实现从小到大排序的大顶堆
-
关于用 Go 实现堆和堆操作,可能是最通俗易懂的讲解了
-
C++实现的大顶堆和小顶堆的堆排序算法