欢迎您访问 最编程 本站为您分享编程语言代码,编程技术文章!
您现在的位置是: 首页

计算 19 个等位基因突变的突变等位基因肿瘤异质性(MATH)得分

最编程 2024-03-13 22:17:03
...

R基础:生信分析的R语言基础教程都在这里了,包括语法,绘图和数据分析。

生物信息数据分析教程视频——01-TCGA数据库RNAseq数据下载与整理

生物信息数据分析教程视频——02-TCGA数据库miRNA数据下载与整理

生物信息数据分析教程视频——03-有关TCGA数据库临床数据的问题

生物信息数据分析教程视频——04-TCGA数据库中SNV和CNV数据的下载

生物信息数据分析教程视频——05-TCGA数据库中甲基化数据的下载和整理

生物信息数据分析教程视频——06-GEO数据库中芯片数据的下载和整理

生物信息数据分析教程视频——07-TCGA数据库:基因的表达探索

生物信息数据分析教程视频——08-TCGA+GTEx数据库的数据整理

生物信息数据分析教程视频——09-TCGA+GTEx数据库联合表达分析

生物信息数据分析教程视频——10-TCGA数据库:miRNA的表达探索

生物信息数据分析教程视频——11-筛选相关性基因

生物信息数据分析教程视频——12-基因之间的相关性分析及可视化

生物信息数据分析教程视频——13-3种R包(DESeq2、edgeR和limma)进行RNAseq的差异表达分析与比较

生物信息数据分析教程视频——14-芯片数据的表达差异分析

生物信息数据分析教程视频——15-clusterProfiler包+ClueGO做富集分析

生物信息数据分析教程视频——16-单样本基因集富集分析(ssGSEA)用于肿瘤相关免疫细胞浸润水平评估

生物信息数据分析教程视频——17-多种算法评估肿瘤免疫细胞浸润水平

18-肿瘤突变负荷(TMB)的计算

# setwd("G:/MedBioInfoCloud/analysis/TCGA/new/conventionalAnalysis")
options(stringsAsFactors = F)
library(TCGAbiolinks)
library(dplyr)
library(maftools)
FilePath <- dir("G:/MedBioInfoCloud/analysis/TCGA/new/processedTCGAdata/TCGA-SNV/",
                "SNV.Rdata$",full.names = T)

###TCGA数据库中33中癌症类型
project <- getGDCprojects()$project_id
project <- project[grep("TCGA-",project)]


opt <- "output/011-MATH/"
ifelse(dir.exists(opt),FALSE,dir.create(opt,recursive = T))

for(proj in project){
  message("===============================")
  message(proj)
  load(FilePath[grep(proj,FilePath)])#STARdata
  maf <- read.maf(snv,isTCGA=TRUE)
  #mutant-allele tumor heterogeneity
  barcode <- unique(maf@data$Tumor_Sample_Barcode)
  
  MATH <- data.frame()
  for (i in barcode){
    out.math = inferHeterogeneity(maf = maf, tsb = i)
    Tumor_Sample_Barcode <- unique(out.math$clusterData$Tumor_Sample_Barcode)
    m = unique(out.math$clusterData$MATH)
    out = data.frame(Tumor_Sample_Barcode, m)
    MATH = rbind(MATH, out)
  }
  save(MATH,file = paste0(opt,proj,"-MATH.Rdata"))
  
}

参考:

生物信息数据分析教程视频——04-TCGA数据库中SNV和CNV数据的下载

肿瘤突变负荷(TMB)与等位基因突变的肿瘤异质性(MATH)分数的计算