简单明了了解基因表达分析全流程图解!
基因表达分析
简介
基因表达分析是指直接或者间接测量样本内的全部或者部分基因的表达情况,一般是对转录产物mRNA进行测量。并且可以同时对不同基因和/或不同样本的RNA表达水平进行比较。这种分析可以帮助科学家识别造成表型差异的分子基础,并选择目标基因进行深入研究。基因表达的常用检测方法有:实时荧光定量PCR(qRT-PCR)、基因芯片(Microarray)、表达序列标签(Expressed Sequence Tag,EST)、基因表达系列分析(Serial Analysis of Gene Expression,SAGE)和转录组测序(RNA-seq)。目前高通量基因表达测量方法主要是基因芯片和转录组测序。通过生物信息学的手段对湿实验产生的数据进行基因表达差异分析,可以挖掘特定疾病表型的潜在生物标记物,并使进一步的生物标记验证成为可能。基因表达分析为正常生物体样本和疾病样本中差异表达基因以及生物标志物的鉴定及验证提供了宝贵见解,为后续的湿实验提供了数基础。
基因表达分析的意义
基因表达数据分析就是通过对基因表达矩阵的分析,回答一些生物学问题。分析思路有两大类:一类是时间序列分析,主要思想是根据基因多个时间点的表达值,通过聚类和主成分分析等分析手段寻找共同调控基因,进而研究其深层机制;第二类就是基因表达差异的显著性分析,对不同样本中的同一个基因进行表达差异分析,研究基因的差异表达对表型的影响。在基因表达分析中,基因表达差异的显著性分析是当前基因分析中的重中之重,其目的是比较两个条件或来源下的基因表达差异,通过统计学方法,找出与条件相关的特异性基因,然后进一步分析这些特异性基因的生物学意义。
基因表达数据分析流程
- 获取原始数据
- 数据预处理, 去除杂质数据
- 得到Clean Tag数据
- Tag表达量及分布分析
- 测序饱和度分析,进一步对测序质量进行评估
- 实验重复性分析
- 共有,特有,差异Tag分析
- 基因注释,标准化
- 基因表达量统计
- 反义转录分析
- 新转录本预测
- 筛选差异表达基因:包括表达量热图(Heat Map)以及火山图绘制。
- 表达模式聚类分析:包括不同类型的聚类分析方,如K-均值聚类分析(K-means Clustering Analysis)与层次聚类分析(Hierarchical Clustering Analysis)等。
- GO注释富集分析
- KEGG pathway 富集分析
- 蛋白互作网络分析
推荐阅读