欢迎您访问 最编程 本站为您分享编程语言代码,编程技术文章!
您现在的位置是: 首页

GEO(基因表达总库):高通量基因表达数据库

最编程 2024-06-14 09:51:08
...

Gene Expression Omnibus(GEO)是一个公共存储库,可以存档和*分发由科学界提交的全套微阵列,新一代测序和其他形式的高通量功能基因组数据。 除数据存储外,还提供一系列基于Web的界面和应用程序,以帮助用户查询和下载存储在GEO中的研究和基因表达模式。

GEO的数据储存方式

GEO数据库具体存放四类数据:GSE、GDS、GSM、和GPL。

一个GSE号(GSExxx)对应的是整个研究项目的系列的数据,可能涉及不同平台;

一个GDS号(GDSxxx)对应的一个同一平台的数据集, 这些包括从微阵列和高通量序列技术生成的数据,例如:

    • 通过微阵列或新一代测序进行基因表达谱分析(参见示例)通过微阵列或新一代测序进行的非编码RNA分析(参见示例
    • 通过微阵列或下一代测序进行染色质免疫沉淀(ChIP)分析(参见示例
    • 通过微阵列或新一代测序进行基因组甲基化分析(参见示例
    • 高通量RT-PCR(参见示例
    • 通过数组进行基因组变异分析(arrayCGH)(参见示例
    • SNP阵列(参见示例)(参见人类主题常见问题解答
    • 基因表达系列分析(SAGE)(参见示例
    • 蛋白质阵列(参见示例

一个GSM号(GSMxxx)对应单一样品的数据信息,它只能是单一平台的数据,往往,GSE 和GDS中会包含多个GSM数据;

一个GPL号(GPLxxx)则对应一个平台的信息,一般不接触的。

另外,GEO Profiles数据库是GEO工作人员根据用户提交的数据整理后的数据,倾向于某个基因在不同数据集中的表单情况。

GEO的数据检索与下载

GEO数据库支持关键字检索和布尔逻辑,和使用pubmed非常相似,一般我们都是在GEO DataSets数据库中检索。例如检索乳腺癌,如下所示:

1. 搜索乳腺癌“BreastCancer”,即可获得所有乳腺癌的芯片数据。

上一篇: 【无标题】

下一篇: 如何快速下载 GEO 数据并获取其表达矩阵和临床信息 | 完整代码 + 注释