GEO(基因表达总库):高通量基因表达数据库
最编程
2024-06-14 09:51:08
...
Gene Expression Omnibus(GEO)是一个公共存储库,可以存档和*分发由科学界提交的全套微阵列,新一代测序和其他形式的高通量功能基因组数据。 除数据存储外,还提供一系列基于Web的界面和应用程序,以帮助用户查询和下载存储在GEO中的研究和基因表达模式。
GEO的数据储存方式
GEO数据库具体存放四类数据:GSE、GDS、GSM、和GPL。
一个GSE号(GSExxx)对应的是整个研究项目的系列的数据,可能涉及不同平台;
一个GDS号(GDSxxx)对应的一个同一平台的数据集, 这些包括从微阵列和高通量序列技术生成的数据,例如:
-
- 通过微阵列或新一代测序进行基因表达谱分析(参见示例)通过微阵列或新一代测序进行的非编码RNA分析(参见示例)
- 通过微阵列或下一代测序进行染色质免疫沉淀(ChIP)分析(参见示例)
- 通过微阵列或新一代测序进行基因组甲基化分析(参见示例)
- 高通量RT-PCR(参见示例)
- 通过数组进行基因组变异分析(arrayCGH)(参见示例)
- SNP阵列(参见示例)(参见人类主题常见问题解答)
- 基因表达系列分析(SAGE)(参见示例)
- 蛋白质阵列(参见示例)
一个GSM号(GSMxxx)对应单一样品的数据信息,它只能是单一平台的数据,往往,GSE 和GDS中会包含多个GSM数据;
一个GPL号(GPLxxx)则对应一个平台的信息,一般不接触的。
另外,GEO Profiles数据库是GEO工作人员根据用户提交的数据整理后的数据,倾向于某个基因在不同数据集中的表单情况。
GEO的数据检索与下载
GEO数据库支持关键字检索和布尔逻辑,和使用pubmed非常相似,一般我们都是在GEO DataSets数据库中检索。例如检索乳腺癌,如下所示:
1. 搜索乳腺癌“BreastCancer”,即可获得所有乳腺癌的芯片数据。
上一篇:
【无标题】