Hi-C 技术简介和分析
一、技术原理
Hi-C是染色质区域捕获(Chromosome conformation capture)与高通量测序(High-throughput sequencing)相结合而产生的一种新技术。
以整个细胞核为研究对象,利用高通量测序技术,结合生物信息分析方法,研究全基因组范围内整个染色质DNA在空间位置上的关系,获得高分辨率的染色质调控元件相互作用图谱。
通过甲醛处理将DNA与蛋白质交联在一起从而固定DNA的构象,并进行酶切、生物素引入、酶连和提取,然后对处理好的核酸进行文库构建和高通量测序,最终通过对测序数据进行分析即可揭示染色体片段间的交互信息。
该技术仅利用单个个体就可以将基因组序列定位到染色体,从而进行染色体水平的研究。Hi-C可以与RNA-Seq、ChIP-Seq等数据进行联合分析,从基因调控网络和表观遗传网络来阐述生物体性状形成的相关机制。
强术语版:
Hi-C技术主要将空间结构临近的DNA片段进行交联,并将交联的DNA片段富集,然后进行高通量测序,对测序数据进行分析即可揭示全基因组范围内的染色体片段间的交互作用。利用Hi-C技术可以揭示基因组的一般结构特征,包括从隔室(动物中A/B Compartments,植物中为CSD/LSD)到拓扑相关结构域domain(动物中TAD,植物中TAD-like),最后再到环(loop)的染色质的这种层级结构。
染色体的三维(3D)结构深刻影响DNA复制,转录及DNA损伤修复。最近研究揭示了人基因组中存在数百万的潜在的顺式调控元件,其中大量位于基因间区和远离其靶基因的启动子区。这些主要由增强子组成的远端调控元件,在生物发育过程中通过基因组中形成的Loop结构影响目标基因的转录,从而实现对目标基因的调控.另外通过结合BS-seq、ChIP-seq和RNA-seq数据分析发现揭示染色体空间结构与基因组表观遗传修饰和转录活性关系,共同来阐释核基因组的包装模式。
二、技术优势
1. 通过Scaffold间的交互频率大小,可以对已组装的基因组序列进行纠错(基因组更准确)。
2. 基因信息不再仅仅是contig片段,而是被划分至染色体上,成为染色体水平。
3. 无需辛苦的构建群体,单一一个体就能实现染色体定位。
4. 相比遗传图谱,标记密度更大,序列定位更完整(能把更多的contig挂至染色体上!信息更全面!)
5. 染色体重排等结构变异研究可以开展啦~(研究可以更深入!)
6. QTL、GWAS可以定位区间到某个染色体啦~(追踪变异!)
7. 该物种的三维基因结构、染色体互作及动态变化可以解析啦~(从基因到表观!全方位解析)
8.周期短。
总结:快(周期短)、准(准确性高)、省(单个体)
三、应用:
1.染色体跨度的单倍型图谱构建
为疾病风险预测提供思路
为肿瘤形成机制提供依据
为农业动植物经济性状连锁标记及基因组进化奠定基础
2.探索基因组的3D结构
有助于了解基因组折叠对基因表达的影响
有助于了解基因组三维结构对细胞发育,分化及细胞命运的决定
3.开发调控基因的DNA元件
揭示基因组远程调控元件介导的分子网络
通过分析调控元件空间互作热点,开发潜在的药物作用靶点
4.Hi-C辅助基因组组装
辅助动植物基因组组装
宏基因组组装及菌群精确分类
4.1 辅助组装应用
1)PacBio+Hi-C
利用了PacBio三代分子测序和北京百迈客生物技术有限公司的Hi-C技术绘制了三个高质量棉花基因图谱(题目:Genome sequence ofGossypium herbaceumand genome updates ofGossypium arboreumandGossypium hirsutumprovide insights into cotton A-genome evolution 期刊:Nature genetics )
2)SMRT+Hi-C
利用单分子实时测序SMRT和北京百迈客生物技术有限公司的Hi-C技术组装了一个高质量、染色体体水平的珙桐基因组,研究发现苞片中光合作用相关基因几乎缺失或表达减少,而抗菌、抗冷、抗水等抗逆相关基因在苞片中高度表达,突出了苞片在保护花和吸引授粉者中的重要作用。(题目:Genomic analyses of a “living fossil”: The endangered dove-tree 期刊:Molecular Ecology Resources )
3)Illumina+PacBio组装+Hi-C技术将95.15%的序列挂载
该研究利用Illumina+PacBio组装了1.12Gb油桐基因组,并通过北京百迈客生物技术有限公司的Hi-C技术将95.15%的序列挂载到11条染色体上。基于比较基因组等系列相关研究解析了油桐基因组进化和桐油生物合成的分子机制。(题目:Tung Tree (Vernicia fordii) Genome Provides A Resource for Understanding Genome Evolution and Improved Oil Production 期刊:Genomics Proteomics & Bioinformatics )
4)Nanopore测序+Hi-C染色体构象捕获技术
构建了高质量的枇杷基因组。(题目:Chromosome-level genome assembly and annotation of the loquat (Eriobotrya japonica) genome 期刊:Gigascience)
四、Hi-C分析常用工具
数据标准化:
1. HiCNorm
http://www.people.fas.harvard.edu/~junliu/HiCNorm/
2. ICE
https://mirnylab.bitbucket.io/hiclib/index.html
3. HiC-Pro
https://github.com/nservant/HiC-Pro
TAD鉴定
1.HiCseg:Models the uncertainty in Hi‐C data
https://cran.r-project.org/web/packages/HiCseg/index.html
2. TADbit
https://github.com/3DGenomes/TADbit
3.DomainCaller
http://chromosome.sdsc.edu/mouse/hi-c/download.html
4. InsulationScore:Robust to different sequencing depth;
can detect dynamics of TAD boundaries
https://github.com/dekkerlab/crane-nature-2015
5. Arrowhead:High computational efficiency with
dynamic programming
https://github.com/theaidenlab/juicer/wiki/Download
6. TADtree
compbio.cs.brown.edu/projects/tadtree/
7. Armatus:TAD calling robust in different resolutions
https://github.com/kingsfordgroup/armatus
8. Topdom
http://zhoulab.usc.edu/TopDom/
交互片段鉴定(interaction)
1. Fit-Hi-C:Accurate background model using
non-parametric spline
http://noble.gs.washington.edu/proj/fit-hi-c
2. GOTHiC :Models contact-frequency uncertainty
as binomial distribution
http://bioconductor.org/packages/release/bioc/html/GOTHiC.html
3. HOMER
homer.ucsd.edu/homer/download.html
4. HIPPIE
wanglab.pcbi.upenn.edu/hippie
5. diffHic
https://bioconductor.org/packages/release/bioc/html/diffHic.html
6.HiCCUPS:Designed for high-resolution Hi‐C data
https://github.com/theaidenlab/juicer/wiki/Download
3D构象:
1. 3D-GNOME
https://bitbucket.org/3dome/3dome_mmc
2.Tadbit
https://github.com/3DGenomes/tadbit
可视化:
HiCPlotter
https://github.com/kcakdemir/HiCPlotter
----------------------------------------------------------------------------------------------------------------------------------I am a line!-----------------------------------------------------------------------------------------
参考:
https://m.sohu.com/a/166900273_761120
https://zhuanlan.zhihu.com/p/140795830
https://m.antpedia.com/news/2385859.html
下一篇: 统一常见面试问题(二)
推荐阅读
-
说明 css3:核心技术和案例分析2.8 结构伪类选择器
-
设备指纹识别技术简介和概述 (II)
-
生成人工智能体:交互式模拟人类行为 论文和源代码 架构分析(2) - 架构分析 - 核心理念与环境建设和技术选择 - 4.
-
分布式存储技术(上):HDFS 和 Ceph 架构原理、特点和优缺点分析
-
IPv6 转换:反向代理技术的原理和利弊分析
-
I.数据包分析技术和网络基础知识
-
Hi-C 技术简介和分析
-
分析 dToF 和 iToF 成像技术
-
纯干货分享 | 研发效能提升——敏捷需求篇-而敏捷需求是提升效能的方式中不可或缺的模块之一。 云智慧的敏捷教练——Iris Xu近期在公司做了一场分享,主题为「敏捷需求挖掘和组织方法,交付更高业务价值的产品」。Iris具有丰富的团队敏捷转型实施经验,完成了企业多个团队从传统模式到敏捷转型的落地和实施,积淀了很多的经验。 这次分享主要包含以下2个部分: 第一部分是用户影响地图 第二部分是事件驱动的业务分析Event driven business analysis(以下简称EDBA) 用户影响地图,是一种从业务目标到产品需求映射的需求挖掘和组织的方法。 在软件开发过程中可能会遇到一些问题,比如大家使用不同的业务语言、技术语言,造成角色间的沟通阻碍,还会导致一些问题,比如需求误解、需求传递错误等;这会直接导致产品的功能需求和要实现的业务目标不是映射关系。 但在交付期间,研发人员必须要将这些需求实现交付,他们实则并不清楚这些功能需求产生的原因是什么、要解决客户的哪些痛点。研发人员往往只是拿到了解决方案,需要把它实现,但没有和业务侧一起去思考解决方案是否正确,能否真正的帮助客户解决问题。而用户影响地图通常是能够连接业务目标和产品功能的一种手段。 我们在每次迭代里加入的假设,也就是功能需求。首先把它先实现,再逐步去验证我们每一个小目标是否已经实现,再看下一个目标要是什么。那影响地图就是在这个过程中帮我们不断地去梳理目标和功能之间的关系。 我们在软件开发中可能存在的一些问题 针对这些问题,我们如何避免?先简单介绍做敏捷转型的常规思路: 先做团队级的敏捷,首先把产品、开发、测试人员,还有一些更后端的人员比如交互运维的同学放在一起,组成一个特训团队做交付。这个团队要包含交付过程中所涉及的所有角色。 接着业务敏捷要打通整个业务环节和研发侧的一个交付。上图中可以看到在敏捷中需求是分层管理的,第一层是业务需求,在这个层级是以用户目标和业务目标作为输入进行规划,同时需要去考虑客户的诉求。业务人员通过获取到的业务需求,进一步的和团队一起将其分解为产品需求。所以业务需求其实是我们真正去发布和运营的单元,它可以被独立发布到我们的生产环境上。我们的产品需求其实就是产品的具体功能,它是我们集成和测试的对象,也就是我们最终去部署到系统上的一个基本单元。产品需求再到了我们的开发团队,映射到迭代计划会上要把它分解为相应的技术任务,包括我们平时所说的比如一些前端的开发、后端的开发、测试都是相应的技术任务。所以业务敏捷要达到的目标是需要去持续顺畅高质量的交付业务价值。 将这几个点串起来,形成金字塔结构。最上层我们会把业务目标放在整个金字塔的塔尖。这个业务目标是通过用户的目标以及北极星指标确立的。确认业务目标后再去梳理相应的业务流程,最后生产。另外产品需求包含了操作流程和业务规则,具需求交付时间、工程时间以及我们的一些质量标准的要求。 谈到用户影响的地图,在敏捷江湖上其实有一个传说,大家都有一个说法叫做敏捷需求的“任督二脉”。用户影响地图其实就是任脉,在黑客马拉松上用过的用户故事地图其实叫督脉。所以说用户影响地图是在用户故事地图之前,先帮我们去梳理出我们要做哪些东西。当我们真正识别出我们要实现的业务活动之后,用户故事地图才去梳理我们整个的业务工作流,以及每个工作流节点下所要包含的具体功能和用户故事。所以说用户影响地图需要解决的问题,我们包括以下这些: 首先是范围蔓延,我们在整张地图上,功能和对应的业务目标是要去有一个映射的。这就避免了一些在我们比如有很多干系人参与的会议上,那大家都有不同想法些立场,会提出很多需求(正确以及错误的需求)。这个时候我们会依据目标去看这些需求是否真的是会影响我们的目标。 这里提到的错误需求,比如是利益相关的人提出的、客户认为产品应该有的、某个产品经理需求分析师认为可以有的....但是这些功能在用户影响地图中匹配不到对应目标的话,就需要降低优先级或弃掉。另外,通常我们去制定解决方案的时候,会考虑较完美的实现,导致解决方案括很多的功能。这个时候关键目标至关重要,会帮助我们梳理筛选、确定优先级。 看一下用户影响到地图概貌 总共分为一个三层的结构: 第一层why,你的业务目标哪个是最重要的,为什么?涉及到的角色有哪些? 第二层how ,怎样产生影响?影响用户角色什么样的行为? (不需要去列出所有的影响,基于业务目标) 第三层what,最关键的是在梳理需求时不需一次把所有细节想全,这通常团队中经常遇到的问题。 我们用这个例子来看一下 这是一个客服中心的影响地图,业务目标是 3个月内不增加客服人数的前提下能支持1.5倍的用户数。此业务目标设定是符合 smart 原则的,specific非常的具体,miserable 是可以衡量的,action reoriented是面向活动的, real list 也是很实际的。 量化的目标会指引我们接下来的行动,梳理一个业务目标,尽量去量化,比如 :我们通过打造一条什么样的流水线,能够提高整个部署的效率,时间是原来的 1/2 。这样才是一个能量化的有意义的目标。 回到这幅图, how 层级识别出来的内容,客服角色:想要对它施加的影响,把客户引导到论坛上,帮助客户更容易的跟踪问题,更快速的去定位问题。初级用户:方论坛上找到问题。高级用户:在论坛上回答问题。通过我们这些用户角色,进行活动,完成在不增加客户客服人数的前提下支持更多的用户数量。 最后一个层级,才是我们日常接触比较多的真正的功能的特性和需求,比如引导到客户到论坛上,其实这个产品就需要有一个常见问题的论坛的链接。这个层次需要我们团队进一步地在交付,在每个迭代之前做进一步的梳理,细化成相应的用户故事。 这个是云智慧团队中,自己做的影响地图的范例,可以看下整个的层级结构。序号表示优先级。 那我们用户影响地图可以总结为:
-
切削技术 首页 基本知识 钻孔和铣削 钻孔和铣削切削载荷分析-I。铣削