当前位置:首页 > 教育 > 正文

病毒基因组测序原理和 *** 病毒基因组

一 、简述下一代测序技术原理

简述下一代测序技术原理如下:

一代测序仪利用Sanger测序——双脱氧末端终止法的原理,将被荧光标记的ddNTP掺入到dNTP中 ,由于ddNTP随机掺入,PCR产物从引物之后的之一个碱基开始,

每一个位置都有可能是ddNTP。由于ddNTP缺乏链延伸所需要的3'-OH ,链的延伸就选择性地在G、A、T或C处终止 。这样的PCR产物与普通PCR不一样,不能形成一条电泳带,而是一组长度相差一个碱基的成百上千种片段。

1 、应用范围:

① De Novo测序

②重测序:如突变检测、SNPs、插入 、缺失、克隆产物验证、比较基因组

③分型:如微生物和真菌鉴定 、HLA分型 、病毒分型

④其它:如甲基化分析(重亚 *** 盐测序)和SAGE(基因表达串联分析) ***

2.临床应用

肿瘤突变基因的检测和肿瘤个体化治疗

病毒基因组测序原理和方法 病毒基因组

(图片来源于 *** 侵删)

二、DNA测序法

DNA测序(DNA sequencing ,或译DNA定序)是指分析特定DNA片段的碱基序列,也就是腺嘌呤(A)、胸腺嘧啶(T) 、胞嘧啶(C)与鸟嘌呤的(G)排列方式。RNA测序则通常将RNA提取后,反转录为DNA后使用DNA测序的 *** 进行测序 。目前应用最广泛的是由Frederick Sanger发明的Sanger双脱氧链终止法(Chain Termination Method)。新的测序 ***  ,例如454生物科学的 *** 和焦磷酸测序法。

Sanger测序法Sanger(桑格)双脱氧链终止法是Frederick Sanger于1975年发明的 。测序过程需要先做一个聚合酶连锁反应(PCR)。PCR过程中 ,双脱氧核糖核酸可能随机的被加入到正在合成中的DNA片段里。由于双脱氧核糖核酸多脱了一个氧原子,一旦它被加入到DNA链上,这个DNA链就不能继续增加长度 。最终的结果是获得所有可能获得的、不同长度的DNA片段 。目前最普遍更先进的 *** ,是将双脱氧核糖核酸进行不同荧光标记。将PCR反应获得的总DNA通过毛细管电泳分离,跑到最末端的DNA就可以在激光的作用下发出荧光。由于ddATP, ddGTP, ddCTP, ddTTP(4种双脱氧核糖核酸)荧光标记不同,计算机可以自动根据颜色判断该位置上碱基究竟是A ,T,G,C中的哪一个[2] 。

454生物科学和焦磷酸测序法454测序法由454生物科学发明 ,是一个类似焦磷酸测序法的新 *** 。2003年向GenBank提交了一个腺病毒全序列[3],使得他们的技术成为Sanger测序法后之一个被用来测生物基因组全序列的新 *** 。454使用类似于焦磷酸测序的 *** ,有着相当高的读取速度 ,大约为5小时可以测两千万碱基对[4] 。

三、基因组图谱——遗传图与物理图

遗传图是随染色体部分连锁的发现而发明的。

一条染色体上有许许多多的基因,减数分裂中同源染色体分离,一条染色体上的基因在理想状态上应一起分配给配子 ,然而事实并非如此。因为在减数分裂之一次分裂前期染色单体会发生断裂以及DNA片段的交换 ,从而发生染色体的部分连锁现象 。测序发明以前,基因连锁或部分连锁都是通过表型观察确定的。

对于部分连锁,人们早期通过表型发现不同基因间连锁发生的频率有差异。于是摩尔根的学生Arthur Sturtevant假设染色单体特定位点交换是一个随机事件 ,在一对并列的染色单体的任何位置发生交换的概率是相同的 。基于以上假设,相邻的两个基因由于交换而分开的概率将低于距离较远的两个基因(因为相邻基因即便交换也更偏向于一起)。进一步说,基因间因交换而失去连锁的概率与它们在染色体上的距离成比例。因此用重组频率(recombination frequency)可衡量两个基因间的距离 。通过计算不同基因对之间的重组频率 ,就能构建出显示基因在染色体上相对位置的图(遗传图) 。

遗传图的缺陷:遗传图的分辨率依赖于所得到的交换数目。对于人类及其他大多数高等真核生物来说,不可能获得巨大数量的后代由于遗传学研究。遗传图的准确率有限 。Sturtevant的假说认为交换在染色单体上随机发生,但由于重组热点的存在 ,使这一假说不完全正确。为获取更精确的基因组图谱,物理图的绘制 *** 被发明出来。其中最重要的为:限制性作图(restriction mapping) 、荧光原位杂交(fluorescent in situ hybridization, FISH)、序列标记位点(STS)作图(sequence tagged site mapping) 。

该 *** 的基本思想是比较一个DNA分子被两种识别不同靶序列的限制酶切割所产生的片段的大小,切割产物可用电泳检测(图1)。对于无法确定顺序的片段 ,可通过部分限制性酶切(partial restriction)的 *** 产生一套含有部分消化的产物,以此分析片段的可能排序。还有一种改进的 *** (图2),即在部分消化前将放射性或其他类型标记物加到要分析的DNA分子两端 ,于是在荧光指导下对可见酶切片段进行排序 ,简化了部分酶切的筛选流程 。

限制性作图的规模受限于限制性片段的大小。由于限制性位点在DNA序列中多而密集,使得消化产物在琼脂糖凝胶中重叠或发散。因此限制性作图最适用于小分子 。当然也可依靠某些“稀有酶 ”进行切割,获取较小数量的片段。如能特异性识别7个或8个核苷酸的 Sap I、 Sgf I。对于GC含量为50%的DNA分子 ,这些7核苷酸酶平均每4^7=16384bp有一个切点 。除“稀有酶”外,还有某些特异性序列对人类基因组而言存在较少,利用这类序列相对应的限制性内切酶进行切割 ,也能获得类似的结果 。

由于使用“稀有酶” *** 长序列片段,普通的电泳无法胜任对它们的分离工作,因为长片段容易缠绕 ,分子间作用更频繁。为此,必须使用更复杂的电场代替普通的线形电场。例如,正交变电场凝胶电泳(orthogonal field alternation gel electrophoresis, OFAGE)等 。

除电泳外 ,还可利用其它 *** 对DNA分子的限制性位点作图。可以通过直接在显微镜下观察检测限制性酶切位点,这一技术称为光学作图(optical mapping),常用的两种 *** 是凝胶拉伸(gel stretching)与分子梳理(molecular combing)(图3)。 *** 好的DNA纤维 ,利用荧光染料染色 ,再用限制性酶切割,通过荧光显微镜便可观察到切口的相对位置 。

与光学作图类似,FISH能够直接显示标记序列在染色体或伸展的DNA分子上的位置。在FISH中 ,标记物是一段DNA序列,通过用荧光探针与其杂交而显现出来。应用该 *** 时,需打开维持染色体DNA双螺旋结构的碱基配对 ,以使其形成单链分子(即DNA“变性 ”),只有这样才能形成杂交 。使染色体DNA变性而不破坏其形态的标准 *** 是将染色体在载玻片上干燥,再用甲酰胺处理。

如果探针是长的DNA片段 ,便可能存在一些重复的DNA序列(DNA序列中间隔存在的串联或非串联重复片段),因此探针可能与染色体上的多个位点杂交,而不仅仅发生在其精确匹配的特异性位点上。为降低这种非特异性杂交 ,探针在使用前要与来自被研究组织中的未标记DNA混合,于是加入富含重复序列的片段,来锁闭探针中的重复序列 。这样 ,便使得原位杂交反应完全由单一的序列驱动。

一次FISH实验仅能获得不超过3个或4个标记的图谱位点 ,数据积累慢,耗时长。因此,要使详细的物理图谱成为现实 ,需要更有效率的技术 。目前最有效的作图技术,也是能对大型基因组产生最详尽图谱的技术,是 STS作图 。一个序列标记位点(STS)是一段短的DNA序列 ,通常为100-500bp,易于识别,且在拟研究的染色体中仅出现一次。完成一套STS图谱需要收集来自单条染色体或一个完整染色体或基因组的重叠的DNA片段。

其基本原理如下图所示(图5) 。在收集作图必需的数据时 ,需排列每一个STS,了解哪些片段包含有哪些STS。这些可以通过杂交分析来完成,但通常会使用PCR的 ***  ,因为PCR更快捷。具体 *** 为将研究所用的DNA随机打断(需有6套一致的DNA片段供打断),然后依次采用单个STS检测它们所在的DNA片段,其中STS为人工合成并带有荧光标记 ,通过PCR在含有STS配对的片段上延伸 。若两个STS距离足够近 ,那么它们出现在同一片段的概率将较大,利用荧光显微镜可以在多条片段上观察到间隔一致的两个标记。反之,两个标记距离越远 ,位于同一片段的概率就越小。实际上,与连锁分析计算图距的方式类似,STS图距是根据分离频率计算的 ,而不是观测到的影像距离,因为距离相近的标志物利用信号的有无作频率判别的依据较距离观测更容易 、也更精确 。基于此,以STS为物理标志的物理图谱得以完成。

以上过程留有两个需要补充说明的问题。

之一关于 STS的选择 。任何一个唯一的DNA序列均可作为STS ,但需满足两个条件。首先,它的序列必须是已知的,以便用PCR *** 检测该STS在不同DNA片段中存在与否。其次 , STS必须在拟研究的染色体上有唯一的定位,如果是多拷贝,将无法准确获取各标志物间的物理距离 。

第二关于 STS作图的DNA片段 。其一来源是像前面所说的通过随机打断构建的文库。打断全DNA目前常用两种 *** :超声打断和酶打断。超声打断一般使用的仪器为Covaris系列 ,酶打断可用片段化酶 。这种随机打断的序列片段拥有重叠区 ,因而能组成克隆重叠群(clone contig),从而具备构建克隆文库的条件。只需将随机片段克隆到适当载体上,便制成了多个克隆文库的 *** (起初有几套DNA就有几个克隆文库)。反之若拥有目的DNA的克隆文库 ,与支持测序工作一样,它们也可用作STS分析 。第二种来源是放射杂交体(radiation hybrid),这是种含有其他生物体染色体片段的啮齿类动物细胞。这项技术首先发展于20世纪70年代 ,当时人们发现将人类细胞暴露于3000-8000拉德剂量的X射线中,会使染色体随机断裂成碎片,放射剂量越大 ,产生的片段越小。这种处理对人类细胞是致死的,但若将瘦果照射的细胞与未经照射的仓鼠细胞或其他啮齿类细胞融合后,染色体碎片可以传递给后者 。可利用化学试剂(如聚乙二醇)处理或暴露于仙台病毒中促进两种细胞融合。这种 *** 为STS作图提供所需的DNA片段 ,在人类基因组计划作图阶段发挥了重要作用。但实验对象似乎集中于动物 。

总言之,基因组图谱绘制的 *** 多种多样,可以说各种图谱所能反应的DNA信息各不相同 ,各有其独到之处。例如STS图谱最为精确 ,但仍可能未包括所有的限制性位点,且其定位的DNA片段没有针对性,而限制性图谱则能将有用的限制性位点进行精准标定 ,尽管其要实现大序列片段的标定较为困难。又荧光原位杂交所得图谱较STS作图更直观,也更具针对性,操作不算复杂 。与物理图谱相比 ,遗传图谱出现较早,精度与分辨率不高,但其绘图思想为STS作图提供思路 ,即凭借表型显隐性或信号的有无,计算频率,绘制图谱 。

基因组图谱绘制有什么用?这在上述技术发明的初期恐怕未能明了。但随DNA测序的提出 ,以及不再是遥不可及的概念时,人们意识到基因组图谱能为测序提供框架。这是因为高等真核生物全基因组往往存在大量的重复区域,简单的重叠区拼接会在这些区域发生错位 。因此事先绘制的图谱中 ,覆盖全基因组的各类标志物 ,无论是基因、限制性位点、STS位点等都能发现并对错误进行校正,基因组图谱能为后续基因组拼接与组装提供极大便捷。此外,将测序结果与基因组图谱结合 ,能将基因及其他有意义的特征定位于DNA序列中,以便后续开展限制性酶切 、功能分析、遗传诊断等各方面的研究。早期对不同序列位点的研究成果积累,以及测序技术发展后对不同类群模式物种及相关物种全基因组序列的获取 ,才得以掌握大量基因组、转录组的信息 。

既然基因组图谱能为所测序列的拼接组装提供参考,那么作图是测序的必要前提吗?关于这个问题,待更新至测序相关篇章时再做解答较合适。但就目前已知 ,小基因组的测序如细菌等,运用鸟枪法便能完整拼接,无需通过图谱校正。

[1] T. A.布朗.基因组3[M].之一版.北京:科学出版社, 2009.

[2]田雨.基于单拷贝序列的桑树染色体荧光原位杂交分析[D].西南大学, 2021. DOI:10.27684/d.cnki.gxndx.2021.002123.

最新文章