DNA测序的艺术


4 人类基因组 我们的DNA DNA测序的艺术

人类基因组计划(HGP)总是被拿来与登月计划作比较。它们两者都备受公众和媒体注目;都具有新奇性,冒险精神和学科间的高度合作,还有竞争性和争议性。它们各自的最终产品—人类基因组序列和人类的登月成功—都是科学技术发展的里程碑。

基因组测序概观

DNA测序,用于描述解读四个遗传字符(A、C、G、T)在DNA链上的排列次序的实验过程。基因组怎样测序?

  1. 选择物种
  2.  从细胞中分离DNA,获得大量高质量的样品
  3.  把经纯化的DNA随机切割成大小合适的重叠的片段
  4.  把DNA片段插入载体中,这就可以无限扩增(“克隆”)
  5.  测出每一DNA片段的碱基顺序
  6.  确定片段间的重叠,把序列组装成最终的基因组序列。

DNA测序的方法

  这里比较有难度。略过。~ 。(DNA测序列是由DNA测序仪完成的,序列由计算机来阅读)

DNA测序的艺术

自动化–快,更快,再快

测序技术的发展:作坊式的实验室每天只能测500个碱基。-> 测序自动化,第一台测序仪每天能测15000个碱基 -> 当代,每天能多达400 000个碱基。研究人员用了15个月就测完了基因组序列的90%。

现在的测序列当然远比这个数据要快得多。15分钟测完人类基因组序列的技术都即将要来了。测序的成本也是在不断的下降。

组装基因组的拼图游戏

基因组测序像是在做一个巨大的智力拼图。

  •  首先,先把基因组切成小片段;
  •  其次,将每个片段测序
  •  最后,按正确的顺序排列这些片段。

就像上面提到的,这些片段之所以能够重新拼起来是因为它们之间有部分重叠,一个片段就能和相邻片段正确拼接,这就好象每个拼图块的独特的边缘使整个拼图只有一种拼法。

从测序仪测出的500碱基对的片段拼接出一个3 200 000 000的碱基对的基因组是一个令人难以置信的飞跃,需要巨大的计算能力。

完成序列的公认标准是任何一个碱基的正确率是99.99%,就是说每10 000个碱基最多不能有超过一个的错误。为了达到这一目标,每一个碱基平均要被测序9次(也就是说,要有9倍的覆盖深度)。这一准确度是必需的。
2001年发表的人类基因组只是一个工作框架图,换句话说,还没有最终完成。工作草图中的每个碱基至少有4~5倍的覆盖率,具有99.9%的准确率。

序列解读–生物信息学

拼接后的基因组序列不过是一长串无意义的碱基排列,必须经过注释,才能真正具有价值。基因组的注释就是从基因组中找到特定的基因,基因编码的蛋白质及别的令人感兴趣的序列的信息。和测序本身相比,注释人类基因组是一项更艰难的任务。

研究人员借助于计算机的强大功能来详细查看这一大堆混乱的碱基序列。根据计算机揭示的基因模型或者别的特征模型来推断基因组是如何构建的。基于计算机从碱基排列顺序中提取生物学信息的方法已经成为一门正在快速发展的科学领域—生物信息学的一部分。

生物信息学跨越了生物学、计算机科学和数学的界限,涉及到对生物学数据的存储、分析和整合各个过程,从而来鉴定基因、确定基因结构以及预测基因的功能。分析DNA序列只是生物信息学的一部分,生物信息学还包括分析蛋白质结构,分析基因和蛋白质功能、临床前阶段和临床试验信息,以及研究不同物种的代谢途径。


13条回应:“DNA测序的艺术”

  1. 生物学发展太快,数年时间,原来需要十几年才能绘制的基因图现在15分钟就可以了。惊叹。
    我倒是很担心过度发达的生物学会带来不利的后果,比如记忆移植的滥用,会导致身份定位的混乱。

    其实我本也想主攻生物科技,未来的趋势嘛!但是现在没有了资金的支持,我不太敢选择,涉水这个行业需要太多的资金。
    除非,我能有什么突破呢?但是我不算是一个搞科研的好料子。