在过去短短的几十年内,古DNA研究从科学好奇心转变成了重塑过去生物现象的强有力的工具。继提炼、除杂和测序等一系列方法革新后,科学家们不断挑战自我,对一些更古老的DNA测序技术进行研究,开启了地球生命史的前所未有的探索。
古老的DNA:图为在西班牙阿塔波卡遗址胡瑟裂谷中发现的40多万年前的古人类头骨。在同一遗址还挖掘出一根人类大腿骨,预估也有40多万年的历史,科学家从这根大腿骨上测出了一个完整的线粒体基因组
透过实验室窗户朝里望去,两位穿着严实的研究人员正有条不紊地做着实验。其中一位叫李虹洁(音译)的研究助理,负责把内含几十年DNA的溶液用移液管放入离心管内,另一位叫姚露(音译)的博士生负责数据录入的工作。整个实验室配有密封的门窗和性能良好的通风装置,最大程度避免了外部空气及所携带的DNA入侵。
该实验室是专门研究古DNA的,它位于伊利诺伊大学香槟分校卡尔·沃斯基因组生物学研究所的一个地下室里。在分子人类学家里潘·马尔西(Ripan Malhi)的指导下,姚的研究对象是博物馆内几百年历史的东南亚长尾猴(食蟹猴)标本,即通过这些长尾猴的DNA来解答一些诸如种系发生、生态地理学、岛屿矮态等问题。李则是专攻加州原住民古DNA的研究。
在短短的几十年里,古DNA研究已经从好奇心转变成重塑过去生物现象的强有力的工具。马尔西回忆起2001年他做博士生研究时,曾花了一年时间对40个美洲原住民样本进行遗传分析(对线粒体DNA长度300碱基对的碎片进行研究),最后形成一篇论文。“现在我手下任何一个学生,只需花一个月的时间就能完成这些任务,这不是很奇妙吗?”
为了节省提取、测序古老DNA的时间,科学家们研发了从古老样品中提取可测序碎片的新技术,继而描绘出进化、迁移和系谱等一系列基因蓝图。就拿2014年来说,他们成功地测序出40多万年前古人类的完整线粒体基因组;测序出4万多年前尼安德特人遗骸中的外显子组,和从4.5万年前的现代人类化石中测序出近乎完整的核基因组。
在2013年,由哥本哈根大学的科学家领导的一个国际团队发表了一个古马的完整基因组序列,该马曾出现在70多万年前中更新世时期北美洲的冻土地区,这个发现是迄今所测绘的最古老的基因组序列。
瑞典乌普萨拉大学从事古DNA研究的种族遗传学家马蒂亚斯·雅各布松(Mattias Jakobsson)认为,这些研究结果能帮助他更好地了解人类进化的历史。他说:“过去的两到三年是很精彩的,我们有了这么多的发现。今后,随着个体研究的实验越来越多,必定会发现更多更古老的序列。”
古DNA的“拓荒者”
始于1997年的西班牙胡瑟裂谷挖掘工作,迄今已挖出5 500多根中更新世时期的古人类遗骨
古DNA研究最早起源于1984年,在当时还没有聚合酶链反应技术(PCR)时,伯克利加州大学的科学家成功地从博物馆内的140多年历史的斑驴(一种已经灭绝的斑马近亲)标本上,克隆测序出两个线粒体DNA碎片。这项成果表明,遗传物质可以在死去多年的动物身上收集。
随后不久,中国和德国科学家相继发表的相似的古DNA研究,似乎给基因遗传学家们打了一剂兴奋剂,大家开始竞相测序更古老的DNA。1985年,乌普萨拉大学的博士生斯万提·皮耶博(Svante Paabo,后在马普进化人类学研究所工作)在《自然》发表了一篇论文称,他克隆出了2 400年前的埃及木乃伊小孩的核基因。当几年后PCR出现时,皮耶博发现他克隆出的DNA里带有部分的现代人类DNA(可能是考古学家或博物馆人员搬运时遗留的)。
打那以后,一些其他声称是古DNA的研究被证明是错的。例如,一个自称从2 000万年前木兰叶上提取的叶绿体古DNA,经PCR测试后,这个古DNA只不过是叶片发生感染后的细菌,包括从8 000万年前恐龙骨片提取的线粒体DNA,不过是现代人类祖先的DNA。哥本哈根大学古DNA研究人员多维克·奥兰多(Ludovic Orlando)说:“在90年代中期,很多人意识到自己的结果是错的。”
然而,这些古DNA研究的“拓荒者”们的这些不足并非全无是处,至少DNA被污染的问题让他们在挖掘、分类和测序时更加小心。或者结合近年来在提炼、除杂和测序标本等新方法,发展一些诸如提取遗传物质碎片及区分古代和现代DNA的方法,那么古DNA研究将迎来它的鼎盛时期。
不断创新的技术
研究古基因的法则之一是:标本越老,DNA序列越不完整。一旦有机体死亡后,外源性和内源性核酸酶就开始降解其组织和遗传物质。事实上,DNA的半衰期平均为521年,也就意味着,从化石标本中采集到的DNA大多数源于其外部,这也难怪古DNA研究会出错。
第一个研究古DNA的方法――克隆技术――出现在上世纪80年代,即通过酶来修复受损的DNA,但其缺点会引入外部物质致使序列发生错误。自PCR出现后,尽管不需克隆就可对DNA样本进行测序,但其弊端是,传统的PCR要放大长度至少90碱基对的碎片,而那么长的碎片很难在几千年高度降解的样本中找到。因此,PCR放大的很可能是一个被污染的现代DNA而不是标本中的DNA。而且,PCR一次只能放大一小段DNA,要测序出一幅完整的基因组图谱是非常耗时的。
2000年以后出现的新一代基因测序技术,即借助数据库辅助对DNA进行测序,研究人员可以解读样本中所有的DNA分子,而不仅仅是特定区域的测序。马普进化人类学研究所从事古DNA研究的马蒂亚斯·迈耶(Matthias Meyer)说:“运用这项技术,你可以不断地往数据库中添加新的遗传信息,对于同一标本,你得到的是数千甚至上万的信息量,可以在更大范围内验证测序数据的真实性。”
随后不久,一项针对碎片化DNA,即能捕捉到含有核苷酸极短序列的测序技术问世。哥本哈根大学的遗传学家埃斯克·威勒斯莱夫(Eske Willerslev)说:“这项技术可以测序长度30或35碱基对的基因碎片。借助这些新技术,研究人员可以对古DNA进行更精确地测序。”
在进行DNA测序前,首先要进行除杂处理。因为在古化石标本中,DNA往往藏身于有机、无机分子和胶原蛋白及一种叫羟磷灰石的钙矿物质中。要想提取可测序的遗传物质,必须去除这些物质。在实验室中,迈耶采用缓冲液提取法解决了这一问题――用乙二胺四乙酸溶解羟磷灰石、蛋白酶K溶解胶原蛋白。与此同时,迈耶不断地优化缓冲液,分别添加了异丙醇和盐酸胍,前者有助于捕捉非常短小的DNA碎片,后者在离心管内部特殊的二氧化硅过滤区溶解DNA。
2012年,迈耶带领的团队在《科学》上发表了一个高质量的基因组序列――在长度仅有35碱基对的DNA碎片进行整合、拼接后完成的。该序列是从西伯利亚的丹尼索亚人(一种灭绝的尼安德特人近亲)的指骨上提取的。据测算,这根指骨大概有3万-8万年的历史,但它只是手指的一截,未能从中发现足够的碳丰度,其真实年份仍存有争议。
在测序中,采用双链DNA数据库辅助测序是一种普遍的方式。而迈耶团队研发了一种单链DNA数据库测序方法,即把双螺旋结构拆分后的单链DNA输入数据库。这种方法不仅能成倍测序基因碎片,还能免除除杂这一步骤(在除杂过程中很可能会丢失部分遗传物质)。迈耶说:“在完成第一个高质量的DNA测序后,我们在获取更多数据的同时,还发现很多非常短的序列。如果采用双链方式测序的话,注定会遗漏部分物质。”
古DNA的作用
如今,DNA测序技术已经可以对极小的基因碎片进行测序,但仍不能排除样本上存有除有机物以外的基因序列。为了最大限度降低DNA受污染的风险,尤其是现代DNA数量要远多于古DNA的数量,为此,研究人员根据降解后的DNA分子会变形这一特点,即通过分子模式的辨别来区分现代和古代的DNA。
几年前,迈耶团队在分析从胡瑟裂谷中挖掘出的40万年前的熊骨过程中,掌握了拼接短DNA碎片的方法(这根熊骨95%的DNA碎片长度不超过50碱基对),成功地测出了DNA序列。之后,采用单链DNA数据库对丹尼索亚人化石进行了测序。有了这些铺垫,迈耶团队又对另一块40万年前的古人类大腿骨进行测序,最终成功测序出其线粒体基因组序列。
伯克利加州大学的计算生物学家拉斯马斯·尼尔森(Rasmus Nielsen)说:“通过古DNA了解过去是非常令人振奋的,我们总能从中发现很多惊喜。”
比如,在研究欧洲古人类DNA过程中,最大的惊喜是发现了乳糖酶的痕迹。在欧洲出现的乳糖酶和成年人摄入乳糖酶的基因多态性有着紧密的关系(在非洲部分地区,作为趋同进化的例子,形成了相同的基因多态性)。在古代,人类和现今所有的哺乳动物一样,只有婴儿在母乳喂养时才会产生乳糖酶,而成人一般是乳糖不耐受的,但在进化的某一特定时期,欧洲人的13910*T等位基因突然出现,可能授予了欧洲人乳糖酶的延续性。
根据单核苷酸多态性和微卫星变量对欧洲人基因的影响分析,研究人员曾推测13910*T等位基因是在10 000-7 000年前出现的。但在2011年,匈牙利研究人员在对23组古人类遗骨DNA测序后显示,他们是生活在10世纪和11世纪的欧洲平民和亚洲入侵者,前者只有少量的13910*T印记,后者则完全没有。这说明当时人类身上的等位基因数是很低的。
2014年,另一个欧洲小组的测序报告称,他们对公元前5700年-公元前800年间的古人类遗骨测序后,没有发现乳糖酶等位基因。这或许表明,13910*T大规模出现的时间应该在4 000-3 000年之前。
奥兰多说:“古DNA测序结果会纠正很多我们之前的错误。”去年,威勒斯莱夫团队对一个1.2万年前的印第安人小男孩测序,显示该小男孩以前居住在克洛维斯(现在的蒙大拿州),包括现今大约80%的土著人都是这个小男孩家族的后代,还确定了第一批到达北美洲的是东北亚地区的人,而不是大家认为的欧洲人。还有一些其他古DNA的测序分析,修正了原先对于欧洲、北极和澳大利亚居住地的一些假设。
回顾人类的进化史,古DNA研究在揭开人类祖先神秘面纱的过程中功不可没。迈耶团队测序丹尼索亚人基因序列所用的那根指骨,在2010年首次被用来生成以前从未描述过的古人类基因序列的草图。奥兰多说:“通过测序,我们发现了一些被人类学家忽视了数百年的新的人种。这些技术真的会带给我们很多意想不到的惊喜。”
未来发展的趋势
多年来,随着测序方法的不断改进,极大地促进了古DNA研究的发展。威勒斯莱夫说,如今,类似纳米孔测序法第三代技术已经运用到古DNA的研究中,研究人员可以进行更深入的探索。在过去的基础上,威勒斯莱夫团队结合纳米孔及单分子测序法形成的新的测序技术,测序出70万年前的马的DNA,这也是迄今所测出的最古老的基因序列。
与此同时,研究人员开始运用在测序中的新发现来拓展他们的研究范围,不仅仅只是基因测序。2012年,威勒斯莱夫的实验室发表了一项对4.3万年前猛犸象化石蛋白质的分析报告――该蛋白质比遗传物质的时间更久远。去年,威勒斯莱夫和奥兰多对4 000年前的古爱斯基摩人的头发DNA进行了研究,发表了一项基因范围内的核小体图谱和胞嘧啶甲基化水平的调查报告,开始向古实验胚胎学领域进军。同样在去年,马普进化人类学研究所的皮耶博团队发表了第一个尼安德特人和丹尼索亚人的DNA甲基化完整图谱。威勒斯莱夫说:“这是我们首次研究实验胚胎学和表观基因组学在进化中的作用。”
我们究竟能追溯到多久以前的生物历史?大部分研究人员认为最多不会超过1 000万年前。迈耶说:“我敢打赌,100万年前是一个极限”。有部分研究人员认为,除杂和测序上若有更进一步的创新,就能追溯到更久远的年代。马尔西说:“在适当的环境条件下,如果测序出比100万年更久远的DNA序列,我丝毫不会惊讶。”威勒斯莱夫对此表示认同,并预测研究人员最终可测序出200万年前的DNA序列。
资料来源The Scientist
责任编辑 则 鸣
古DNA测序技术有望进入犯罪实验室
有很多方法能降解和碎化DNA,而数千年被困在骨骸中的DNA只是其中的一种。针对犯罪现场遗留的生物液体或组织中的遗传物质也会降解这一特点,一些法医学专家呼吁把最新的古基因测序技术应用到犯罪实验室以协助破案。伊利诺伊大学的分子人类学家里潘·马尔西(Ripan Malhi)说:“运用古DNA技术协助破案是正确的,因为我们处理的都是同类型组织,包括面临相同的困难――DNA信息不仅少,同时还受到污染和破坏。”
Parabon纳米实验室和Identitas两家公司目前正在为犯罪调查提供现代基因测序技术,即利用微阵列基因分型技术确定的数十万个单核苷酸多态性(SNPs),内含眼球、头发颜色和雀斑等各种表型特征,帮助解决一些无头公案和人口失踪案件。Parabon生物信息学主任艾伦·格雷塔克(Ellen Greytak)说:“这套系统是从DNA中生成新的信息,我们就好似是目击者,告诉调查人员那人长什么模样。”
虽然目前犯罪实验室还很少运用这种技术,但它注定会代替现有的法医标准基因测序法。标准的法医基因测序法是以基因指纹作为确定嫌疑人的短串联重复序列或和DNA样本进行比对,而SNPs可以提取更短DNA碎片。伊利诺伊大学的人类学家克里斯·休斯(Cris Hughes)说:“我希望在法医学领域看到更多新技术的应用。”
由于全世界的法医已经汇编了一个含有十几万人的短串联重复序列的STR数据库,加之其成本较低,短期内新的基因测序技术进入犯罪实验室比较困难。Identitas总裁劳伦斯·鲁宾(Laurence Rubin)说,Identitas最近在执法部门演示含有SNPs的微阵列基因分型技术。这项技术在大范围被接受前,我们还需要做很多优化工作。”
在2013年,Identitas研发的一个可以预测人的眼球和头发颜色及父母系谱的专有芯片,在3 000个DNA样本中的正确率为48%~94%。因此,这项技术还有改进的空间。