当人类基因组计划向着在2000年3月前完成人类基因组30亿个碱基的一份草图的目标迈进时,三个测序小组正在到达一个不同的、也许更加有意义的里程碑:第一条人类染色体的完成图谱。在最近两周内,国际22号染色体测序协作组将宣布他们完成这项任务的好消息。与此同时,其他染色体的测序工作也将顺利地在2003年完成其测序的预定目标。

参与协作的科学家分别来自:英国剑桥的桑格中心;美国诺曼州俄克拉何马大学;日本东京的庆应大学医学院。科学家们说他们的合作堪称国际学术合作的典范,“许多人为之拋洒了血汗和泪水。”

尽管作为国际人类基因组计划的一部分,22号染色体协作组仍然比其他小组领先,因为它不受国际人类基因组计划组织去年优先集中完成一份粗略草图的决定的影响。早在人类基因组测序工作开始之前,22号染色体就已经开始了大量作图工作和一些测序工作。现在领导桑格中心的22号染色体研究小组的杨登海,早在90年代初在伦敦男科医院工作时就已经开始利用22号染色体来建立测序工具和技术。在1995年该小组搬到桑格中心时完成了该染色体的一幅(物理)图。

大约在同一时期,庆应大学一个由伊藤幕布奇领导的小组完成了在那时最大的人类连续克隆系,即一幅描述一些较小重叠克隆的连接文库的相对次序的图谱。该连续克隆系覆盖22号染色体上一个包括免疫球蛋白基因簇的1.02兆碱基对的区域,与人类免疫应答有关。在1995年下半年,伊藤建立了一个测序小组对该区域和另一个与猫眼综合征有关——可以导致先天性心脏缺陷和智力发育不良的区域进行测序。当俄克拉何马实验室布鲁斯 · 罗(Bruce Roe)的一个研究生斯蒂芬妮 · 乔叟(Stephanie Chissoe)完成了对—个与白血病有关、包括Bcr基因的152千碱基对长的DNA区域的测序后,该实验室也进入了对22号染色体的测序工作。

杨登海说,从那些不显眼的开始起,22号染色体协作组得到了进化,最后三方决定进行整个染色体的工作。布鲁斯 • 罗回忆道:“我们建立了合作并按照我们拥有的不同试剂划分工作区域。”该小组也包括协助作图和提供克隆、试剂和其它测序材料的欧洲、北美和日本的其他实验室。

测序工作实际上只包括了染色体的下臂即q区。它长约32兆碱基,包括了该号染色体的几乎所有基因。上臂即P区被搁置,因为它似乎不编码蛋白质。该协作组还跳过了q区的尾部——端粒和分离两条臂的染色体腰部即中心粒。这两个区域几乎不包含基因,很难以测序。

测序工作中的最后一段最为困难。伊藤说:“我们本来决定在99年春天就差不多完成,但是后来又花了6个月才真正完成。”由于不可完全理解的原因,研究者进行DNA测序所赖以进行的细菌克隆不能保留特定的人类序列。这就导致如果要找到能覆盖一个特定缺口的克隆就必须在克隆文库中进行劳力劳心的查寻。

22号染色体协作组的经验已经帮助人类基因组计划的领导者们决定以“完成”的理念来完成其他人类染色体的研究。本月初,在剑桥举行的一次国际人类基因组计划会议上,合作者们对于研究条件达成了一致意见。其中三个主要的标准是:染色体的95%以上必须得到测序;剩余缺口的数目、定位和大小必须查明;单独的缺口必须短于大约15万碱基。

杨登海说标准不可能“是永恒的”,但是22号染色体协作组在序列数据完成并且在数据库中公开时就已经很好地满足了这些标准了,余下要做的是“仔细审核”并且保证整个序列得到了正确标记,然后将它寄存在一个公共数据库中。这样的过程完成就标志着其它染色体工作的开启。伊藤说:“作图和测序已经教会了我们许多关于基因组的知识。下一步工作将是阐明它们的生物学意义。而这项工作刚刚开始。”

[Science,1999年9月24日]