注意一下您的日历,人类基因组将在2005年9月30日前得以绘制和测定顺序。这一时间距沃森、克里克揭示DNA双螺旋结构,从而革命性地推动人类基因的研究恰为半个世纪之多。作为这样一个庞大工程主要设计者的沃森(这一计划——即人类基因组测定,得到了美国国立卫生研究院的资助)一个月前在美国圣迭戈宣布了上述工程完成期限。

这一期限的宣布可能对那些担心该项工程会掠走大批财富的人带来某种宽慰。该计划的组织者查尔斯 · 坎托(Charles Cantor)洛沦茨伯利实验室人类基因组中心负责人,美国能源部研究计划负责人)希望此一日期的宣布能给人们带来某种信心,即这项计划的执行木会给其他生物学研究课题的经费造成大的影响。Science杂志主编丹尼尔 · 科斯兰(Daniel Koshland)认为,这一工程执行的费用无疑将占国家用于生命科学研究费用的大头。他争辩道,人类基因组顺序的测定不同于其他大工程——如超导超级对撞机,它将对其他分支学科(Little Science)带来众多的裨益。

坎托认为,在未来年里,科学家们将完成近一半的基因组绘制和基因组的测序任务;在10年内将完成全部基因组图谱的绘制及10%顺序的测定工作;15年内将完成全部顺序的测定。加州理工学院的李 · 胡德(Lee Hood)认为,头5年应是整个计划的重点时期,要能绘制出模拟生物体图谱,并测定人类基因组中关键部位的顺序(他领导的小组正试图在3年内完成T细胞受体的基因顺序测定工作)。大规模的基因绘制技术将随着较小的人染色体顺序的测定在未来的2 ~ 3年内开发,并在其后的5年内得到完善。

国会可能在1990年给基因图绘制者们9千万美元的资助。这笔款项的绝大部分将用于新方法的开发、模拟系统和资料的搜集上。耗资额为2.76千万美元的DOE部分将主要用字DNA绘制和测定;其中三分之二的款项将用于研究机构的房舍建造。90年度预算额为1亿美元(很可能被削为6000万美元)的美国国立卫生研究院(NIH)现已把主要精力放在花费昂贵的基因图谱绘制和训练大批完成这一工程所需的技术人员上,美国国家科学基金会和农业部也将为此拨出一小笔款。关于费用问题,沃森的看法是,即使这一计划不复存在,今日的生物学研究也将需要大量投资。我们正在从事的是迄今为止最令人惊讶的科学事业。他认为,问题是要让整个社会理解这一工程的意义。“目前确实存在财政危机,这有可能使我们的计划难以为继”,沃森认为,尽管目前国家有很大的财政赤字,教育、安置无家可归者等都要用钱,但我们还得为自己呼吁,“既然已经决定什么事是应该做的,我希望,基因组工程的实施和解决无家可归者的居住问题能并行不悖地进行”。

当然,美国正动员国际社会其他成员一起参与其事,尽管它要花费最多的费用。让我们看看其他国家的情况:英国虽有第一流的科学家但阮囊羞涩,3年的科研经费仅为1.7千万美元;日本庆应大学医学院的Nobuyoshi shimizu向美国同行透露了日本参与该计划的投资额,但他们准备出的钱(1990年)也只在几百万美元上下;亦不乏杰出的科学家,但这方面的知识很缺乏的苏联正在就今年2.5千万卢布(外加5百万美元)如何用于该国一系列工程项目作认真的讨论。坎托认为,苏联人此举是极不明智的。他说他和沃森都劝苏联人将有限的资金集中用于2 ~ 3个大工程项目上。欧共体已经拨出3.4千万美元的费用用于未来3-4年内这方面的研究,这笔款项将由欧共体各成员国分担。这方面研究的内容之一是测定枯草杆菌的基因顺序,这可能是第一个顺序得到完全测定的高等生物体,估计有25家实验室参与其事。欧共体面临的主要问题是如何协调其成员国的活动(欧共体现有18个成员,50家资助者)。

圣迭戈会议的主旨是讨论新的进展和新的实验方法,以使这项大工程得以有效的实施。同时,新技术的采用也可能降低成本。但这并不意味着美国作为主事者最终的花费少于原先估计的15年耗资30亿美元的数字。该工程的组织者们认为,美国承诺的这30亿美元费用可能会作大幅度削减。如果该工程的实施均按现有的技术、方法进行,那么总的费用可能高达3千亿美元,这笔天文数字任何国家都不可能承受。

人类基因组图谱的绘制及测序将为一系列分子生物学复杂现象的理解带来全新的可能,对其他生物体基因结构的研究无疑会深化人类对自身结构的认识。一旦我们完成了这一工作(在2005年的某一天),我们就能洞悉众多生物体的基因结构,除了现已为人们熟知的大肠杆菌外,酵母及各种啮齿类动物的基因结构;许多种植物,特别是可食用类植物的基因结构都将一览无遗。现有的灵长类动物的基因图谱也将得到绘制,甚至我们还可知悉4万年前已灭迹的人类亲戚——尼安德塔人的基因结构。

NIH的经费主要用于模拟生物体。沃森期望在10年内先完成细菌、酵母和小鼠的基因图谱的绘制,这样到那时就可得到大量人类基因组结构的参照信息。沃森说,NIH今年起实施这一计划的8百万美元将集中用于特定生物体的研究。但沃森随即补充说,这并不意味着排斥其他课目的研究,细菌基因组结构的测定以家庭手工业方式处理就足够了,沃森力促生物学家们致力于研究各种生物体模拟系统,并向NIH通报各自工作的进展。

看来,浩如烟海的基因结构测序数据所引发的问题之大甚至可能超出这一研究本身。困难之一是资料方面的,包括分类研究、硬件、储存及分析所有的测序数据的软件(举个例子,位于Los Alamos的数据库据说已落后于数据登录1年)。“仅仅计算机数据库的建立、健全就可能耗用最终经费的20%。”坎托说。是否仅一个大数据库就足敷用尚有待证明,坎托期望有多种数据库可供选择,因为眼下究竟哪一种更为需要尚不清楚。他认为,各种数据库间应有良好的联系通道,以防止数据的散失。同时有相同兴趣的研究组之间要能很方便地交流,这样可及时纠正不可避免的误差。

一些科学家并不甘于坐等新技术的问世,圣迭戈加利福尼亚大学的拉塞尔 · 多利特(Russell Doolittle)证实他的小组已经发明了一种用于麦金托什计算机(Mac Intoch Computer)译解基因顺序的方法。他认为,现有的计算机数据库已经足够使用,现有的计算机也已绰绰有余。

[The AAAS Observer,1989年11月3日]