基因具有强大威力,不过你最终想要获悉的是蛋白质,它们体现人体的各种功能。大多数基因是用于指导生产蛋白质的。
科学家在宣布完成人类基因组完整草图的测绘工作,并举杯庆贺之余,他们发现他们面临的任务才刚刚起步。破解人类基因组蓝图意味着弄清楚所有基因的功能;基因组测序只是朝着认识人类如何成长和发育以及如何患病的万里长征近出的第一步。英赛特基因组学公司主管科学的官员兰德尔· W ·斯科特指出:“基因具有强大威力,不过你最终想要获悉的是蛋白质,它们体现人体的各种功能。”
基因组测序只是长征第一步
目前至少有7家生物技术公司正在竞相开发新设施以求挖掘蛋白质组(proteome)——即全套人体蛋白质系列——以便找到罹患疾病的诸多线索,这些设备包括能够同时分类和测序数千种蛋白质的大功率仪器。素有基因巫师之称的克雷格 · 文特尔也表示正在追赶蛋白质组学(proteomics)这列时代列车,此前的人类基因组工程就是在他领导的塞莱拉基因组学信息技术公司的刺激和竞争下完成的。文特尔声称:“我们时下正在计划组建塞莱拉蛋白质组学设施,这是我们致力完成的一项主要任务。”
实力雄厚的科研中心和制药公司正在利用蛋白质组学知识查明一系列疾病特征标记,从乳腺癌到心脏病乃至早老痴呆症都在范围之中。美国癌症研究所和食品与药物管理局正在联合资助一项耗资数百万美元的名为“组织蛋白质组学首期计划”,以求查明蛋白质与早期结肠癌、乳腺癌和其他癌症的联系。与此同时,拜耳、默克和辉瑞这些大型制药公司正开始在蛋白质组学工程上进行合作,以期完成其他研究项目。
大多数基因用于指导产生蛋白质,即活细胞的前体。为了认识疾病,医生需要查清这些蛋白质的活动和功能。因此研究基因组的基因组学将让位给一项更具挑战性的研究蛋白质的蛋白质组学。同样,人类基因组工程不久也将被人类蛋白质组工程所取代,它将使科学家可以解释许多基本生物学问题。
细胞许多重要功能是通过一系列复杂的蛋白质相互作用完成的,这种作用呈现持续不断的连锁反应。神经递质从一个脑细胞传递到另一个脑细胞时产生的诸多变化就是这种反应过程的一个例子。对这些过程的认识可用于研制更好治疗癌症和糖尿病药物;还有助于查明患者最有可能遭受的副作用。
即使采用了新的基因组学技术,从实验室开发出一种药品,再经过动物和人体测试评估药效,然后获准上市销售,必需花费10~15年时间。蛋白质组学可协助研究人员在药物开发的早期阶段查明更完全更有效的备选药物,有望使开发时间缩短几年。盐湖城Myriad基因组学生物技术公司功能基因组学研究部副主任A ·奥利弗恩特预言:“从目前的发展趋势看,新兴的蛋白质组学工程的作用将超过基因组学工程,我们将荣幸地看到成果。”
蛋白质:结构高度复杂的怪物
人们渴望认识蛋白质组本质的愿望由来已久。早在1980年科学家就提出过一项称为人类蛋白质标记的探索计划,美国国会曾经审慎考虑拨款资助。不过在该计划付诸实施前,政府官员们却转向赞助人类基因组工程了。那时占压倒多数的人认为,首先搞清楚DNA的实质更加容易些,我们不必耗费时光被蛋白质捉弄。
DNA与蛋白质相比构造相对简单。DNA分子是一架狭长的螺旋扶梯即由4个基本化学键组成的著名双螺旋体;而另一方面蛋白质往往是结构高度复杂的怪物,它们经常折叠成为错综庞杂又无法预测的形状。蛋白质是由20种氨基酸构成的,每种氨基酸都具有各自独特的化学性质,这本身就使蛋白质测序工作成为一项艰难的任务。此外细胞使用的一整套蛋白质始终处于不断变化之中,一些蛋白质呈现分解状态,它们的成份在几分钟后就会循环重组,另一些则可以在细胞内存活几个小时甚至几天。蛋白质表面也不断被修整——一种糖分子可以添加到某种蛋白质表面,一种磷酸盐分子也可以附着到另一种蛋白质表面。这些添加物可以激活或抑制蛋白质活动。科学家估计,人体基因组中10万个基因可以产生多达100万种不同的蛋白质。
人类基因组工程的完成将加速蛋白质组学研究的进程。澳大利亚悉尼市一家名为PSL的蛋白质组学公司主管官员凯斯 · 威廉姆斯评论说:“没有基因组学作为基础,进行蛋白质组学研究就太艰难了。”不过即便掌握了重要的遗传信息资料,研究人员仍然需要研制出足够强大功率和敏感的仪器,才能探明极微量蛋白质——细小到仅10亿分之一克重量——的特性。那是因为许多最重要的蛋白质只出现于游离的大量蛋白质中。90年代中期,埃尔默生物系统公司研制的功率强大的基因测序仪器,后来被塞莱拉公司所用,保证了10万个基因测序任务的提前完成。
现在要想阐明潜在的100万种蛋白质,蛋白质组学甚至需要威力更加强大的技术。眼下这样的仪器正在源源不断地涌现。英国剑桥大学的Glycosciences公司以及马里兰州罗克维尔市的大规模生物学公司等已合作研制出精密度高、性能可靠的方法,来利用微缩的果冻状聚合物试纸,从血浆或尿样所含的数千种蛋白质中分离出单个蛋白质。这些公司甚至还找到了迅速而准确地测序20种不同构造氨基酸的方法。
蛋白质组学的巨大医学价值
尽管现行的分离和测序仪器尚未达到研究人员期望的高速度和自动化程度,但是它们不断提供的有关新的蛋白质的信息已使公司计算机系统应接不暇。这些累积的资料对于渴望寻觅新药物靶标的制药公司具有极大诱惑力。蛋白质组系统生物技术公司现已和Dow农业科学技术公司合作以期为农作物所制造的各种蛋白质进行编目和分类。
给蛋白质编目分类只是利用蛋白质组学力量的一种方式。许多制药公司确实想要认识正常细胞出现病变时蛋白质的相应变化。辉瑞制药公司现已和牛津大学Gycosciences蛋白质组学研究分部联手,利用蛋白质组学信息资料揭示并确定早老性痴呆症不同阶段症状的各种生物标记。往常的做法需要从轻度,中度和严重早老痴呆症患者体内抽取脊髓作数百次样品分析并与健康人脊髓样品进行比较才能确诊。
然而,假如医生能够利用蛋白质组学信息发现一整套独特的蛋白质,将早期的早老性痴呆症和晚期的甚至完全无病征的区分开来,那么他们就拥有一种精确和客观的诊断方法了。例如拥有A和B型蛋白质的患者只会患轻度记忆失聪的早老痴呆,而拥有X和Z型蛋白质的患者则会诱发严重早老痴呆,以致需要特殊治疗。
研究人员认为,癌症是蛋白质组学有望产生重大效益的又一领域。1998年美国食品与药物管理局资深高级研究人员伊曼纽尔· F ·佩特里科恩和美国癌症研究所兰斯· A ·莱昂特博士主持了一项计划,旨在确认与早期发作的卵巢癌、前列腺癌和其他癌症有特殊联系的蛋白质标记。人们希望这些早期标记会导致更有效的诊断测试方法问世。如今已经发现的新的蛋白质标记有近30种,有的已经广泛应用于最常见的前列腺癌PSA测试中。
蛋白质组学还将为医学研究人员提供有关新开发的药物和现行药物的潜在副作用的信息。佩特里科恩指出:“眼下一个最主要的难题是许多药物由于无法预测将出现的毒害作用而在临床测试的最后阶段纷纷被淘汰。”他确信蛋白质组学可以让制药公司在投资数亿美元向市场推出新药前消除潜在的威胁生命的化合物。他认为使人体组织蛋白质中产生最微小变化的药物才有可能是最安全的。
有待克服的技术障碍
由于要大规模地协调力量来分离和测定细胞或人体组织中所有蛋白质的物理特性极为困难,所以诸多生物技术公司现已选取一种较为简捷的方法。比如他们正在提取与胰岛素水平有关的特殊的新蛋白质组,然后确定这些蛋白质的功能。Myriad公司的科学家与一家制药公司合作,已提取到10种已知涉及一种特殊疾病的蛋白质,并且利用它们又发现了200种另外的蛋白质,其中一种蛋白质有望成为一种药物靶标。他们认为,“用上述研究方法确定一种新药物靶标,速度惊人。”
然而,揭示潜藏蛋白质组中的奥秘虽然已经创造了良好的开端,但仍有许多障碍有待克服。帮助建立GeneBio蛋白质组学公司的瑞士化学家丹尼斯· F ·霍赫斯特勒瑟告诫说:“蛋白质组的分析是如此困难,以致有如大海捞针那样,目前尚无一项成熟技术足以胜任。
因此破解蛋白质编码程序将需要多年时间和多项创新技术才能完成。”此外还需要有很大的计算能力和贮存能力。塞莱拉公司主管文特尔指出:“如果你愿意观看我们将建立在基因组之上的复杂的蛋白质信息网络,该网络将以10亿兆字节的信息量贮存资料。”蛋白质组学目前还处于研究的初期阶段,不过一个新的后基因组学时代已经初露端倪了。
[Business Week,2000年4月10日]