1993年度诺贝尔生理学和医学奖日前授予一位美国人和一位英国人,以表彰他们在1977年各自独立发现基因并非人们所想象的那样纵贯整个DNA,而是分裂成一个个的片断,这样的存在方式才会使进化更加快速地进行;连接各个片断的,是基因延伸的长链,它们没有实际意义的表达功能。这一发现,当时使科学家们都感到惊讶。

从那以后,研究人员陆续发现,细胞在剪下这种也叫做“废话片断”的无意义部分而把有意义的基因部分拼接在一起时出现差错,人类就会发生某些疾病,包括肌肉萎缩症和一种白血病。

由瑞典卡罗林斯卡研究院诺贝尔奖评议会提名的本年度“生理学和医学”奖获得者,一位是菲利普 · A?夏普(Phillip A. Sharp),49岁,生于肯塔基福尔莫斯,现任麻省理工学院生物系主任;另一位是理查德 · J · 罗伯茨(Richard J · Roberts),50岁,生于英格兰德比,现为美国马萨诸塞州贝弗利市新英格兰生物实验室的研究指导。他们俩将分享本次82.5万美元的奖金。

夏普在麻省理工学院从事其获奖成果研究的时候,罗伯茨也在长岛“冷泉港实验室”进行类似的研究。夏普说:“我们各自都意识到,别人也在这同一领域进行研究,但没有想到,我们会异途同归。”

自那发现以后,罗伯茨开辟了DNA研究的另一个领域,夏普则继续领导一个大型实验室研究细胞处理其基因中无意义部分的分子机制。他俩的实验室都长期获得国立卫生研究院的资助,20多年来总计约3800万美元

法国生物化学家皮埃尔 · 钦本(Pierre Chambon)的研究对此发现起过一份作用,他认为,DNA中“废话片断”的发现“可能是分子生物学上最没有被人所预想到的事情。”

这项获奖研究的出发点,是50年代确立的一种基本认识,即所有的基因都是链状的长分子,链环就是基因字母表上的“字母”,一个字母代表一种特定的叫做氨基酸的亚分子。正如在书面英语中那样,基因的意义也是由串在一起的字母顺序所决定的。细胞通过阅读基因顺序并遵循它的指令制造出成千上万各种各样的蛋白质,用以建筑其自身结构或进行新陈代谢作用。蛋白质也是像基因一样的链状分子,只是较小些。直到1977年,分子生物学家们还以为,每种基因都是一系列简单的与蛋白质亚单位(氨基酸)顺序相对应的基因字母,并且像英文句子中的字母顺序一样,所有的基因字母都具有意义。

然而,洛克菲勒大学的詹姆斯 · 达尼尔(James Darnell)却注意到一种奇怪的现象:那种由DNA基因所转录并被细胞用来引导蛋白质合成的信使 RNA,其长度大约是它翻译蛋白质所需使用长度的5倍。夏普说:“正是达尼尔对‘长RNA’的描述引起了我们的好奇心,这种RNA确实太大了,其中一定还有什么东西占据了空间。”

夏普和罗伯茨发现,这种RNA以及它的转录样板DNA都被一些叽里咕噜的废话中断得稀里哗啦,简直就是结结巴巴的句子。他们还发现,在细胞遵循信使 RNA所编码的指令之前,一种特殊的分子装置能发觉这些啰啰嗦嗦毫无意义的片断并把它们剪去,然后把有意义的部分拼接在一起。

这种特殊装置,现在叫做连接酶,具有一种剪辑功能。要是连接酶真能阅读上述那样的句子,它也会注意到,有些“词”并不是真正的词,从而把它们划掉并使句子靠紧。科学家把那些废话片断称为“介入顺序”或“基因内区”,而把有意义的片断叫做“基因外区”,这是因为有意义片断的含意能在生产特定蛋白质时得到“表达”。

夏普的实验室一直在进行这些机制的研究。他说,已经发现,DNA和RNA顺序中的某些密码有助于连接酶认识该在什么部位剪,又该在什么地方接。“但是我们还不知道其全部的机制”。“我们只了解一些简单的拼接规律,并没有完全搞清楚连接酶是如何认识其剪接位置的又是怎样找到这些正确部位的。”

这些新颖的发现使许多科学家对这一奥秘产生了兴趣。他们的研究表明,在比细菌更高级的生物体中,99%以上的基因都具有废话片断,比较典型的情况是,每个基因含有8至10个。还有,基因内区比基因外区要长得多,平均每个基因只有20%的长度可表达意义,其余部分都是些毫无意义的废话。

为什么细胞都要制造这么多的废话片断,弄得如此麻烦?其原因通常解释为:这样一种体系会使进化产生有用的新蛋白质更容易些。而蛋白质的变化能使拥有这些蛋白质的机体发生形态和功能的改变。

科学家们已经认识到,许多蛋白质就像拼图积木或者说更像变形金刚一样具有某些模式,它们都有许多不同的部分,每部分都有其本身可发挥的作用。各部分能够以不同的结合方式组织在一起,其作品也就具有不同的形态和不同的功能。例如,某种特定的蛋白质分子中有一个部件,它能将该蛋白质固定在细胞膜上,并使其一半在膜内,一半在膜外。膜外部分有一个部件能与由血流而来的某种激素结合。膜内部分也有一个部件能在膜外部分抓住某个激素分子时将另一个分子释放。一个部件由一个基因外区所指定。

那些通过改变基因而使进化得以发生的突变,常常导致基因的随意破裂,同时也引起破裂断片的随意重组。由于无意义片断非常长,所以破裂总是发生在基因内区,而不是发生在指定蛋白质某一部件的基因顺序中。当破裂的断片重新装配时,就极有可能产生一个具有多种完整功能部件的基因。如果这一新的组合证明对机体有价值,那么它就会被很好地保存下来,并且被机体遗传给其下一代。

对许多基因的详细研究表明,它们常常具有指定多种蛋白质部件的功能。例如,一个胆固醇感受器由18个部件所构成,那么就由18个基因外区所编码,但其中有些基因外区还能为一些根本不相同的蛋白质编码,这些蛋白质中,有一种是能促使皮肤生长的激素;另几种则是能引起血液凝固的蛋白质。

在其他基因中经过演化而逐渐形成的部件也都具有这种共同使用的性质。假如没有这样的可能性,新蛋白质的形成则要经历更加缓慢的过程,这个过程所发生的基因突变偶尔可用原先的基因来作些修补工作,但通常是白费劲。那么,能够取代这一过程的,只有进化。正如夏普和罗伯茨的发现所揭示的那样,只有进化,才能使确实具有功能意义的基因部件发挥如此作用。

尽管这一基因体系具有许多优点,但裂开的基因可能还是个疑难问题。与营养障碍相关的基因有65个基因内区,多种肌肉萎缩症都是由肌细胞在这个基因的“编辑”中发生的差错所引起。通常,当最终形成的分子中有一个或多个部件的失落,就会引起严重或相当严重的疾病。

[The Washington Post,1993年10月12日]