乍看起来,内含子和性别无共同之处,只不过是进化学上所注意到的一个分离“点”;但不清楚的是,为什么任何生物都具备性别和内含子。按照教科书的说法,内含子是促使外显子进行改组的古老的遗传组件,借此造就更多的新蛋白质。目前,有关基因的所谓“外显子”理论的传统观点,正在接受新理论的挑战。在1994年8月10~14日,由加拿大研究所召开的关于进化生物学的先进科研项目的年会上,研究形势已是很明确了。
外显子理论,有时也称之为“内含子早”假说,其关键有两点(达尔湖西大学,W. F. 杜利特尔):拼接体内含子先于细菌和真核生物的分叉;现代的基因结构,为此提供了一定证据。换个说法,就是被改组的外显子,各自可为蛋白质的一定“功能单位”编码。相反,“内含子晚”假说却主张,能够相对容易地得到内含子;内含子在基因中的位置,不必确定,因为它们总会出现在这里。按此理论,可以想象到,拼接体内含子,并不确定“功能单位”,如若确定的话,也只能是在开放读码内的随机位置上出现时,属于特殊情况。
因此,对外显子理论进行验证,就涉及到两方面的问题:一,是内含子将基因分裂为编码“功能单位”的顺序吗?二,内含子在跨越分类单位内的分配形式,是否符合古代起源?
支持外显子理论的主要一点,就是在磷酸、丙糖异构酶(TPI)中,外显子与蛋白质结构之间的实际关系,极不同于按内含子随机分布理论所预测的关系(哈佛大学,W. 吉尔伯特)。关于功能单位是什么的检验,结果并不明确;但是检查的四种特性,这类单位也许是具备的(例如,一种致密的模结构)。相关的检验结果还暗示出,在TPI内,可能存在着外显子/内含子的排列和蛋白质结构之间的一种相互关系(达尔湖西大学,A. 斯托茨弗斯)。在本次年会上,吉尔伯特和斯托茨弗斯一致认为,TPI的外显子,有为致密折叠肽编码的明显倾向。但斯托茨弗斯强调指出,TPI也许是一种特例,因为另外三种蛋白质并不能证实这一图式。
斯托茨弗斯和其同事,一直在为外显子/内含子结构和蛋白质局部解剖学的其他方面之间的关系寻找证据。蛋白质生物学早已清楚,蛋白质包含α-螺旋和折叠片。假如这些都是功能单位的话,那么,应该发现内含子处于为它们编码顺序的之间,而不应是在为其编码顺序之内;虽然在TPI内的内含子,显示出可测倾向的降低,位于二级结构组分之间或边沿处(斯托茨弗斯)。但在统计学上,这种倾向是无意义的;因为分析过的三个另外基因,并不存在内含子为典型二级结构划界的明显趋势。
所有这些证据,是否都和外显子理论相悖呢?当然,它淡化了内含子总是处于为α-螺旋和β-折叠片编码顺序之间的极端观点。另外,仍不明确,和非随机图式相符的基因数目,是否远多于按偶然情况所预测的基因数量呢?有三种可能(吉尔伯特):一,α-螺旋和β-折叠片,并不是某些内含子早模式所认为的功能单位;在我们不能很好掌握蛋白质发挥功能方式的有关知识时,关系功能单位是什么的问题,仍是难以捉摸。因此,吉尔伯特认为,斯托茨弗斯所完成的检验项目,是不成熟的。二,吉尔伯特表示,除非对所有推测的内含子位置都了解清楚,否则,由斯托茨弗斯所完成的检验,便能出现错导的结果。但据斯托茨弗斯报道;他所用的方法,能够再现一种信号,即使在大量数据不全的情况下,也无妨。三,检验假定,内含子能够丢失,或者是停留在基因内的同一位置上,但是,内含子也许是能够移动的,通过转位以外的其他方式,更换它们在基因内的位置。吉尔伯特重新考虑了有关证据,强调指出,情况的确如上所述。但斯托茨弗斯反驳说,假如限制移动的话,应仍能显示出干扰信号才对。然而,假设移动的距离足够长呢?内含子可能确实移动了相当的距离。即使我们知道了功能单位是什么,那么关于外显子理论中,是否由移动确定内含子位置的有关实验,必将产生的结果暗示;外显子理论是一种不可伪造的假说。
然而,吉尔伯特等人预测,在生物体TPI内的特定位置上,将会找到一个内含子,这一位置确定在双叶蛋白质结构中部。虽然我们不知道确切的功能单位,吉尔伯特认为,这种双叶结构不是一个(也许是多于2个)。因此,在适当位置上,应有一个内含子。
已在库蚊属的蚊子中,找到了这个内含子。但是,它在此出现的时间,是由于内含子早的需要,才和最早的原核生物同时呢?还是最近才移到此处的呢?力主“内含子晚”的学者,印第安那大学里的J. 帕尔默,讨论了V. 沃尔克和M. 蒂斯亨考(安大略省,皇后大学)所进行的尚未发表的工作结果,认为暗示了最近的一个祖先。沃尔克和蒂斯亨考业已发现,除了库蚊属和其近亲伊蚊属外,没有其他生物在吉尔伯特所指示的位置上含有一个内含子,即使在库蚊属/伊蚊属亚科以外的蚊子中,也不具有。帕尔默确信无疑,在除一族以外的所有生物中,种系发生图内都不具有的一个特点,用于解释在所有其他分类单位中都丢失了的假想,委实是过于简单化了。在所有原核细胞内,缺乏拼接体内含子,可以应用相同逻辑、稀罕内含子位置的发现,加上完全丢失者的成员,必定是后来所引发的。
虽然主张后来获得的观点,较曾丢失了的认识更简捷。但是,假定内含子是丢失了的话,应该发现在某一个种或一个属内,每个基因中的每个内含子,应处于相同位置上。所以“内含子早”理论,和有关内含子位置的唯一例子并不矛盾。以上分析过的模式,非但不能驳倒内含子早理论,反而恰恰说明这一理论并非过于简单。
由帕尔默本人和其同事J. 洛格斯登所完成的工作,也反对“内含子早”理论。两人都已确定,在全部真核生物中,编码DNA的每千个碱基内,所含拼接体内含子的平均数目,变化很大(在千碱基中,从一个不含到有6个内含子)。现在,他们已开始检测,由细胞器衍生的,并非普遍居于核中的基因中拼接体内含子的滴度。他们发现了在核内及由细胞器衍生的每千个编码DNA的碱基所含的平均内含子数,基因和在核起源祖先的同一生物中的平均基因三者间的一种很好的一致关系。
这一切,提供了关系内含子密度的有力证据。至少是核基因中的拼接体内含子,取决于包含它们生物体的一定特性。这与“内含子晚”假说相符,因为假定内含子能以适当的速率出现和运动。对于“内含子早”理论,这就成为问题了。要求在假设的线粒体和叶绿体的姐妹族中(α-紫细菌和蓝细菌),必须找到拼接体内含子。因为内含子早理论推想,在由线粒体和叶绿体所衍生的基因中,所包含的内含子的位置是古老的;蓝细菌和α-紫细菌都具有高滴度的内含子,只是后来又失去了它们。
比较性的新数据,也为解决不同的另外问题打下了基础。有机生物学的哪个方面,能够解释内含子密度的变化呢?至少有三种模式,试图解释这种变化。一,有利于增加复制速度的选择,降低内含子密度。二,内含子可对关系复杂发育对策的基因进行调节,因而它们的滴度,取决于发育的复杂性。三,性生殖可能为选择增加内含子密度提供条件,是两种原因的其中一种。但是,假如内含子是自私DNA的话,应能在一个群体内扩散,即使是缺失的;但只有在远系繁殖是充分有规律的情况下;另外,内含子可能是一种保卫成分,消除重组过程的不良影响。如果情况确如此的话,是否是因为交换导致了侧翼突变呢?一个基因中的重组,可能是缺失的;但一个内含子中的重组,却不可能缺失,另外,重组可趋向造成染色体的重排,如果它在不合逻辑的位点上出现时。在染色体中的同源顺序位点上出现的非同源位点,有受内含子分裂的倾向;以此阻上错误配对。
三种模式解释数据的不同,都可支持在原核细胞和细胞器内缺乏拼接体内含子的问题,以及在单细胞真核生物中的低密度问题。复制速度模式,必要单纯诱发以上都是γ-选择这一观点,性别/重组模式,需要强调一个事实,即它们主要是克隆的,或者关系到的,仅是偶然的性别;发育调节模式,需要指出的一点,就是相关基因组的发育调节是必要的。
通过对基因组的内外进行的比较分析,我们能够拨开迷雾,找出内含子和性别之间共有的内在联系,以及关于原核细胞缺乏拼接体内含子的假说是无道理的。从而可以想象到,祖先细菌曾经富含内含子。
[据Nature,1994年9月29日]