叶绿体,同线粒体一样,也有自己的与核DNA不同的DNA,有自己的DNA复制、DNA转录成RNA和信使RNA(mRNA)转译成蛋甶质的系统。

早在1909年对非孟德尔式突变型所作观察的基础上,已经假定叶绿体中遗传信息的存在,但叶绿体DNA的存在仅在25年前才被首次证实。

存在于叶绿体中的大部分蛋白质实际上由核基因编码,在细胞质中合成前体,再运入叶绿体。这些前体比相应的成熟多肽稍微大一些,因为在它们的氨基末端有一个可能含有多达几十个氨基酸的额外肽序列;该序列让多肽得以进入叶绿体,并被搬运去形成成熟的以后被掺合的多肽。有核 - 质起源的成熟多肽,往往是含有几个多肽链、有些为核 - 质起源、有些为叶绿体起源的低聚酶或复合物的一个亚基。这就是为什么叶绿体生物发生需要其产物必须被装配而形成有功能的复合体的细胞核基因与叶绿体基因一致表达的一个理由。

事实上,少数叶绿体蛋白质是叶绿体起源的。这就引出了叶绿体DNA的组成和信息含量的问题。

叶绿体基因组由环形DNA分子组成。在已知的一种植物中,DNA分子都有相同的长度(植物线粒体DNA不是这样),根据已涉及的种类,通常有120,000 ~ 190,000碱基对(bp)或120 ~ 190千碱基对(kbp)。

迄今已研究的大多数种类中,叶绿体DNA包含:

一个区段出两次,每次在相对位置(倒位重复),携带核糖体RNA(rRNA)基因的一个操纵子。这个重复区段的大小,从地钱属(Marchantia)的10 kbp到烟草的25 kbp不等。倒位重复的两个拷贝由以下两者隔开:

—个大的单拷贝区段,在地钱属和烟草中大约长80 kbp;

一个小的单拷贝区段,在地钱属和烟草中大约长20 kbp。

对于这个一般的组成,它们是几个例外:

在某些豆科植物中(蚕豆、豌豆),只有一个rRNA操纵子。

在裸藻属(Euglena)中,在相同方位(一前一后排列)有3个rRNA操纵子(已记述一些品系有1或5个rRNA操纵子)。

一、叶绿体基因的识别和定位

为了表示存在叶绿体DNA中的基因的特性,在用限制性内切酶(通过在特定部位的水解作用切割DNA成断片)煮解DNA和测定限制性断片在叶绿体基因组上的相对位置以后,已经使用了几种方法。

编码rRNA和转移RNA(tRNA)的基因的位置,能通过放射性RNA对叶绿体DNA不同的限制性断片的杂交作用而易被测定。

编码蛋白质的基因是稍微难于定位的。当蛋白被提纯时,抗体可集结然后用于在根据信使BNA转译而离体合成的多肽中识别该蛋白质。杂种抑制转译和杂种释放转译将得以识别含有编码该蛋白质的基因的DNA断片。

当蛋白质的部分序列已知时(十几个氨基酸的序列可能是有效的),或者当蛋白质的序列已被另一种测定时(蛋白质和DNA序列现在可能在贮存于计算机中的数据库里找到),编码该序列的放射性低脱氧核苷酸能够合成,并用作一个探测剂去测定相应的基因在叶绿体DNA的不同限制性断片上的位置。

当一种植物的某个基因在叶绿体DNA中已经定位,该基因在克隆和扩充以后,可以用作探测剂去测定他种填物的相应基因在叶绿体基因组中的位置,因为叶绿体基因有高度的序列保守性。

终于,克隆和按顺序排列DNA的方法的进展,已由两个日本小组在对地钱属(121000 kp)和烟草(155000 kp)的叶绿体DNA的完整核苷酸序列测定中达到了顶点。由于叶绿体和原核生物的基因之间高度的同源性,通过计算机对叶绿体DNA和大肠杆菌(E. coli)DNA序列的比较,已经在序列同源性的基础上使一些叶绿体基因得以定位。

在烟草中,识别和定位的叶绿体基因编码:

一一4类rRNA. 23S,16S,5S和4.5S;

——30个不同的tRNA;

——约40种蛋白质。另外有12个可能编码蛋白质的推断的基因已经定位,还有近40个开放性读码(ORF)或未鉴定的读码(URF),每个含有70多个密码子。

编码4类rRNA的基因聚集在倒位重复区段,这样就在叶绿体基因组中出现两次。编码23S、16S和5S rRNA的基因与大肠杆菌中的非常相似;例如在玉米叶绿体和大肠杆菌之间,16S RNA有约75%的同源性,23S RNA有约70%的同源性。4.5S RNA是一种典型的叶绿体RNA,但它相当于大肠杆菌中23S RNA的5'末端。

30个不同的tRNA基因已经确定,并且其中7个在重复区段定位,这样就有37个tRNA基因。理论上最少32个tRNA对于转译“通用”遗传密码的61个有意义密码子是必需的,但是如果考虑到U-N变位的可能性和(或)密码子 - 反密码子碱基配对的“三分之二”机制,蛋白质合成可能发生在叶绿体中而没有tRNA的进入,在高等植物中这些tRNA基因分散在叶绿体基因组上,而在裸藻属它们大多数是聚集的。

在编码蛋白质的质体基因中,人们能够鉴别编码存在基质中的多肽的基因和编码类囊体多肽的基因。

在第一类中,发现基因编码:

—核酮糖1,5 - 二磷酸羧化酶/加氧酶(RubisCo)的大亚基。该酶由8条大亚基链和8条小亚基链组成。后者在核基因组编码,在细胞质中合成为前体,前体被运入叶绿体加工产生成熟的小亚基,与大亚基联合形成完整的酶。

一60个左右(58 ~ 62)叶绿体核糖体蛋白中的19个,即11个小颗粒蛋白(3 OS)和8个大颗粒蛋白(5 OS)。因此约40个其他核糖体蛋白是从细胞质中输入的。

在这些核糖体蛋白和大肠杆菌相应'的蛋白质之间有相当高的同源性。基因的核苷酸序列及由此而来蛋白质的结构,像交叉免疫反应所展现的,可高达75多的同源性。一些基因的聚集也呈同源现象;例如蛋白质L23,L2,S19,L22,S3,L16,L14和S8,在叶绿体基因组和大肠杆菌基因组中都有它们的以这个次序聚集的基因。

——转译起始因子IF-1和延伸因子EF-Tu在叶绿体DNA中编码。

——完整的叶绿体基因组序列的测定已经揭示,在地钱属和烟草中,与大肠杆菌中编码RNA聚合酶的α、β和β'亚基的基因存在基因同源性。但至今尚未证实叶绿体RNA聚合酶由这些叶绿体DNA编码的多肽组成。

编码核糖体蛋白、RNA聚合酶的多肽和转译因子的基因,有时同编码rRNA和tRNA的基因一起,被认为是形成一类编码涉及叶绿体基因组表达的产物的基因。

第二类质体基因包括那些编码参与光合作用的类囊体蛋白质的基因:

——光系统Ⅰ的蛋白质:

P700(光系统Ⅰ的反应中心)的脱辅基蛋白A1和A2

—光系统Ⅱ的蛋白质:

32 kd蛋白,负责对除草剂如莠去津的敏感性(在抗性突变型中,该基因的排列顺序已表明只有一个核O酸不同);

P680的脱辅基蛋白;

44 kd蛋白;

D2蛋白;

细胞色素b559

——细胞色素b6/f复合体的蛋白质:

细胞色素f;

细胞色素b6

第4亚基。

——叶绿体ATP酶复合体的蛋白质:

该复合体9个亚基中的6个,即α、β、ε、Ⅰ、Ⅲ和a。

第五类囊体复合体(捕获光能的蛋白质 - 叶绿体复合体)看来在核基因组中编码。

应当指出,两个“自主复制序列”已经定位,在酵母菌中它们能自主复制,但它们在叶绿体DNA复制中的作用尚不知道,因为它们定位在叶绿体DNA复制起点区段的外面。

另外,烟草中11个推断的基因和38个开放性读码已经定位,它们可能也编码在叶绿体中起作用的多肽,这样产生共计122个序列;由于其中24个在重复区段定位,实际上这应相当于总共有146个序列。

在开放性读码中有6个序列与线粒体中编码还原型辅酶Ⅰ(NADH)脱氢酶的亚基的序列是同源的,以致有人怀疑叶绿体中包括还原型辅酶Ⅰ的呼吸链的存在和功能。

在烟草中,少量的叶绿体基因(6个tRNA基因和9个蛋白质基因)有内含子,而在地钱属,这些数目分别为6和12。其中一些是很长的(几百个碱基对),甚至编码tRNA的基因(虽然tRNA只有70 - 80个核苷酸),如同由断裂的赖氨酸tRNA基因所表明的,有一个具2526个碱基对的内含子。正相反,在裸藻属叶绿体中,tRNA没有内含子,而在高等植物中一些蛋白质基因里,发现多重内含子,譬如编码RubisCo大亜基的基因有9个内含子,编码光系统Ⅱ的32 kd蛋白的基因有4个内含子。

二、叶绿体基因的表达

在叶绿体中,基因表达需要4步:

转录;转录后修饰;转译;转译后修饰。

(1)转录

叶绿体基因的转录能通过分析活体或离体得到的转录本而研究。

转录活性染色体(TAC)已经从单细胞光合生物(裸藻属、衣藻属Chlamydomonas)和高等植物(菠菜、芥)的叶绿体中分离出来,这些TAC类似于细菌拟核而不似真核染色质,因为它们不含组蛋白,也没有核小体。它们优先合成rRNA,还有mRNA(就菠菜TAC而言),但不合成tRNA,并且它们不转录外源DNA。

为转录外源DNA(通常是克隆的叶绿体DNA断片),无细胞系已从叶绿体制备,但也能利用异源系(常利用大肠杆菌RNA聚合酶)。

转录起始和终止的位点能用水解未配对的DNA序列的SI核酸酶确定,从而揭示参与DNA-RNA杂种(在编码的ONA链和转录本之间形成)的DNA序列的限度。

在原核生物中,RNA聚合酶在DNA上识别含有两个具特别的保存序列(同感序列)的区段的启动子;它们分别被测定转录起点的10和35个碱基对逆序,并由17+1个碱基对的最适距离所分隔。

对大约60个叶绿体基因发现逆序的序列的研究已经表明在大肠杆菌和叶绿体同感序列之间有很高的同源性:

大肠杆菌同感序列:-35/TTGaca -10/TAtaaT

叶绿体同感序列: TTGaNT TAtaaT

对大量叶绿体基因的同感序列进行的离体诱变实验(碱基置换、缺失、插入)已经表明。这些-10和-35序列是离体准确转录所必需的,这样进一步证实与原核生物启动子非常相似的这些序列的启动子活性。

注意到这一事实是有趣的,在高等植物叶绿体中相同的启动子序列被发现3类基因(编码rRNA、tRNA和mRNA的基因)的逆序的存在。这暗示这三类RNA由相同的RNA聚合酶转录(如同在大肠杆菌中一样),而在真核生物中,由RNA聚合酶Ⅰ、Ⅱ和Ⅲ(它们分别转录rRNA、mRNA和tRNA)识别的启动子是不同的。

—些叶绿体mRNA是多顺反子的(如同在原核生物中一样),但也有单顺反子mRNA. 联合转录发生在rRNA,其与两种tRNA(丙氨酸tRNA和异亮氨酸tRNA)—起被转录,它们的基因定位在23S rRNA和16S rRNA基因的间隔区中。至于tRNA,主要在裸藻属,tRNA基因的聚集是一个普遍特征。这也发生在高等植物中,三个tRNA基因已经表明是聚集的和联合转录的。就蛋白质基因而论,联合转录显然发生在参与形成相同复合体的多肽的聚集基因,例如ATP酶的α和Ⅰ亚基、ATP酶的β和ε亚基(它们的基因甚至重叠)与一些核糖体蛋白。

rRNA基因的转录,如在原核生物中,能由衰减或反终止所调控,这两种作用卷入测定基因(先导基因)逆序的序列结构变化和当核糖体过量存在时引起rRNA转录的过早终止。

就转录的终止而论,恰好已经观察到大量质体基因的终止位点(用SI核酸酶识别)的逆序,短的倒位重复序列,其会使发夹结构得以形成,且类似于原核生物中的终止信号。

在不同细胞型中叶绿体基因表达的控制可能发生在转录水平,像编码RubisCo大亚基的基因所表明的,RubisCo大亚基在玉米的维管束鞘细胞叶绿体中转录,而不是在叶肉细胞叶绿体中。

(2)转录后修饰(RNA的成熟)

在原核生物及真核生物中,原初转录本通常长于最终产物(rRNA,tRNA,mRNA),因而必须缩短,这由特殊的核酸酶的作用来完成。

与真核生物的mRNA相对比,叶绿体mRNA既没一个帽子(甲基鸟氨酸)在末端,也没有一个多聚腺苷酸的长尾巴在3'末端。

成熟意指在转录本与被内含子间断的基因相符合情况下的特有过程。在烟草叶绿体中,15个识别的基因(6个tRNA基因和9个蛋白质基因)有内含子,(其中一些有几百个碱基对长,存在于编码赖氨酸tRNA的基因中的内含子有2500多碱基对),它们中一些原初转录本和最终转录产物已被表示特性。叶绿体中负责内含子拼接的机制尚未阐明,但有人已提出叶绿体内含子分为三类:

——第一类内含子,譬如在亮氨酸-UAAH联体密码子tRNA中发现的,能折叠以致有一个二级结构,与四膜虫属(Tetrahymena)rRNA前体的可自己拼接的内含子的二级结构相似。经过自动催化作用,或者经过酶的作用例如包括线粒体中成熟薄的作用,这些内含子能够拼接起来。

——第二类内含子能折叠以致有一个二级结构,与存在于编码酵母或玉米线粒体细胞色素氧化酶和编码酵母细胞色秦b的基因中的内含子的二级结构相似。在这些内含子中,已发现开放性读码,它们能编码专门作用于前-mRNA至mRNA的成熟的成熟酶——正如名字所提示。

——在15个烟草叶绿体断裂基因的12个中发现的内含子属于第三类;它们存在于编码tRNA或蛋白质的基因中,在5'和3'边缘有保存序列,与存在于核基因中的内含子里发现的保存序列相似:

4.4.1

编码烟草叶绿体核糖体蛋白S12的基因是一个特殊情况:它含有三个外显子,但第一个(5'端外显子)定位离另两个(3'端外显子)很远。这两个3'端外显子存在于重复区段,因此,5'端外显子实际上被测定:

——基因的3'部分的28,000碱基对顺序存在于一个重复区段(在同一链上)

——基因的3'部分的86,000碱基对顺序存在于另一重复区段(在相对的链上)。

该基因已被称为“分裂基因”,它的成熟显然暗示了特殊的“转移 - 拼接”机制。

4.4.2

裸藻属的叶绿体基因通常与高等植物叶绿体中相应的基因不同;例如裸藻属叶绿体中编码核糖体蛋白S12的基因或tRNA基因中没有内含子。然而另一些基因,在高等植物叶绿体中没有内含子,譬如编码RubisCo大亚基的基因或编码光系统Ⅱ的32 kd蛋白的基因,在裸藻属叶绿体中却有内含子。在裸藻属,内含子看来代表了叶绿体基因组的20%之多。

(3)转译

叶绿体中蛋白质生物合成的第一步,即tRNA包括叶绿体特有的tRNA的氨酰化(氨基酸连接到相应的tRNA上),叶绿体特有的tRNA,在叶绿体基因组中编码,它们不同于细胞质tRNA而相似于原核生物tRNA;序列同源性通常为70%左右;修饰的核苷酸往往相同,并且叶绿体tRNA能在离体时利用叶绿体或原核生物的酶而氨酰化,但用来自相同细胞的细胞质的酶,它们却不氨酰化。

叶绿体含有约30个tRNA,它们足够转译通用遗传密码的61个有意义密码子(与线粒体相比,叶绿体使用通用的遗传密码),如果考虑到U-N变位和(或)在某些情况下密码子 - 反密码子对只含有三个核苷酸中的两个的可能性的话。

叶绿体中催化氨基酸连接到相应的tRNA上的酶叫做氨酰-tRNA合成酶,在催化、结构和免疫学特性方面,它与细胞质中的复本不同,但是看来叶绿体氨酰 - tRNA合成酶由核基因组编码,细胞质氨酰 - tRNA合成酶也是如此。

蛋白质生物合成的起始区,像在大肠杆菌中一样,含有一个甲酰 - 甲硫氨酰 - tRNA,而在真核生物细胞质中,起始因子甲硫氨酰 - tRNA不甲酰化。

如同在原核生物中一样,mRNA上30S核糖体颗粒的连接包括(30S颗粒的)3'末端与mRNA上发现起始密码子(AUG)的逆序的互补序列(叫做Shine-Dalgarno序列)配对。

叶绿体核糖体与原核生物核糖体强烈相似。它们是70S型的(而真核生物细胞质核糖体是80S型的),在叶绿体与原核生物核糖体RNA之间(70 ~ 75%)和核糖体蛋白之间有高度的同源性,另外在叶绿体和原核生物的起始因子(IF)之间、延伸因子(EF)之间也已看到同源性。

叶绿体中密码子使用表明,在一群同义密码子内对于第三位置(变位位置)的U和A有明显的优先。在不同的叶绿体同功tRNA的集中与相应密码子的使用频率之间的相互关系已经观察到;后者由于叶绿体基因的序列测定而知道。

(4)转译后修饰(蛋白质的成熟)

叶绿体中合成的蛋白质的转译后修饰目前了解甚少。然而已经表明,一些蛋白质丢失了少数氨基酸;或者在氨基末端,例如就RubisCo大亚基和细胞色素f而言;或者在羧基末端,例如就光系统Ⅱ的32 kd蛋白而言。它们在成熟过程中,先于装配形成活性酶或复合体。另一方面,一些叶绿体蛋白质被磷酰化了。

结论

叶绿体基因组显示了很多与原核生物基因组的相似之处:

就基因的结构和组成而论,不仅在基因(编码rRNA、tRNA和蛋白质)的序列,而且在从同一簇中发现的某些基因的组成方面,有许多同源性;有时在叶绿体基因组和大肠杆菌基因组中的基因甚至以相同的次序呈现(例如几个核糖体蛋白质基因的情况)。

就基因表达而论,在叶绿体和原核生物之间已经看到许多相似点。叶绿体中含于转录的起始区(起动子)和末端(终止区)的序列与在原核生物中识别的很相似。转译机制也有很多共同特性:tRNA序列的同源性,叶绿体与原核生物之间tRNA和氨酰 - tRNA合成酶的交叉反应可能性,核糖体相似的大小,rRNA和核糖体蛋白序列的同源性,在起始过程中甲酰化的甲硫氨酰 - tRNA的利用,mRNA上与使30S颗粒得以连接到mRNA上的16S RNA 3'末端序列互补的序列的起始密码子的逆序的存在,对于相同抗生素的敏感性,等等。

这些相似点支持叶绿体内共生起源学说,根据这个学说,这些细胞器从原核祖先(例如蓝细菌,Prochloron属)演化而来。但是一些叶绿体基因中内含子的存在指出,如果这一学说正确,那么原核祖先应该有内含子,至少有一些被保留在叶绿体基因组中,而它们已经从真核细菌基因组消失了。

叶绿体基因组合有叶绿体rRNA和tRNA合成与比较有限的数量的叶绿体蛋白质(已经鉴定约40种,如果开放性读码在编码蛋白质,这个数目可能上升到80)合成所必需的信息。因此,大部分叶绿体蛋白质在核基因组中编码,在细胞质中合成并运入叶绿体。当检查在叶绿体基因组中编码的叶绿体蛋白质时,有人看到在大多数情况下它们必定与多肽相关,这些多肽从细胞质中运入以形成有功能的酶或复合物(RubisCo,核糖体,光系统Ⅰ和Ⅱ,细胞色素b6/f,ATP酶)。因此叶绿体生物发生和功能需要在叶绿体和核 - 质分隔区基因表达的调控,以保证必须在叶绿体中装配形成有功能的低聚复合物的多肽的协调合成。对这些调控机制的认识是当前植物分子生物学的主要目标之一。

[Plant Science1987年49期]