本篇报道围绕2022年上海市自然科学奖一等奖项目“环形RNA生成和功能机制的研究”展开,该奖项由中国科学院分子细胞科学卓越创新中心陈玲玲研究员领衔获得。

10.1

陈玲玲(右)与学生在实验室

神秘的SC35核斑

1989年的秋天,哈佛医学院汤姆·马尼亚蒂斯(Tom Maniatis)实验室的博士后付向东在筛选了几百株单克隆细胞系后,终于鉴定出了一个全新的剪切因子——SC35。

付向东发现,SC35在细胞核中的分布呈现出有规律的斑点状。经过与冷泉港实验室的大卫·斯佩克特(David Spector)的合作,他们发现SC35组成的斑点与大卫早先发现的“核斑”结构高度重合。他们推测,SC35核斑为RNA分子的剪切提供了特殊的活动场所。

SC35核斑的复杂程度远不止于此。

将近20年以后,借着基因组学技术发展的东风,哈佛医学院的安德鲁·切斯(Andrew Chess)团队发现了两条名为NEAT1NEAT2的长链非编码RNA。顾名思义,非编码RNA本身并不能编码产生蛋白质,但能以其他方式调节细胞活动。安德鲁团队发现,NEAT2(人类肺腺癌转移相关转录本1,简称MALAT1)集中在SC35核斑内部,而NEAT1分布在SC35核斑外围的一处名为“旁斑”的结构之中。

2009年,包括康涅狄格大学戈登·卡迈克尔(Gordon Carmichael)在内的四个不同的研究团队相继独立地发现NEAT1对于维持旁斑结构的稳定至关重要。陈玲玲彼时正是戈登指导的博士研究生,她在博士阶段研究发现NEAT1是旁斑的形成所必需的RNA,在人胚胎干细胞发育分化的过程中,NEAT1能通过影响旁斑的形成,进而对信使RNA转移出细胞核的效率进行调控。

陈玲玲关注到了一个有趣的现象:在当时已经鉴定出的上万种长链非编码RNA之中,NEAT1NEAT2是唯二在末端不存在多聚腺嘌呤“poly(A)尾巴”的例外。

这令她不禁好奇:在茫茫的基因组中,poly(A)尾巴”缺失的NEAT1NEAT2是否还有其他“亲戚”呢?

sno-lncRNA的发现到“滴血验病”的临床可能

2009年博士毕业以后,陈玲玲作为独立研究员获得康涅狄格州干细胞研究经费的种子基金,与当时在同一研究机构工作的杨力博士(现任复旦大学教授)合作,开始对“poly(A)尾巴”缺失的长链非编码RNA进行了系统性研究。2010年陈玲玲回国,在中国科学院原上海生物化学与细胞生物学研究所组建了自己的研究团队。

随着研究进展,陈玲玲和杨力推测,NEAT1NEAT2这两个特例的背后很可能还隐藏着一类新型的RNA分子。经过两年的研究,他们一共找到了超过300种“poly(A)尾巴”缺失的长链非编码RNA。

有趣的是,其中表达量比较高的几个有代表性的RNA分子,在基因组中的位置竟然也非常集中,都坐落于15号染色体q11到q13间一段跨度为100 kb左右的区域之中。

这几个poly(A)尾巴” 缺失的新类型RNA分子,由于在它们的头尾都具有snoRNA的特征序列,因此被陈玲玲命名为“sno-lncRNA”。

随后的研究中,陈玲玲团队又揭示了一类特别的分子家族,称为SPA(5’snoRNA capped, 3’polyadenylated RNA),它们特别之处在于:5’末端是snoRNA ,但3’末端则具有poly(A)尾巴。他们进一步研究发现sno-lncRNA和SPA,为一种名为“小胖威利症”罕见遗传病的临床诊断提供了新的希望。

在人群中,平均每一万到三万人之中就会有一人不幸患有“小胖威利症”,病童往往身材异常肥胖,神经发育迟缓。

幸运的是,如果病童能及时得到生长激素的治疗,病症就能得到有效缓解。

但临床上的困难在于,很多病童在被诊断出病症的时候,已经错过了接受生长激素治疗的最佳时期。

那么,是否能在孩子刚刚出生的时候通过基因水平的诊断就对疾病风险进行预测呢?

事实上,人类遗传学研究发现,15号染色体q11到q13间一段跨度为100 kb 左右区域的片段缺失是导致绝大部分“小胖威利症”发病的病因。

很遗憾,这一段和“小胖威利症”相关的基因片段中并没有编码蛋白质的序列,因此不存在蛋白水平的疾病诊断靶点。同时,因为病人两条15号染色体中,只有一条染色体存在片段缺失,并通过“基因印记”的机制,片段缺失的那份拷贝会被表达出RNA,所以也难以通过DNA水平直接对发病风险进行预测。

如今,这些新RNA的发现则令人看到了另一种可能性:是否可以对15号染色体q11到q13间的sno-lncRNA水平进行测量,并将其发展为一种新型的“小胖威利症”诊断手段呢?

2023年,这一临床转化方向的努力初奏凯歌:陈玲玲团队与浙江省儿童医院邹朝春教授团队合作发现,在正常人体内的1微升血液样品中存在上千个sno-lncRNA分子,而这些sno-lncRNA分子在“小胖威利症”患者中的含量则可微乎其微!

总之,这些新分子家族的发现为人们认识“小胖威利症”病理和发展新型检测手段提供了源头依据。

被低估的环形RNA:一条新型免疫通路的发现

除了以上新类型长链非编码RNA,陈玲玲和杨力对于另一类特殊的长链非编码RNA很感兴趣。此前就有研究者发现,在一些信使RNA、长链非编码RNA成熟的过程中,其中的一小部分会头尾相连在一起,形成环形RNA分子。相较线性RNA分子,这些环形RNA分子表达水平低,但同时在体内会更加稳定。

这些环形RNA分子是随机产生的吗?陈杨团队合作相继报道了内含子来源的环形RNA和外显子反向剪接来源的环形RNA的普遍存在,提出了可变环化的现象(一个基因可以产生多个环形RNA)及其发生机制。

那么这些普遍表达的环形RNA是否具有生物学功能呢?通过解析环形RNA分子家族“生老病死”的规律,他们揭示了环形RNA具有重要功能和应用潜能。

首先,陈玲玲实验室的博士研究生张杨设计了一个新生环形RNA捕获检测体系,发现了环形RNA产生效率低,但是稳定性好。

陈玲玲实验室的博士研究生李响设计了一个遗传学筛选实验:他通过一套诱导表达系统,让一段基因序列在刺激下高水平表达。如果表达出的序列是线性的,那么不会发出荧光信号;与之相反,如果表达出的序列形成了环形RNA,则会产生出来自环形RNA蛋白表达产物的强烈红色荧光信号。

在这套表达系统中,李响让细胞感染了siRNA病毒文库,尝试对各个基因逐一敲低。他猜想,如果存在调节环形RNA生成的基因,那么通过siRNA破坏这些基因,会降低环形RNA的产生效率。因此他将兴趣集中在那些被敲除后会导致红色荧光信号变弱的基因,将其作为后续研究的候选基因。

完整的一轮筛选过后,李响发现了103个候选基因,它们可以表达出能与RNA进行结合的蛋白产物。出乎他意料的是,其中竟然有16个与免疫系统响应病毒感染的通路相关。

难道说,环形RNA的产生多少,会由免疫通路的激活程度来决定吗?

实验结果支持了这个令人兴奋的猜想,病毒的感染的确会导致免疫细胞中环形RNA的数量下降。

接下来,研究者将注意力集中在了一个名为ILF3的候选基因上。

ILF3基因可以编码表达出NF90和NF110两个不同的免疫分子。有趣的是,NF90和NF110可以在细胞核内结合,处于从线性向环形转化过渡阶段的RNA分子,通过稳定其构象促进环形RNA分子的产生。

当病毒感染入侵免疫系统时,大量的NF90和NF110免疫因子进入细胞质对病毒的遗传物质进行围剿。这样一来,细胞核内的NF90和NF110数量减少,环形RNA的产生效率也随之降低;与此同时,陈玲玲团队还发现免疫系统激活的核酸内切酶RNase L,可以快速降解细胞质中的环形RNA。

两个因素合在一起,环形RNA产生效率降低,分解速度提高,总体的数目自然也随之快速降低下来。

那么问题来了,受到如此精细调控的环形RNA分子,在细胞中究竟发挥着怎样的生物学功能呢?

对于免疫分子NF90而言,它结合环形RNA的亲和度要比同样序列的线性RNA更加强。

那么在其他免疫分子之中,是否也有类似NF90、具有更偏好结合环形RNA的情况存在呢?

利用生物化学手段,陈玲玲团队的博士研究生刘楚霄系统地筛选了免疫通路中RNA结合蛋白对环形RNA的结合能力——研究者最终发现免疫分子PKR能紧密结合环形RNA,并且活性也会随着结合环形RNA而被抑制。

为什么环形RNA会抑制PKR呢?刘楚霄设计了化学方法标记细胞内的环形RNA分子的单链和双链的区域,并结合高通量测序等手段,预测环形RNA在细胞内的折叠状态。这使得团队发现很多不同的环形RNA分子具有类似的折叠方式,即形成分子内的短双链结构(这完全不同于具有一样序列的线性RNA)。这一环形RNA独具的特征使其特异结合并抑制免疫分子如PKR等在正常情况下的过度激活。

有趣的是,免疫分子PKR活性的过度激活,正是一部分红斑狼疮患者的重要特征。

陈玲玲团队联合上海交通大学医学院附属仁济医院的沈南教授团队发现,在红斑狼疮患者的免疫细胞中的环形RNA水平要低于对照人群。

那么是否有可能将环形RNA设计成具有特殊折叠构象的RNA药物,通过抑制免疫分子PKR来缓解红斑狼疮患者的症状呢?

陈玲玲团队设计出了低免疫活性的环形RNA分子,并初步在细胞实验中进一步验证了它们对于PKR免疫通路的抑制作用。

环形RNA分子未来是否能在PKR异常激活的炎症性疾病模型中乃至人体临床试验取得成效呢?最近陈玲玲团队的研究表明,体外合成的环形RNA不仅是PKR的高效抑制剂,更重要的是,体外合成的环形RNA无需像mRNA一样进行额外修饰去除免疫原性,环形RNA本身就是低免疫原性的,因此具有良好的应用前景。

我们乐观地等待它们接受事实的检验。

————————————

本文作者黄宇翔是密歇根大学在读博士研究生,主要研究“细胞自噬的调控机制”,科普作品主要围绕生命科学及相关学科方向

术语对照

snoRNA                               小核仁RNA

sno-lncRNA        含有小核仁RNA的长非编码RNA

siRNA                                 小干扰RNA

PKR                       双链RNA活化的蛋白激酶

EIF2α                              真核起始因子2α