SARS-CoV-2只是地球上的无数病毒之一,科学家正飞速鉴定新的病毒种。

5.1.1

伪彩色电子显微照相(非同比例)展现病毒各异的形状和尺寸,从巨大的拟菌病毒到登月飞船形状的噬菌体。上左至右:天花病毒、嗜酸瓶装病毒、阿米巴多食拟菌病毒;中左至右:狂犬病毒、T4噬菌体、轮状病毒;下左至右:埃博拉病毒、烟草脆裂病毒、HIV-2

米亚 · 布莱巴特(Mya Breitbart)曾在非洲的白蚁丘、南极海豹和红海水样中寻找新病毒,最终却在佛罗里达州自家后花园中一攫千金。刺背球状蜘蛛(Gasteracantha cancriformis)在她家的泳池中结网,这种蜘蛛有球茎状的白色身体,上面有黑色斑点和六根猩红色的棘刺,颇像中世纪的兵器。当布莱巴特观察蜘蛛里有些什么时,这位圣彼得斯堡南佛罗里达大学的病毒生态学家大吃一惊。她和同事们采集并处理了几个蜘蛛样本,发现了两种从未被发现的病毒。

人类自2020年早些时候就开始与难对付的病毒战斗,但除了SARS-CoV-2之外,还有许多其他病毒亟待发现。科学家估计,仅在海洋中就有约1031种不同的病毒类物种,大约是已知宇宙中星星的100亿倍。

科学界逐渐认识到生态系统和有机物是依赖病毒的。这种小而有力的存在实现了宿主间的基因传递,为进化增加了动力。它们在海洋中破开微生物,其中的内容物播散开来,营养物质就进入了食物网。“如果没有病毒,”加拿大温哥华英属哥伦比亚大学病毒学家柯蒂斯 · 萨特尔(Curtis Suttle)说,“我们就不会有生命。”

国际病毒分类组织(ICTV)只命名了9 110种病毒,是非常小的一部分。当然一个原因是官方鉴定一种新病毒需要科学家在其宿主或宿主细胞中培养病毒,这一过程相当耗费时间;另一个原因是研究存在一定偏倚,研究关注的多是会在人类或相关生命体中致病的病毒,像农场动物和谷物间流行的病毒。但COVID-19为我们敲响了警钟,我们需要关注那些可能从一个宿主播散到另一个,危害到我们人类、我们养的动物和种的作物的病毒。

过去十年间我们发现并命名了许多未知病毒,除了技术的进步外,另一个推动力是鉴定新物种的规则近期发生了改变,现在不需要培养病毒和宿主作为证据了。新技术中起到最重要作用的是宏基因组学(metagenomics),研究者利用这个技术能够直接检测环境中病毒的基因组,而不需要进行培养。更新的技术,譬如单病毒测序则发现了更多病毒,其中一些在我们眼皮底下藏到了现在。布莱巴特说:“现在正是做这种研究的大好时机,从很多方面来说,这是病毒组学的时代。”

仅仅在2020年,ICTV的官方列表中就增加了1 044个新的病毒种,还有成千上万的新病毒等着描述和命名。基因组学的发展让病毒学家重新思考病毒的分类方式,并探究其进化历程。目前的有力证据表明病毒存在多个起源,不是从单一源头发展而来。

即便如此,“病毒世界的实际规模依旧是未知的,”美国国家过敏和传染病研究所病毒学家延斯 · 库恩(Jens Kuhn)说,“我们一定还有些什么一无所知。”

这里,那里,它们无处不在

所有的病毒有两个共同特征:一是用蛋白质衣壳包装着基因组,二是依靠宿主——人、蜘蛛、植物等——进行复制,实现繁殖。除此之外就很难在它们的生命周期中找出些相同的模式了。

小如环状病毒仅有两三个基因;大如拟菌病毒体积超过一些细菌,基因数量成百上千。造型奇特如登月飞船的噬菌体,能够感染细菌;当然还有我们熟悉的球状、有一个个突起的致命杀手正给我们带来苦难。一些病毒以DNA的形式储存基因,另一些则用RNA;甚至有种噬菌体用了另一种基因密码,将标准的ACGT系统中的碱基A替换成了另一种分子Z。

病毒的存在十分广泛,也会在科学家意想不到的时候现身。弗雷德里克 · 舒尔茨(Frederik Schulz)在对废水中的基因进行测序时,并没有打算研究病毒。2015年,维也纳大学的研究生舒尔茨打算利用宏基因组学寻找细菌。他分离有机质混合物中的DNA,将它们打碎并进行测序,随后在计算机软件上将基因片段组装成单独的基因组,像是完成一个巨大而混乱的拼图游戏。

在这些细菌的基因组中,舒尔茨注意到一个体量巨大的病毒基因组(可以通过它的病毒衣壳序列而确定其病毒身份),其碱基数量达到了157万。它是一个大型病毒,属于一组在基因数量和绝对体积(横径200纳米,甚至更大)上都相当大的病毒家族。这种病毒能够感染阿米巴原虫、藻类和其他原生生物,这使它们能够同时影响到水生和陆生生物的生态系统。

舒尔茨现在是美国加利福尼亚州伯克利市美国能源部联合基因组研究所的微生物学家,他决定在宏基因组数据集中挖掘相关的病毒。2020年,他和同事发表的单单一篇文章中,就描述了包括大型病毒的超过2 000个基因组,在这篇文章发表前,公共数据库中只有其中的205个基因。

5.1.2

研究发现刺背球状蜘蛛携带两种未知病毒

病毒学家同时在人体内寻找新的种群。病毒生物信息学家路易斯 · 卡玛利洛-格雷罗( Luis Camarillo-Guerrero)与英国辛克斯顿维尔康姆 · 桑格研究所的同事对人类肠道中的微生物进行了宏基因组分析,建立了超过140 000种噬菌体的数据库,其中超过半数对科学界而言是全新发现。他们今年2月发表的文章再次证实了人类肠道中最为常见、能够感染细菌的一组病毒——crAss噬菌体的存在。卡玛利洛-格雷罗说:“尽管它含量丰富,但我们不怎么了解它在人类微生物组中的作用。”他目前在英国剑桥的DNA测序公司Illumina工作。

5.1.3

阿米巴原虫中找到了巨大的图潘病毒,尺寸超过1000纳米长,其蛋白编码基因是已知病毒中最大的

宏基因组学发现了大量的病毒,但也错过了很多。经典的宏基因组学并没有对RNA病毒进行测序,因此爱尔兰科克大学学院的微生物学家科林 · 希尔(Colin Hill)和同事们在RNA数据库中进行深入调查,这被称作宏转录组学。科学家通常利用这些数据来研究那些活跃转录为信使RNA并制造蛋白质的基因,而RNA病毒基因组也会出现。团队利用计算机技术从数据中找出这些序列,从泥土和水样本中找到了宏转录组学的1 015个病毒基因组。这次他们又在一篇文章中大大扩充了已知病毒的数量。

这项技术可能会意外地组装出并不真实存在的基因组,研究者会利用质量控制技术来防止这种意外发生。但盲区依然存在,譬如说那些成员多样性大的病毒种相当难以寻找,因为计算机程序很难将这些不相干的序列拼接在一起。

西班牙阿利坎特大学微生物学家曼纽尔 · 马丁内兹-加西亚(Manuel Martinez-Garcia)表示可以选择每次筛选一个病毒基因组。他决定将海水滴进分选机器来分离独立的病毒,以此放大其DNA进行测序。

第一次尝试时,他便发现了44个基因组,其中一个可以说是代表了海洋中一些最丰富的病毒。这种病毒的多样性相当大(基因密码片段差异极大),而其基因组从未出现在宏基因组学的研究中。研究团队将其命名为37-F6,这是它实验皿的原始编号,但马丁内兹-加西亚开玩笑说,想到它会隐藏在光天化日之下,应该叫它“007”,即詹姆斯 · 邦德这个虚构的超级间谍。

病毒谱系图

海洋病毒中的这个“詹姆斯 · 邦德”还没有得到一个官方的拉丁语种族名,这同样发生在过去十年中通过宏基因组学发现的成千上万个病毒基因组。这些基因序列不断涌现将ICTV置于一种困境:单凭基因组是否足以命名一个病毒呢?2016年之前,向ICTV提交一个新病毒或是生物分类学上的组,科学家须在培养基中培养其病毒和宿主,鲜有例外。但这些年经过热烈的长期辩论,病毒学家达成共识,认同了仅基因组作为证据就是充分的。

于是,提交新病毒和组的报告蜂拥而至(见“分门别类”)。但这些病毒的进化关系并不明确。病毒学家通常依据形状(“长而细的”或“有头的”或“有尾巴的”),也可以依据基因组(DNA或RNA,单链或双链),但这对确定病毒的共同祖先而言几乎毫无意义。举例来说,目前认为双链DNA基因组病毒有至少4个不同的起源。

5.1.4

过去ICTV的病毒分类方式并不考虑细胞生物的分类阶元树,仅仅包括进化层次中级别较低的分类,即种(species)、属(genera)、科(family)和目(order)4个级别,其中最高级的“目”与多细胞生物分类阶元中的“灵长类”或“有果球的树”级别相同,而没有更高的级别。同时也有许多病毒家族举目无亲,与其他种类的病毒没有任何关联。因此ICTV在2018年增加了更高的级别:纲(class)、门(phylum)和界(kingdom)。

在最高的级别上,ICTV规定了“域(realm)”的概念,对应细胞生物(细菌、古生菌和真核生物)中“域(domain)”的概念,用不同的英文单词以区别不同的阶元系统。(数年前曾有科学家提出细胞生物的进化树也能够适用于一些病毒,但这种看法并未被广泛接受。)

ICTV对阶元树的分支进行了规划,将RNA病毒归入核糖病毒域(Riboviria)。SARS-CoV-2和其他的冠状病毒都由单链RNA组成基因组,正属于这个域。但这对病毒学家远远不够,他们提出了更多的分类学组。美国马里兰州贝塞斯达市国家生物技术信息中心的进化生物学家尤金 · 库宁(Eugene Koonin)组建了一个研究团队分析所有的病毒基因组,结合病毒蛋白质的最新研究,为分类学画出初稿。

他们再次规划了核糖病毒域,并提出了3个新的域(见“病毒的域”)。“一些细节还待讨论,”库宁说,“但我们的分类学在2020年顺利地通过了ICTV的批准。另有2个新的域在2021年通过,但原先的4个域仍是体量最庞大的。”库宁认为最终域的数量会增加到25个。

这一数量佐证了许多科学家的猜测:病毒并没有一个共同的祖先。“所有病毒没有一个单一根源,”库宁说,“它不存在。”这意味着病毒在地球历史上有多次起源,那么就不能否认这种起源事件还会再次出现。“新病毒从头开始的起源过程依然在发生。”巴黎巴斯德研究所的病毒学家马特 · 克鲁波维奇(Mart Krupovic)表示。他参与了ICTV的决议,也在库宁的分类学团队中工作。

至于病毒域如何起源,病毒学家众说纷纭。它们可能直接来源于地球生命破晓之时的基因元素,甚至先于细胞的出现。它们可能从完整细胞中逸出或被排出,抛弃了细胞机制,仅仅保留了最简单的生命形式。库宁和克鲁波维奇倾向于一个兼取二者的假说:原始的基因元素从细胞生物中窃取基因,建立了病毒物质。库宁表示:“由于病毒有多重起源,那么其起源方式也可能各异。”他也是ICTV委员会成员,参与了新分类学的提案。

尽管病毒和细菌的阶元生命树看似毫无关系,它们的枝丫其实是相互接触的,存在着基因的交流。而病毒是否“活着”这个问题其实取决于个人对生命的定义。一些研究者认为它们并不算真正的生物,另一些则反对。“我倾向于它们是活着的,”日本东京大学研究病毒的生物信息学家绪方博之说,“它们在进化,它们有DNA或RNA组成的基因物质,而且它们在所有生物的进化中都很重要。”

普遍看法是目前的分类学只是初步尝试,一些病毒学家认为这种分类学有些混乱。约20个家族还是与任何的病毒域缺少联系。“好处是我们正尝试从混乱中寻找秩序。”马丁内兹-加西亚表示。

5.1.5

世界改变者

地球上的病毒总重量和7 500万只蓝鲸差不多,科学家很确信它们影响了食物网、生态系统甚至是地球的气候。哥伦布市俄亥俄州立大学环境病毒学家马修 · 苏利文(Matthew Sullivan)认为新病毒的加速发现“是一个分水岭,会揭示病毒直接影响生态系统的新方式”。但科学家们依旧在努力确定这种影响有多大。

绪方说:“目前我们找不到一个简单的解释方法。”海中的病毒会破开其微生物宿主,一些生物吃掉宿主的内容物并释放二氧化碳,如此将碳元素释放进生态系统循环。但最近,科学家开始认为这些分散的细胞会聚在一起沉到海底,把碳元素从大气中隔离开来。

5.1.6

瑞典斯托达伦沼泽解冻的永久冻土中,发现了具有参与降解和释放碳元素基因的病毒基因组

“在陆地上,解冻的永久冻土是碳排放的主要来源,”苏利文表示,“这个环境中的病毒有助于微生物中的碳排放。”2018年他和同事描述了瑞典解冻的永久冻土中1 907种病毒基因组和片段,其中有参与含碳化合物分解的蛋白质基因,这些碳是温室气体的潜在来源。

病毒也会通过改变微生物的基因来产生长程影响。举例来说,当病毒将抗生素基因从一个细菌转移到另一个,抗药菌株就会一家独大。“时间一长,这种转移会导致有重大意义的进化基因漂移。”卡玛利洛 · 格雷罗说。这不仅仅发生在细菌中,据估计人类DNA中有8%起源于病毒。我们哺乳动物的祖先就从病毒那里获得了胎盘发育所必需的基因。

基因组并不能完美解释病毒生活史的许多谜团,而病毒宿主是另一个解谜工具。病毒自身为我们提供了一些线索,譬如它们会在自己的基因组里携带一部分可识别的宿主遗传物质。

马丁内兹-加西亚和同事们使用单细胞基因组学鉴定了新发现37-F6病毒可能的宿主微生物。这种宿主——远洋杆菌也是海中最丰富而多样的有机物之一。在一些水域中,远洋杆菌占了既存细菌的一半。“如果仅仅这一种细菌突然消失,”马丁内兹-加西亚说,“海洋生物就会失去平衡。”

“要理解病毒的全部影响,科学家需要研究其如何改变宿主。”德国基尔市亥姆霍兹海洋研究中心的进化生态学家亚历山德拉 · 沃登(Alexandra Worden)表示。她在研究一种大型病毒,其基因中包含产生集光蛋白视紫红质的基因。理论上来说,这些基因会有利于宿主,帮助它们传递能量或信号,但仅仅基因序列并不能证实这一点。要明白这些视紫红质基因的前世今生,沃登打算一同培养病毒和宿主,并研究二者如何配对互动,实现一个“病毒-细胞”的共存状态。她说:“只有细胞生物学能够解释这种状态的意义,以及它如何影响碳循环。”

让我们回到佛罗里达,布莱巴特还没有培养出她的蜘蛛病毒,但她有了些新发现。她震惊地发现这些病毒尺寸极小,拥有环状基因组,蛋白衣壳和复制蛋白仅仅各有一个编码基因。其中一个病毒只能在蜘蛛腹部发现,而腿中没有,因此她认为这种病毒其实感染了蜘蛛吃下去的生物。另一个病毒则是在蜘蛛身体、卵和幼蛛中都有发现,因此这种病毒可能从父母辈传给了后代。布莱巴特却没有发现这些病毒对蜘蛛有任何危害。

对于病毒,布莱巴特认为“发现它们是容易的”。真正的困难在于病毒如何影响宿主生命周期和生态系统。但对于病毒学家需要先解决的也是最难的问题,布莱巴特说:“你要选哪个来研究呢?”

资料来源 Nature