我国6个单位即中国医学科学院医学生物学研究所、上海复旦大学、哈尔滨医科大学、中国科学院遗传所、医科院肿瘤所和上海第二医科大学附属瑞金医院的遗传学家大力协作,利用高度多态性的遗传学标志对中国各民族的源流关系及其与世界各民族的进化关系进行了分析,是中国人类基因组多样性计划的一个重大成果,不仅发表于《美国国家科学院院报》(Proceedings of the National Academy of Sciences)上,底得了世界人类基因组多样性计划的权威Cavalli-Sforza和Piazza分别在《美国国家科学院院报》和《自然》(Nature)上撰文评述,而且还入选了由我国两院院士评出的1998年中国十大科技进展。在这里,我们将Piazza在《自然》上发表的评述翻译出来,以飨读者——译者注。
人类进化学者们都知道人体物理性状大多是适应性的,反映了地理或环境而非其携带者的历史。因此,他们将欣赏储嘉佑及其他13位中国作者在《美国国家科学院院报》(Proceedings of the National Academy of Sciences)上发表的对中国进行的一项前所未有的精细的遗传学分析。
在其著作《枪炮、种子和钢铁》中,贾里德·戴蒙德(Jared Diamond)惊愕于中国——这个自从公元前221年就统一了的、语言几乎是单一语种的、自从其有记载的历史开始就使用一种单一的书写系统的中国是如何成为中国的。我们不应该对这种均一性(占了我们现有人类的五分之一和我们居住的星球的十五分之一)感到吃惊的原因之一是遗传学。以前曾经发现,通常以黄河和长江之间的地带为界的中国北方人和南方人在遗传学上是不同的——至少从样本量相对很小的血型和蛋白质标志的多态性测试来看是这样的。但是,这种由人类学、环境学、考古学、史前和历史事件所支持的不均一性,远不是来自周密计划的在微地理水平的遗传学调查所得出的可靠结果。不论在时间和空间上,物理表现都是构成这些差异的一个重要因素。中国北方人普遍都较南方人个子高、皮肤白、眼睛小而似略“斜”一些。而且,除了骨骼外,中国南方人更像现代南亚人,尤其是像暗皮肤的种族(如所谓的矮小黑人Negritos)。
储嘉佑等利用15到30个微卫星检测来自中国不同省份的28个样本,微卫星是短DNA片段的重复,广泛分布于我们的基因组中,由于其数货多、以孟德尔方式遗传、髙度可变和易于处理等特点而普遍应用于进化分析中。中国政府正式宣布的民族有56个。汉族(其名称源于公元前206年到公元220年的汉朝)从总数(11亿人口)和历史传统上说都是最重要的。其余1亿中国人(少数民族,译者注)被发现大多数居住在中国南方,其中将近一半居住在一个省:云南。
储嘉佑等采集了4个汉族人群和24个少数民族人群的样本。他们还用同一套微卫星对4个东亚人群、2个美洲土著人群、1个澳大利亚人群、1个新几内亚人群、4个髙加索人群和3个非洲人群的样本进行检测以作为非中国的对照组人群。他们总结了两个系统发育树中的遗传学差异,只有当此树代表彼此的地理距离和遗传距离均相距很远的民族时,它才是客观稳健的(用“自评估程序(bootstrap)”可复制性检验得出的结论)。东亚人群间的遗传学差异较小,有关历史文献也记录下了他们之间可能的许多次基因流动。所以此种进化树模型可能并不是描述中国的遗传学历史的最好模型,这与欧洲人群的遗传学分析所反复得出的结果一样。
该进化树的主要结构与以前用经典的非DNA遗传学标志得到的结果非常相似。它的根将非洲与非洲之外人群分离开来;所有东亚人群相互聚合,他们最近的遗传学邻居是美洲土著人群,其次是澳大利亚土著人群和新几内亚人群。这些结果与人类在澳大利亚和美洲的定居时间(分别是大约6万至5万年前和3万至1.5万年前)相符。中国南方人群的样本分布在三个遗传学相关的类群上,称为Sl,S2和S3。这些类群无论在居住于云南的少数民族的数目还是在各自的语言分布上均有不同;S2中仅有一支来自河南讲汉语的群体。
北方人群分布在两个类群N1和N2中。N1类群包括了六种阿尔泰语种样本、一种北方汉族样本和一种来自云南的汉族样本。N2类群包括了4个少数民族(其中仅有一个来自宁夏的少数民族是讲汉语的),从历史学上讲已经很明确是起源于北方。出人意料的是,它在进化树中与南方的S2类群相关联。储嘉佑等认为这可能是因为N2中抽样的人群更多地与南方人群相混合。但是只有有了更多的微卫星标志才能告诉我们N2-S2关联是否是错误的,拟或进化树并不是正确代表历史上相互严重混合的各民族的模型,
从储嘉佑及其合作者们的分析中我们能够得到什么结论呢?北方和南方东亚人的起源问题可以总结为三个不同的模型。第一种模型认为东亚人是从东北迁移到南方,然后与曾经居住在东南亚的“Australoids”(澳洲土著和巴布亚人)混合。这样就产生了(可能发生于三至五万年前)“混血的”南方东亚人。第二种模型则认为北方人是从南方东亚人进化而来的。而第三种模型认为北方和南方东亚人是分别独立地从更新世晚期(一万多年前)进化而来的。
这些模型从时间上考虑是可以相互一致的。第一种模型与中国的语言进化图是一致的。我们可以从它推断出中国北方以前是由说汉语和其他汉藏语人群统治的,而中国南方的某些部分则是由不同的说东南亚语族、南岛语族、苗瑶语族和傣语族的人统治的。后来,汉藏语系的人(在中国的周朝,约三千年前?)代替了中国南方的大多数其他语族家族,其过程与说印欧语系的人在欧洲的扩散一样。
第三种模型与考古学结论是一致的,它认为在中国至少有三个独立的农业和新石器文化发源中心。它们是在北方的仰韶文化,位于黄河中部,始于约八千年前,主要农作物是小米,并且饲养猪和狗;在南方沿海地区包括台湾在内的大坌坑文化,同样始于约八千年前,主要农作物是稻米;在长江下游的青莲岗文化,始于七千年前,也耕种稻米和饲养猪和狗。有趣的是,这些新石器文化的地理分布与目前汉族姓氏的地理分布是一致的。姓氏是非常有用而有效的“遗传学”标志,只通过男性传播和延续。在中国他们可以回溯到四千年前的夏朝(大约公元前2100年到1600年间),其中大多数远早于主要的北方入侵者。
最后,第二种模型与储嘉佑等的遗传学数据相一致。其它遗传学、齿骨和颅骨数据也支持这种假说,尽管它们与第三种模型是不一致的。差异可能出在它们涉及的时间跨度上。储嘉佑及其合作者们的结论认为“起源于非洲的现代人类组成了现代东亚人的基因库的绝大多数”,而试图证明直立人进化到解剖学上的现代东亚人的连续进化假说是错误的。其理论依据是他们的进化树提示了从东亚抽样的阿尔泰语系人种是从东南亚而不是从中亚进入亚洲的。我认为这种建议是正确的,但是由于缺乏来自中亚地区的样本使得它仍然像是一种工作假说。不论怎样,储嘉佑等人的研究是从生物学和文化学更深入地理解这个世界上最重要地区所迈出的不寻常的一步。
参考文献(略)