生物分类学的现代观点

发布时间：81年04月28日

R. Sokol 编译盛祖嘉胡嘉琪

我很高兴，今天再一次到这儿（复旦大学生物系）来作科学报告。我将在此给大家介绍现代生物系统学（biosystematic）几种思想发展的情况。因为分类学的内容很广泛，我仅着重于面上的介绍而不作深入的讨论。你们当中如果有人对某些专门问题感兴趣，需要深入了解的话，我愿意在报告后讨论时作详细的交谈。由于分类学内容十分广泛，我今天所要谈的主要是关于分类原则问题。但是首先要注意的是世界各地对分类的原则都不很重视的，而大量的工作主要是进行α - 分类学的研究。α - 分类学是用经典的方法来描述新种，我想在中国大概也是如此。然而根据什么原则进行生物分类和应当怎样进行分类对每个分类学家都是要接触的问题。

七十年代西方分类学家明显地可以分成三种类型即1. 表型分类学Phynetic Taxonomy 2. 系统分类学Phylogenetic（cladistic）Taxonomy 3. 进化分类学Evolutionary Taxonomy。

从一般意义上来讲表型分类就是根据生物之间的总体相似程度（overall similarity）来进行分类。系统分类学是根据进化过程中进化分支关（evolutionary branching）来进行分类的。进化分类是介于两者之间折中的。我希望大家对这两者的区别有所了解，相似性（similarity）是讲生物间相似程度而言的，不论其相似的原因是什么，相似可能由于由共同祖先演化而来，或者是适应同一环境形成。系统分类学只考虑两种是怎样的祖先演化而来的，不考虑两个种有多少相似，例如：A与B是由同一祖先D来的，因此A与B比之与C相近而不管A与B相似还是A与C相似。

进化分类学则将上述两方面混合起来，因为进化树（Evolutionary tree）和系统树（phylogenetic tree）是很相似的。例如A与B是由共同祖先C来的，因此在形态特征上可能是相似的，而D和E是由另一祖先而来的，因为D和E比起A与B相近似。同样的F与DE是由同一祖先而来的，因此与DE比之AB较为相近似。EF是系统相似。就我所了解这三类学派的代表者有：

1. 表型分类学者有P. H. A. Sneath（英）、R. R. Sokol（美）、P. H. Colless（澳）、F. J. Rohlf（美）

2. 系统分类学者有0. Hass（德）、G. J. Nelson（美）、J. C. Brainerd（丹麦）、J. S. Farris（美）

3. 进化分类学者有E. Mayr（美）、G. G Simpson（美）、Bock（澳）

称之数值分类学，这个领域是在1960年以来发展起来的，它冲击和代替了新系统学的观点，建立在数学的基础上和在计算机上进行分类，这就促使人们开始考虑如何着手分类，因为人们要在计算机上进行分类工作，而计算机是不会独立思考的，它是没有头脑的，因此人们必须事先告诉它做什么？和怎么做？人们必须预先考虑好分类的原则，一般地讲，分类学家自己在做分类工作时，是直觉地，不多加思索地进行分类的，而你要计算机如何分类时，你自己必须有一个明确的逻辑原则，虽然各个分类学家考虑的方法不同，但都一致同意要重新检验根据怎样一个原则来进行分类，这是很重要的。

下面我来谈谈不同分类学派是如何考虑分类问题的：第一个原则是多元分类（polythetic classification），每一个分类学家都同意分类必须是多元分类的。现在让我们看看下面的表格：

这是一个分类单位_性状数据矩阵（Date matrix）上面是分类群（Taxa）可以是种可以是属，也可以是其他分类等级，每一列为一个分类运算单位（Operational Taxonomic Unit简称OTU）的数据。为了简便起见，用二态性状（Binary charaters）即用+或-来表示。如果根据性状分群则第一OTU与第二OTU相似，第三个OTU与第四个OTU比较相似，所以1与2可以看作一类，3与4为另一类。

与多元分类相对的是单元分类（monothetic classification）它要求在某一类中至少要有一个性状或少数几个性状是一致的，如多元分类认为不一定要求每一个性状完全一致，只要大部分性状相似，总的来讲A中各个比起B群中的相似。

这就要追溯到分类的哲学概念中去，在一个单元中究竟要达到怎样的一致呢？这就要谈谈约翰牛（John Wisdon's cow）的例子来说明他的想法。John Wisdon是牛津大学著名的哲学教授，他对奶牛下了这样的一个定义：“奶牛是一种长四只脚的动物，可以产生奶”，如果战争时炸弹炸伤了，少了一只脚r而且不再产生奶了，这样，这个动物不具有四只脚，也不产生奶，根据定义来说就不是一头奶牛了，但大家仍说是一头奶牛，为什么大家说它仍是一头奶牛呢？因为其他许多特性和别的奶牛一样。其实许多分类都是根据多元分类的，除非在做检索表时用少数性状，任何一个搞分类的人对任何一个单位都常会碰到一些例外，例如昆虫有的具有二根刚毛，为A属的，有的具一根刚毛，为B属的，检索表中，在A属后面说明除……以外是常常遇到的，因此任何人都同意分类必然是在多元基础上的。也就是说根据许多性状相似来分类，也可能有几个性状不相似的。上述三个学派的考虑是不同的。表型分类是多元分类必然应用许多性状，进化分类只考虑少数性状，系统分类介于两者之间。为什么进化分类只考虑少数性状呢？因为这些少数性状是经过仔细选择的。认为这些性状最能代表进化关系。

另一种观点，是最近分类学中讨论最多的，即自然分类（Natural classification）也就是吉尔摩所说的原则Gilmer是剑桥大学著名的植物学家，Gilmer的自然分类群（natural taxa）是一个能够对生物作出最大估计（The largestic number prediction）的叙述（statements）。当你有一个分类群Taxon如果是自然的，那么许多性状都是趋同的，因此能对其性状作出最大的预测。假设我们有5 ~ 10个动物放在一起对每一个的性状要作许多叙述，如他们的毛怎样、皮怎样，结构……等叙述，如果现在有6个哺乳动物，5只鸟，5只昆虫，放在一起，作为一个分类群的叙述，则共同的多了，叙述的就少了。自然分类群内部必然是二致的，能够作出最大的预测，包含趋同的。第二个原则是加权（Weighting）下面让我来谈谈加权性状m，权意味着对某一性状要比另一性状或一些性状重要一些，或差一些。表型分类者认为不需要加权，因为分类是后验的（a posteriei归纳的）没有理由规定哪个性状比较重要，或许你认为不合理，你会觉得某一性状在区别哺乳动物和鸟类更为重要一些。这是因为你的脑子里已有了哺乳动物和鸟类的关系比较远的概念了，其实这种概念不是先验的（a Priori演绎的）而是从知识中得出来的，是后验的，分类的原则不应是根据先验来分类而是后验的。这样你就能发现新的东西，因此不能认为这个性状是重要的，那个性状是不重要的。表型学派认为不应当先验加权，系统分类学派则认为必须加权，进化学派也同样认为要加权，经典分类学家都把性状的重要性作不同看待的，一般分类时并不把性状写下来，但在脑子里已有了，而不自觉地在进行分类。最近有人在做实验，各个搞分类的人在看标本时，注意的着眼点在何处？不同的分类学家看同一标本注意也不相同。常常是不同的分类学家有不同的分类而争论，总认为我的分类要比你的分类好。这在各个水平都是存在的，各个人的思想活动不同，有个人的差别、有文化的差别，民族背景的不同。中国分类学家和美国分类学家在看同一标本，注意也不相同。这就是著名的Whorfion Hypothesis假说。语言的结构影响人们的思维，184 S年中国人是怎样看待外国人的，我不是用科学的语言而是用普通语言来描述不同人之间的差别，中国人看外国人首先是注意他的高鼻子，其实外国人不全是鼻子很高，其次是注意到头发是弯曲的，实际上外国人头发不都是弯曲的。外国人怎样看中国人？认为的头发梳成长辫子，眼睛和皮肤都很黄，因此用是彩色的幻灯片则表现出来的中国人的皮肤很黄很黄比实际还要黄，又见民族的偏见，文化因素对分类工作的影响。

第三个原则是关于分类假设Hypothesis是怎样的假说呢？系统学派认为分类是一种假说，物种起源的假说，表型分类学只不把分类看成是假设而看成是从许多现象中归纳出生物如何进化的，现在让我们来看看这三个学派的比较和其各自的优缺点：

一、表型分类的优点是客观的，可以重复。所谓客观的，是我做的分类你可以看，可以用我的记录，重复我的试验，你根据我的数据去分类所得结果是相同的，缺点是不同的方法，不同的数据得到的，结果不同。有不定因素还有非同源相似这是一个现代词包括趋同现象和平行进化现象的意义表型学派将性状的平行进化和趋同两种不同情况等同地看待了。

二、系统分类的优越性，是给人一个进化的假说。其缺点是有许许多多不同的假说。如果只有十个分类群，可以有二百万种不同系统排列方式。

三、进化分类学派和经典分类最最合拍，缺点是人为性太大，个人判断的因素起了很大作用。

对原则方面的问题上面已经谈了很多了。下面让我来谈谈技术问题。

分类技术的进展，在过去20年中分类学有两个重大的技术突破。

第一是生物化学分类学将生物化学方法应用于分类学工作中，在这方面有两个主要领域，即蛋白质进化和电泳，对这方面我不打算多讲，因为时间的限制，也不是我的专长，不是我的兴趣所在。蛋白质进化主要看氨基酸排列的顺序，电泳分析主要看蛋白质在电场的移动情况，Cohn教授在这儿已经讲了很多，在石溪分校Armheim教授也进行这方面的工作，另一技术进展是电子计算机的应用，这是我的兴趣所在，也是我的专长，现在搞分类的人，都应习如何应用计算机，现在让我们来看看数值分类的流程图。

分类研究工作由分类运算单位开始，列成OTU's一性状数据矩阵，然后计算每一对分类单位的总体相似系数，有关联系数相关系数和距离系数，1—2，1—3，1—4，2—3，2—4……然后将相似系数列成相似矩阵（三角矩阵），根据相似矩阵再归类，绘成一个表型图，或绘成一般的树谱图。另一方法是排序坐标法排序式坐标法相似系数按一维空间，二维或三维空间排列成为二维矩阵或三维矩阵。许多性状可看成许多维，我们没有时间讲解数学如何算，但我们可以把许多维用数学方法转换成2—3维表示两个对象的相似程度，最好是用距离来表示。

如果我们用三个坐标代表人的重量、高度和脸额的宽度，可在三维空间表示，每个对象可以按三个坐标在三维空间的点子代表，也可以用距离表示。

有三种归类方法：

1. 单连锁（Simple Linkage）2. 全连锁（Complete Linkage）3. 平均连锁（Average Linkage）

单连锁是在两点之间划一直线。新的点子参加这个群只要是在距离最短两点之间成一直线，举个例子来说，假使中美学会设想一个吸收会员的规则，任何一个人提名介绍，就可以加入，这很像单连锁方法。全连锁要吸收一个会员要每一成员全部参加讨论通过，才能参加，这像全连锁。平均连锁介于上述两种极端方法之间，单连锁和全连锁多用于特殊目的，而不用于一般分类，因此更合理的分类方法，是平均连锁，拿上面例子来讲，一个会员的吸收，不是一个人能决定，也不是所有会员来讨论才决定，而是大部分会员同意，讨论了就可以了，单连锁常连成一很松散的长线，全连锁每个成分很紧密但空间距离很大，平均连锁比较折衷，介于两者之间。

Caminalcules这种生物中国有没有？没有；美国也没有！是著名教授J. H. Camin设想出来的。因此叫Camin-alcoles。这个动物在数值分类学发展中起过重要的作用，因为他在1965年被用来数值分类的试验材料。

最后要讲一讲，电算机技术。

数值分类进展很快，20年前研究如何计算，进行数值分类，现在如何计算问题已经解决了，如何得到材料，如何将材料输入电算机自动扫描方法即分类性状扫描。