长期以来,化学除了在化学计算中要用到一些算术和初等代数外,它与数学几乎是绝缘的,化学动力学倒是用得着微分计算、然而动力学是化学物理。
但现在数学方法已深入到纯化学领域之中,并在很多方面已有了令人意想不到的应用:如图论有助于研究分子结构,母函数可用于计算同分异构体的个数,而要搞清分子结构的复杂性则信息论数学方法就可大显身手了。
不只是化学上的概念
我们先从一道智力游戏题开始说起。
已知:有三个黑圆盘,八个白圆盘和一个灰圆盘。想把这些圆盘组合为某种图案,但必须满足以下条件,即黑盘——必须有其他四个圆盘与它相邻,白盘——与另一个相邻,灰盘——与另外二个相邻,问这样的图案是否存在?若存在,能有多少种?
回答是肯定的,而且还不止一种。
在我们进一步想告知这将与化学有关之前,有些读者可能想象不到这些图案所表示的正是某些有机化合物:丙醇、异丙醇、甲乙醚。只要把黑盘看作为碳原子;白的——氢原子;灰的——氧原子就行,这三种化合物就称为同分异构体,即它们的分子是相同数量的相同种原子按不同的联结方式而构成的。
然而同分异构这一结构上的概念不只在化学上有用,比方说,由相同元件但按不同组合方式结合的那些无线电电路图;具有相同子力但却拥有不同棋势的那些象棋棋局等都可称为同分异构体。这一切均取决于组成结构元素的分布性质与元素间联系之有无。
在数学上也有相类似的问题。这些问题的第一个是:有一定数量的元素,并确定了每个元素与其他相邻元素的联系数,问这些元素能形成某种结构否?
哥尼斯堡七桥问题
哥尼斯堡(现名加里宁格勒)的布勒格尔河两岸与河中间的岛之间总共架有七座桥,这就引出当时杰出的数学家欧拉考虑起这么一个独特的数学问题来:能否把这七座桥全走遍,但又不许在同一桥上通过二次?
在1736年出版的著作中欧拉对这一问题作出了详尽解答,在解答中提到的不只是哥尼斯堡桥,而且还涉及一种图形,它是由一定数量的点(顶点),经一些线段(边)相联而成的。欧拉证明了,任何这种图形,只要其奇顶点(即连结该点的边总数为奇数的点)的个数不超过2,则所有这些边都可全走遍,而且不需要其中任何哪条边通过二次。布勒格尔河上的七架桥可简化成图2(这里边代替桥),由图2可知A,B,C,D均为奇顶点,其个数(4个)超过2,不具备欧拉条件,所以其解答是否定的。
欧拉的著作开创了一门新学科——图论。但在以后的百年中却没有什么进展。直到上世纪中叶图论才开始兴盛起来,这一数学方法才开始应用于电路、结晶模型、分子结构等的研究。
英国数学家凯莱对图论作出了很大贡献。有趣的是,吸引他到图论上来的不是数学,而是化学。他研究n个碳原子数的饱和烃CnH2n+2,同时他又特别注意一类称为树的特殊图,在这种图内边的线路是不允许封闭或循环的。而饱和烃分子内的原子间的联结恰好也是这样的。
树的概念,作为纯数学的研究对象,在经若干年之后由法国数学家Жордан作了进一步的研究。但他却完全没有料想到他的研究竟开创了现代化学。英国数学家Сильвеcтр首次以现代概念引进了“图”这一术语。
图论的第一个基础工作只在本世纪才实现。匈牙利数学家Кениг在1936年出版了一本专著“有限与无限图论”。
图论的应用范围是无可限量的。历史学家欲画出某王国朝代的家谱树;工程主任想制定建筑工程方面的网络图等,他们都会不由自主地画起图表来。
图论一开始就显示出其应用性,这甚至在其术语中就可察知:如“循环比赛”,“树”,“色”,“握手引理”,甚至“婚礼问题”等——而这不过是其中的一小部分。
现在图论又有了新发展,它的方法已渗透到某些数学学科(如拓扑、集论、博弈论、矩阵论)和应用研究中;没有它,要解决诸如计算替续器——接触线路图、铁路网等任务是不可想象的。
但回复到这门学科本身的发展初期,当时从事它的研究的只有数学家和化学家。
对于任意图,数学家提出这样一个问题:能否走遍所有条边,但又不许在其中任何哪条边上通过二次?把它看作由一些原子组成的某种分子图,化学家们观察到,其结构的变体可能有多种。
但有多少呢?问题绝非随意提出的。当合成某种化合物时,随之可以有多种同分异构体产生。它们越多,从副产物中分出所需产物就越复杂,所需产物的收率就越低。
数学家们可以为化学家们所关心的关于其同分异构体的种种组成与数量的物质存在的问题赋予一种清晰的形式。必须制定一种规则,根据它每个所给的原子集合应能相应提供由它们组成的结构个数,如果此数为零,则不能由这些原子组成分子。如果为一,则可能且仅有一种形式。如果此数超过一,则可以存在由这些原子组成的分子——同分异构体。
正如凯莱研究的那样,我们也试着计算在已知碳原子数为n时的CnH2n+2烃的同分异构体个数。
交叉路上的小球
这一节也先从一图形开始(见图3)。
可设想,它的边是一小槽,小球沿着它们从上滚到下面。图中的点按其分布给予编号。
提这么一个问题:如果一个小球由0点滚落至D点,那么小球有多少条途径可走?不难理解,小球由0点至D点的任一条途径,都需要向右拐二回,向左拐三回弯。若规定向左拐为1,向右拐记作0,则所有可能的途径就表示为下列0与1的“组合”:11100,11010,11001,10110,10101,10011,01110,01101,01011,00111。
但这种计算法是很使人乏味的,我们需寻找出简单一些的解题途径。
请看表示式(x0+x1)(x0+x1)(x0+x1)(x0+x1)(x0+x1)。彼此相乘,展开之,可以看到,在未知数x的0和1次幂的各项乘积中有:x1x1x1x0x0,x1x1x0x1x0…等存在,简言之,这与上述的0和1的“组合”是一样的,因而它们也正好表达了小球从0点滚至D点的所有可能存在的途径。
所有这样的乘积不难简化:它等于x3。因此,途径的所求数可由展开项中x3前的系数来表示。设x0=1,x1=x,则括弧的长链就紧缩为(1+x)5。
在第五行中的其他点的计算类似地有:4点(k=0),只有一条途径;B点(k=1),—5条;C点(k=2)——10条;E(k=4)——5条;F(k=5)——又只有一条途径可走了。
新的解法是简单而又有效的。我们可再详细地探讨一下。
我们想计算图中从0点滚落至另一点的途径数,可以作一函数,把它按变量的幂乘展开,在这多项式中我们就可求得变量相应幂前的系数。
此函数就称为母函数。在相类似的数学问题中,当从一系列自然数中的每一个要求相应一个定数时,数学家们就经常采取我们所使用的方法——力图借助于母函数求解。他们使该函数按变量幂展开为有穷或无穷数列(第二种情况数列就称为幂级数);给定某个自然数,他们就在数列中寻找相应的幂指数,而带这个幂的变量前的系数即为所求。
巧妙而又有效的母函数方法常对从事数论或概率论的专家们有帮助,有时他们很快就可从中找到解答,而用其他办法却是不易奏效的。
著名的匈牙利数学家Пойа在提出此方法时曾写道:“母函数在某种程度上可理解为一种类似口袋的结构。要搬运很多小物件,可能会有困难。但可把它们放进口袋,这时我们就只需搬动一样东西——口袋就够了。完全相同,我们把要照顾到的序列a0,a1,a2,…an…的各项集合起来组成一个幂级数∑anxn,这样我们就只需注意这一个幂级数就够了。”
当凯莱试图计算碳原子个数为定值时全部饱和烃即所有带分子式CnH2n+2的同分异构体时用到了母函数。但他没有明确地表达出母函数形式,只是指出,它是一个十分复杂方程的解。
不知遂函数的明显表达,光有这么一个方程,是不那么容易把它展开成幂级数的。但究竟比具体在纸上写下分子结构式,然后再数它们的个数要简单多了。开头倒是不算复杂的:如果在烃分子中只包含一、二或三个碳原子,那么这三种情况的结构都是唯一的[图4(a)] 。(这里不画出氢原子,照样可以知道。只要记住,黑点必须在它周围连结四个邻点。)
四个碳原子可以由二种不同方法联结:链状和T状。这是丁烷的同分异构体[图4(b)] 。己烷(分子内有六个碳原子)的同分异构体就有5个了[图4(c)]。
越往后同分异构体个数就越急剧上升:C10H13烃有75个;C25H52——不多不少,有36,797,588个。
对于饱和烃分子同分异构体的计算绝不是可提出的唯一课题。可以细心地把己烷同分异构体的结构式系列从左向右地好好研究一下:为什么它们要按这样的顺序排列?大概您的问答会是这样的:分子排得越右,其分支就越多。
分子的分支性不是抽象的、形式上的,它有很深刻的现实意义。譬如,组成汽油的烃分子分支越多,该燃料的辛烷值就越高。
大概不需要证明,在理论上就可计算出热效率的方法是多么重要吧!但对这必须学会用数字来表示如分子的分支性这样的分子性质的特征。这能做到吗?又如何做呢?
立方块,硬币,骰子…
抛掷一块所有面都涂上白色的立方块,并说:“他能便白面向上。”这种信息是毫无意义的。图为不用扔掷立方块我们照样也能知道,向上的面总是白色的。但扔掷在各面上表有数字的立方块——骰子就是另外一回事了。当扔出六点时就为我们提供了一定的信息:须知在未扔掷骰子之前我们对此是一无所知的。如果另外还有一个信息:“硬币扔掷后国徽一面向上。”那么这二种哪个信息大些?
信息的度问题首次产生于通信论。
必须估计,有多少可得到的信息适合于接收者呢。换言之,信息的哪些部分到达接收者,又有多少由于各种干涉而在通信道中丢失了呢?
控制论奠基人之一——仙农为这一问题提供了有效的方法。他是这样思考的。假定,有某个事件集合,其概率为P1,P2,…Pn。如何定量地测定在这一系列中某个事件到来的信息呢?
仙农事先把欲求度量加以某种足够明显的限制。第一,如果某个事件的概率改变一个不大值,则到达事件的信息度也只有一个不大的变化;其次,如果所有事件的概率相等,那么其中之一的到达信息度必然随着事件数的增加而单调地增长(换言之,事件越少,有关它的信息就越珍贵);第三,如果发生几个事件,则有关信息的总度量应为各个事件信息(可能带有某个系数)度量之和。
这样,按照我们这样的度量信息方法。确定,扔掷骰子的结果其熵要比掷硬币大1.58倍。
为了说明我们所掌握的仙农公式在化学上的应用,可举一个不太复杂的例子。我们提出具有C2H6组分的环烷烃同分异构体一一环辛四烯和双环辛三烯。
这里黑圈表示碳原子,白——氢原子。
在第一个同分异构体中所有碳原子相互都绝对等价,可以互换的。拆散所有圆圈并把它们放进一个口袋里。现从口袋里随机地摸一个圆圈出来 · 总共有16个圆圈:8黑和8白。即我们能摸出黑圈的概率为1/2,白圈出现的概率同样是1/2。把此值代至仙农公式,得出H=1。
第二个同分异构体却是另外一种情况了。这里对于每个碳原子只能找到唯一的一个与其等价(因为原子的等价性还取决于它在分子中的地位),对每一个氢原子也只是一个与其等价。所以我们对它们还标上各种字母。
如果现在重复多次地把圆圈从口袋中摸出来,那么出现不同的破原子事件为8,它们中每一个概率为1/8,由仙农公式得出H=3。
其结果比上一个的增加2倍。这就可知道,第一个分子在结构关系上明显地要比第二个贫瘠、单调。
有某些不同,但却是由此原则出发的方法不久前由Д. Бончев(保加利亚)和Н, Тринайстич(南斯拉夫)共同提出,它可估算非环烷烃的分支度(其图为树)。这里所有一切均从对每个同分异构体制成的差别(距离)表开始。表的行与列用图中点的号码标记,二点号码的交叉点为使它们分离的边数。
我们现作出丁烷同分异构体的表格。
仔细观察一下作图结果,可发现是有明显不同的。表中不分支的同分异构物有边数3;而对有分支的仅包含1和2(不计0,它们组成对角线,把表平分为二)。
现可计算一下,我们能以什么样的概率由相似的表中取出各种数字。为此需充分地观察由零对角线把表对称地平分成两半的那二个三角形元素。
在不分支的表中的三角形由6个元素——3个1,即1的概率为1/2;取出2的概率为1/3;取出3的概率为1/6。
将这些值代入仙农公式得H=1.46。
类似对于分支同分异构体计算得H=1.00。
因此,分支越多,其结构的“仙农”度量就越低。
为了验证一下对己烷同分异构体的预言。计算出的数均写在每个同分异构体结构式的下面[见图4(c)] 。
假定现已明确了:讨论分子的分支性可按所得的度量高低而定。它就很好地与我们直观定性地估计其分支性相符合,当直观已分辨不出时,公式却能得到明确的结果。我们可以说,不采用计算,是不大好判定己烷最后二个同分异构体的分支性大小的。公式指出,五个结构中有最大分支性的正好是位于系列最后的那一个。
(当然,相类似分子的分支性数字指标相差是不大的,因而直观地去估计它们是困难的也就不奇怪了。)
当以数字计算代替直观判断时,它们可使专业人员较有把握地去制定研究规划,从而使其避免可能出现的盲目性。
特别有吸引力的是学会预测药物、阻抑或兴奋物品的生物活性。问题在于,目前选择这种物质是带有盲目性的:在找到一种适用的之前,需要试验成千种化合物,如果专业人员把各种化合物的结构式写在纸上后,能以很大的可能性指出:这种物质可医好哪种病;那物质又可治愈哪种病,则可节省多少人力物力呢!
不久前拉脱维亚共和国科学院有机合成研究所的工作者提出了解决相类似问题的有趣方法。该方法是基于分子图与电路图的类比上,并采用了电子计算机。
关于数学与化学相结合的叙述可能给读者以这么一个印象,似乎只是数学给予化学以定量计算的有效方法,而化学又给数学什么呢?它使那门有关形与数的学科丰富起来了吗?
尽管这种例子很少,但毕竟还能对所提出的问题给以肯定的答复。应该记得,在图论中出现树的概念正是由于凯莱在研究饱和烃各种不同同分异构体的结构过程中提出来的。更明显的是,在卅年代中期Д. Пойа在各种科技杂志上发表了一系列有关计算同分异构体个数的论文。最后一篇论文发表在1937年《数学学报》上,其标题为《对于群、图及化学化合物数字化的组合计算》。由于化学引起了数学的研究,Пойа才奠定了后来以他名字命名的基础理论。而在1973年作为Пойа成果的进展Ф. Харари和Э. Палмерa写出了一部巨著《图的例举》——这已是纯数学内容了。
化学真正深刻的数学化,实际上仅只是开始,可期望,化学家们仍需给数学家们(或许数学家本身就是化学家)提出问题。这些问题不仅要求运用已知的数学概念与手段,而且还要开创对数学家来说在原则上是新的各种方法。
[《科学与生活》(俄),1984年8期]