生物学中有大量的描述性数据——而且这些数据正与时俱增。大规模研究样品的方法如DNA排序、显微阵列和自动化基因功能研究,正在不断地充实着新的数据库。许多生物学分支学科,从生物力学到生态学已走向数字化,其结果是观察更精确、更丰富。
生物学领域现在面临的一个中心问题是:科学家能否从分子数据的洪流中推导出整个系统和生物体如何工作的总体图景。所有的信息需要加以筛选、组织、编排,而最重要的是要用一种方法加以联结,使研究人员能依据一般原理作出预测。
这样就进入了系统生物学(这一新的研究方法正在形成之中,目前还不能对其作出严密的定义),其目的试图把几十年来在分子层次、细胞层次、生物体层次,以至环境层次的观察中产生的星星点点的数据联接起来。这种研究方法的开创者们在寻求一种依靠数学、工程学和计算机科学使生物学更加定量化的途径,从而为连接各种分散孤立的发现构筑更坚实的框架。他们认为,这是生物学领域得以继续向前发展的唯一途径。他们还预期,生物医学尤其是对致病危险因素的破译将因而大大得益。
人类基因组序列的完成有力地促进了这个研究领域。作为长期艰巨努力的结果,人类基因组序列如今已是确凿无疑的事实了。人类遗传的生物化学原理已得到了解释并可加以量度了,这更将激励研究人员试图去使生命的其他方面也变得同样地可知可解。
分子遗传学家梦想的是能对控制基因的网络有一个同样的全面图像。比方说,他们想要弄清楚能解释单个DNA序列怎么会在不同的环境下表达不同的蛋白质,或使蛋白质的量发生变化的原因。细胞生物学家想要把调控细胞健康状况的分子所示踪的复杂的通信联系方式,还原成一组信号发送的规律。发育生物学家想要得到一个完整的图像来说明胚胎是如何导引数量不多的细胞,增殖到极大的数量,并具有骨骼、血液、皮肤组织等特化功能的。这些难解之谜只有发育生物学才能解答。对于试图弄清楚高级思维这样的大脑活动的神经科学家们来说,同样也是如此。而生态学家们为了认识生态系统变化,包括地球变暖,也需要找到把物理学数据和生物学数据整合起来的方法。
今天,系统生物学家所涉及的还只是比较简单的网络。他们已在酵母体内弄清楚了降解半乳糖的代谢途径。还有一些人追踪了海胆等生物胚胎发育的最初几个小时,以观察不同的转译因子是如何在不同时段改变基因表达的。此外,研究人员还研制了细胞和简单的大脑电路信号发送网络的初级模型。
这一学科的进步由于把生物学样式译成计算机模式存在的困难而受到限制。网络的计算机程序本身是较为简单的,而如何用研究人员能理解的方式来描述结果,则还需改进。世界各地的研究机构现正在集合有生物学家、数学家和计算机专家参加的跨学科研究组来帮助促进系统生物学的发展。但这还刚刚起步。
加强跨学科研究和提高计算机功率究竟能否使研究人员构造出一幅显示生命活动如何进行的完整图像,目前尚无人知晓。