结构生物学本周迎来一件幸事。美国国立全科医学研究所(NIGMS)选择了7个研究机构作为结构基因组学的初步研究基地——应用机器人和高级计算机来计算出大量蛋白质的结构。此项总额为1.5亿美元的5年计划项目旨在加速蛋白质的原子水平的三维结构的确定,将使有关制药公司对他们想要开发的蛋白质有详细的了解,从而促进新药的发现。
该项目之所以得到资助是因为人们广泛认识到人类基因组计划和类似的基因测序项目仅仅是理解生物学和疾病的第一步。尽管基因包含和储存了细胞内的遗传学信息,细胞内化学功能的绝大部分却是由蛋白质完成的。遗传序列决定了它们编码的蛋白质中氨基酸的排列顺序,但是链状的蛋白质分子一般还要折叠成不能预测的三维结构。有幸的是,蛋白质往往会类聚成一些三维结构大致相似的家族,或者称之为“折叠”(fold)。通过对每个这些折叠的实例研究,结构基因组学研究者们希望识别出一些模式,通过利用计算机模型来从它们的氨基酸序列预测未知蛋白质的形状。
纽约结构基因组学研究协作组(NYSGRC)的成员之一、纽约洛克菲勒大学的一位蛋白质模建专家安德烈伊 · 萨利(Andrej Sali)说,这是一桩相当安全的赌注。利用据估计800种不同的已知蛋白质折叠,萨利和他的同事们已经能够对20万种蛋白质中的至少一部分建立计算机模型。
美国国立卫生研究院的官员们希望在今后10年中至少能确定1万种蛋白质的结构(那只是对据认为100多万种自然存在的蛋白质的一种肤浅的认识)。
但是,它将标志着结构生物学家们进行新发现的一次浪潮,他们在过去40年中总共只解决了大约2000种独特蛋白质的结构问题。人们还希望这项将要进行的蛋白质结构的大批量解析将揭示据估计自然存在的1000至5000种蛋白质折叠中的大部分。
这些研究中心,都是由一些来自大学、国家实验室和公司的研究机构组成的协作组织,计划采用各自略有不同的研究线路来得到蛋白质结构。例如,一个由新墨西哥州洛斯阿拉莫斯国家实验室的汤姆 · 特维黎格(Tom Terwilliger)领导的中心——结核杆菌结构基因组学协作组正在计划针对一种导致结核病的生物——结核分支杆菌进行他们的结构研究工作,希望寻找该病的新疗法。与此同时,纽约结构基因组学研究协作组则将采用一种更为多样化的方法,试图针对从抗生素耐受性到胆固醇代谢等不同的情况提供新的研究线索。
在今后5年中,每个中心将得到大约2000万美元,具体数目视参与项目的中心所付出的成本而有所不同。但是他们今后还会得到更多的经费支持。
[Science,2000年9月29日]