绘制人类代谢组图

发布时间：12年08月09日

编译石磊

代谢物数据库的成功建立激起了研究人员更大的兴趣，目前他们正致力于向既有深度又有广度的资源信息库进军

　　1998年，当“代谢组学”(metabolomics)这一新术语出现时，并没有引起研究者的广泛注意。然而最近，在分析化学研究的支持下，这一领域(“代谢组学”)――侧重于细胞、组织或生物体中整套的小分子代谢物――明确了新的定位：2008年有500余篇论文提到“代谢组学”一词。随着光谱数据、浓度、化学结构及更多信息大量增长，该领域急需一种处理和分享信息的快捷方式。

　　加拿大阿尔伯特大学的计算生物学家戴维·威沙特(David Wishart)说：“人类代谢组学领域还没有一个数据库，如果有新的代谢物被发现，就无法汇集保存下来。”他决定建立一个数据库。

初建人类代谢组数据库―HMDB

　　2004年，在加拿大创新基金会和加拿大基因委员会(Genome Canada)共同资助下，威沙特开始建立人类代谢组数据库(the Human Metabolome Database，HMDB)，HMDB是加拿大基因委员会人类代谢组计划(Human Metabolome Project)中的一部分。他们建立了一支由光谱学家、有机化学家、医生和生物信息学家组成的团队，花费了两年时间，从文献、数据库和各自的实验结果中，收集代谢物数据。这是一项极为艰巨的工作，除了要识别人体内所有可检测的代谢物，HMDB还要确定这些代谢物的结构和浓度。“这是一个非常艰难的过程，”威沙特说，“它可不是一件能够轻易简化或自动化的事情。”

　　2006年底，HMDB代谢数据库在网络上免费公布。2007年，威沙特和他的同事们宣布，该数据库与同期的热点论文发表在《核酸研究》(Nucleic Acids Research)上，他们还邀请了许多学者来使用数据库首期收集的2180多种代谢物条目。

威沙特领导的小组完成了人类代谢组的首个草图

　　随着不断更新和附加数据库的加入，HMDB资源的信息量已增长了好多倍，为研究癌症、消化系统疾病、糖尿病肾病(diabetic nephropathy，一种常见的糖尿病慢性并发症，是糖尿病致死、致残的主要原因之一。其发病机制复杂，目前尚缺乏有效的治疗手段――译者注)及其病理学提供了重要信息资源。

　　尽管HMDB增长迅速，但研究人员发现，它仍无法满足人们对这一领域的巨大需求。加州大学戴维斯分校的代谢组学理事会(the Metabolomics Society board of directors)成员奥利弗·费恩(Oliver Fiehn)说：“HMDB是一个很好的开端，但它离我们要去的地方还很遥远。”

人类代谢数据库（左）METLIN代谢组数据库（中）丙氨酸和天冬氨酸代谢路径图（右）

升级版的代谢组数据库―HMDB 2．0

　　如今，HMDB总共获得810万美元的资助，收集了7100多个代谢物条目，被100多篇论文所引用。从2007年初至今，它的月点击数已经翻了一番，从每月约5万次上升为每月10万多次。

　　2009年1月，HMDB 2．0向公众开放。其更新内容包括附加的数据信息，60张手绘的超链接代谢图谱，还有新的浏览工具――疾病浏览(Disease Browse)，用户可查看疾病表格来找到相关的代谢物。威沙特说，数据库最受欢迎的地方在于它能部分或全部下载。”

　　乔治亚理工学院的艾德里安·新垣(Adrian Arakaki)说，HMDB是一个“至关重要的”资源。在最近一次实验中，新垣和他的同事利用HMDB来确定人类代谢物的正常浓度，并与白血病细胞中那些代谢物的预测水平进行了比较。

　　在意大利佛罗伦萨大学的磁共振中心，伊瓦诺·贝尔蒂尼(Ivano Bertini)和他的同事利用这一数据库，做了一个关于脂泻病(celiac disease，CD，患者不能食用小麦和黑麦，其中的蛋白质会损害小肠内壁细胞，大大影响到消化和吸收脂肪的功能，病人还可能出现脂肪痢――译者注)的代谢组学的研究。为研究糖尿病的苏巴马尼安·帕纳瑟(Subramaniam Pennathur)和他的同事从患病老鼠的尿液中分离出指数升高的代谢产物，然后根据它们的分子量从HMDB中查找它们的身份。帕纳瑟说：“数据库中列出的大部分代谢物可以被我们找到。”

努力涵盖其他物种信息

　　HMDB在信息深度上引以自豪，每一代谢物均有90个不同的数据条目，但它缺乏广度，因为它仅限于人类的代谢产物。位于剑桥的欧洲生物信息学研究所(EBI)的克里斯托夫·斯坦贝克(Christoph Steinbeck)说：“据估计，人类的代谢组大约有成千上万种代谢物，而微生物可能有2万种，植物可能有20万种。”费恩补充说，人类的消化道中有多达一公斤的微生物，而这些却没有体现在HMDB中。他还说，研究者需要一个集中式的数据库，应该包括那些其他生物体。

　　有些国家已开始应对这一挑战。最近，美国国立卫生研究院(NIH)资助药物反应表现型代谢组学网络(the Metabolomics Network for Drug Response Phenotypes)项目，它由代谢组学理事会的创始人和前任会长、杜克大学医学中心药物代谢组学中心主任里马·K·道克(Rima K Daouk)领导，并与威沙特进行合作。目前该网络正在开发一个临床药物试验数据管理系统，该系统可以连接到HMDB，道克说：“这项工作正在进行中。”

　　欧洲一些国家也致力于发展广泛的数据库，其中最大的是地处荷兰莱顿市的荷兰代谢组学中心(the Netherlands Metabolomics Centre)。它于2008年1月创建，政府、工业界、学术界已为该中心投入了6700万美元。按照中心主任托马斯·汉克梅尔(Thomas Hankemeier)的设想，该中心计划建立若干个储存和检索代谢物信息的数据库。

　　最近，斯坦贝克还领导开展了一项研究计划，旨在开发一个集中式欧洲数据库，其中包括微生物、植物和模式生物的代谢产物。研究人员拥有“局部的资源”，斯坦贝克说：“但是仍然缺乏一些大的、集中的、良好的资源。”

　　威沙特同意这些说法，他说：“我们的最终目标是，创建一个与HMDB一样有深度但又涵盖了所有其他重要类型生物体的数据库，这样我们就有了一个真正广泛、真正有用的资源。”

资料来源 The Scientist.com

责任编辑绍衡