代谢物数据库的成功建立激起了研究人员更大的兴趣,目前他们正致力于向既有深度又有广度的资源信息库进军

  1998年,当“代谢组学”(metabolomics)这一新术语出现时,并没有引起研究者的广泛注意。然而最近,在分析化学研究的支持下,这一领域(“代谢组学”)――侧重于细胞、组织或生物体中整套的小分子代谢物――明确了新的定位:2008年有500余篇论文提到“代谢组学”一词。随着光谱数据、浓度、化学结构及更多信息大量增长,该领域急需一种处理和分享信息的快捷方式。
  加拿大阿尔伯特大学的计算生物学家戴维·威沙特(David Wishart)说:“人类代谢组学领域还没有一个数据库,如果有新的代谢物被发现,就无法汇集保存下来。”他决定建立一个数据库。

初建人类代谢组数据库―HMDB

  2004年,在加拿大创新基金会和加拿大基因委员会(Genome Canada)共同资助下,威沙特开始建立人类代谢组数据库(the Human Metabolome Database,HMDB),HMDB是加拿大基因委员会人类代谢组计划(Human Metabolome Project)中的一部分。他们建立了一支由光谱学家、有机化学家、医生和生物信息学家组成的团队,花费了两年时间,从文献、数据库和各自的实验结果中,收集代谢物数据。这是一项极为艰巨的工作,除了要识别人体内所有可检测的代谢物,HMDB还要确定这些代谢物的结构和浓度。“这是一个非常艰难的过程,”威沙特说,“它可不是一件能够轻易简化或自动化的事情。”
  2006年底,HMDB代谢数据库在网络上免费公布。2007年,威沙特和他的同事们宣布,该数据库与同期的热点论文发表在《核酸研究》(Nucleic Acids Research)上,他们还邀请了许多学者来使用数据库首期收集的2180多种代谢物条目。

威沙特领导的小组完成了人类代谢组的首个草图

  随着不断更新和附加数据库的加入,HMDB资源的信息量已增长了好多倍,为研究癌症、消化系统疾病、糖尿病肾病(diabetic nephropathy,一种常见的糖尿病慢性并发症,是糖尿病致死、致残的主要原因之一。其发病机制复杂,目前尚缺乏有效的治疗手段――译者注)及其病理学提供了重要信息资源。
  尽管HMDB增长迅速,但研究人员发现,它仍无法满足人们对这一领域的巨大需求。加州大学戴维斯分校的代谢组学理事会(the Metabolomics Society board of directors)成员奥利弗·费恩(Oliver Fiehn)说:“HMDB是一个很好的开端,但它离我们要去的地方还很遥远。”

人类代谢数据库(左)METLIN代谢组数据库(中)丙氨酸和天冬氨酸代谢路径图(右)

升级版的代谢组数据库―HMDB 20

  如今,HMDB总共获得810万美元的资助,收集了7100多个代谢物条目,被100多篇论文所引用。从2007年初至今,它的月点击数已经翻了一番,从每月约5万次上升为每月10万多次。
  2009年1月,HMDB 2.0向公众开放。其更新内容包括附加的数据信息,60张手绘的超链接代谢图谱,还有新的浏览工具――疾病浏览(Disease Browse),用户可查看疾病表格来找到相关的代谢物。威沙特说,数据库最受欢迎的地方在于它能部分或全部下载。”
  乔治亚理工学院的艾德里安·新垣(Adrian Arakaki)说,HMDB是一个“至关重要的”资源。在最近一次实验中,新垣和他的同事利用HMDB来确定人类代谢物的正常浓度,并与白血病细胞中那些代谢物的预测水平进行了比较。
  在意大利佛罗伦萨大学的磁共振中心,伊瓦诺·贝尔蒂尼(Ivano Bertini)和他的同事利用这一数据库,做了一个关于脂泻病(celiac disease,CD,患者不能食用小麦和黑麦,其中的蛋白质会损害小肠内壁细胞,大大影响到消化和吸收脂肪的功能,病人还可能出现脂肪痢――译者注)的代谢组学的研究。为研究糖尿病的苏巴马尼安·帕纳瑟(Subramaniam Pennathur)和他的同事从患病老鼠的尿液中分离出指数升高的代谢产物,然后根据它们的分子量从HMDB中查找它们的身份。帕纳瑟说:“数据库中列出的大部分代谢物可以被我们找到。”

努力涵盖其他物种信息

  HMDB在信息深度上引以自豪,每一代谢物均有90个不同的数据条目,但它缺乏广度,因为它仅限于人类的代谢产物。位于剑桥的欧洲生物信息学研究所(EBI)的克里斯托夫·斯坦贝克(Christoph Steinbeck)说:“据估计,人类的代谢组大约有成千上万种代谢物,而微生物可能有2万种,植物可能有20万种。”费恩补充说,人类的消化道中有多达一公斤的微生物,而这些却没有体现在HMDB中。他还说,研究者需要一个集中式的数据库,应该包括那些其他生物体。
  有些国家已开始应对这一挑战。最近,美国国立卫生研究院(NIH)资助药物反应表现型代谢组学网络(the Metabolomics Network for Drug Response Phenotypes)项目,它由代谢组学理事会的创始人和前任会长、杜克大学医学中心药物代谢组学中心主任里马·K·道克(Rima K Daouk)领导,并与威沙特进行合作。目前该网络正在开发一个临床药物试验数据管理系统,该系统可以连接到HMDB,道克说:“这项工作正在进行中。”
  欧洲一些国家也致力于发展广泛的数据库,其中最大的是地处荷兰莱顿市的荷兰代谢组学中心(the Netherlands Metabolomics Centre)。它于2008年1月创建,政府、工业界、学术界已为该中心投入了6700万美元。按照中心主任托马斯·汉克梅尔(Thomas Hankemeier)的设想,该中心计划建立若干个储存和检索代谢物信息的数据库。
  最近,斯坦贝克还领导开展了一项研究计划,旨在开发一个集中式欧洲数据库,其中包括微生物、植物和模式生物的代谢产物。研究人员拥有“局部的资源”,斯坦贝克说:“但是仍然缺乏一些大的、集中的、良好的资源。”
  威沙特同意这些说法,他说:“我们的最终目标是,创建一个与HMDB一样有深度但又涵盖了所有其他重要类型生物体的数据库,这样我们就有了一个真正广泛、真正有用的资源。”

资料来源The Scientist.com

责任编辑 绍 衡