为什么许多孪生子女对疾病有着不同的敏感性,DNA序列是重要的,但基因活性在应答环境中如何被调节也同样重要——
基因组的DNA顺序就像一首交响乐的总谱,为了正确地把它演奏好,各种细胞还必需识读覆盖在基因组上的另一种音符——后成学密码。目前全世界正在致力于解读这种密码。
一段时间以来,马尼尔 · 埃斯特尔(Manel Esteller,下图)的电话应接不暇。那是在205年的夏季,他领导的西班牙马德里国家癌症中心的科研小组发表了关于一对孪生子女DNA活性的比较研究报告。来电话的人毫无例外的都是孪生子女,他们的同胞兄弟已经发生了癌症和糖尿病之类的严重疾病。他们问,这项研究能够预测是否他们也会在劫难逃?他们拥有与他们罹病的孪生者同样的DNA序列,是否意味着他们就有同样患病的遗传倾向呢?
令人吃惊的是,答案是并不一定会。多年来研究人员已经确认,尽管他们拥有的基因相同,孪生子女却可能拥有很不一样的身体构造,患不同的病。对此的传统解释是:我们身处的环境以某种方式与我们的基因相互作用而产生我们身体的性状或称表现型,但是无人确切地知道为何这样。
埃斯特尔小组所作的研究显示,先天生成与后天养育之间缺失的联系环节可能存在于一种称为后成论的现象之中,这是一种书写在人类基因组DNA序列上的神秘的化学和物理密码。“后成论”一词最初于1940年由英国胚胎学家和遗传学家康拉德 · 沃丁顿(Conrad Waddington)在描述“基因与其所处环境的相互作用提出(杜撰)的,从而导致表现型的形成。现在这个名词意指影响基因活性却不改变DNA序列的额外的指令层。
通过研究80对年龄从3岁到74岁之间的孪生子女,埃斯特尔研究小组发现,“后成”差异在最年轻孪生子女身上很难检测到,但是会随年龄增长而日趋明显。这些变化对基因活性有显著影响:50岁孪生子女身上活性差异的基因数量是3岁孪生子女的3倍以上。埃斯特尔指出:“因此我们并不只是我们的基因,不仅DNA序列是重要的基因活性在应答环境中如何被调节也同样重要。这或许可以解释为何许多孪生子女会对疾病有不同的敏感性。”
定位差异位置
解读后成密码不仅可提供有关孪生子女的答案,而且还有望极大地改变我们对广大人群的疾病的认识。例如,多种癌症可能是由后成缺陷引发的,它还将填补我们有关环境如何影响生物体构造的理解上的不足——如后成变化能解释仅仅改变怀孕鼠的饮食就可以完全改变其幼仔毛皮的颜色,甚至改变它们对环境压力的反应也会为此。
英国剑桥桑格研究所免疫学家斯蒂芬 · 贝克(Stephen Beck)曾从事过人类基因组工程研究,他说:“这将阐明生物学中某些最深层次的问题。”他认为,一个特定细胞如何在一定的时间和空间执行其独特的基因组学程序,不仅可阐明发育和疾病的原因,而且还可阐明是什么成就了我们人类。
人类基因组完整的后成密码,即后基因组,近10年来逐渐地成为研究的焦点,现在科学家正在着手拟定一项雄伟的规划以破解其中的奥秘。1999年贝克的研究小组率先提议组建国际人类后成基因组学工程(IHEP),这是继人类基因组工程(HGP)之后的一个合乎逻辑的步骤,HGP于201年公布了人类基因组30亿个DNA字母的粗略排列图谱。然而IHEP面临艰巨的挑战。人类基因组序列在所有细胞中都是以一样的形式存在,而后基因组在这一组织与另一组织之间则有差异,并且因细胞所处环境的影响而发生改变。研究人员真的能够确定这种庞大、复杂且不断变化的密码的意义吗?
聪明的包装
如果基因组原DNA序列像交响曲的乐谱,那么后成基因组就像表明乐曲的音符该如何演奏春天的逗号、句号和升降号。基因表达的后成学控制以两种主要方式表现:或是DNA本身的化学性质被改变,或将DNA包裹染色质的蛋白质被改变。这些蛋白质称为组蛋白,它决定染色质是否包裹得很紧,从而使基因表达被关闭(或者说静止),还是包裹得较松,进而使基因表达呈现活跃状态。
第一种变化的形式是附加到DNA上的甲基团——往往通过DNA的甲基化过程,甲基团在其后紧跟着鸟嘌呤时附加到碱基胞嘧啶上。甲基团可以被调节染色质结构以启闭基因表达的蛋白质感觉到。第二种更为复杂的变化涉及包裹染色质DNA的多种组蛋白的变化。每种组蛋白都有一个突出的“尾巴”,有20多种化学标记附着其上,好似手镯上诱人的坠饰一样。某些化学标记的组合称为组蛋白密码,导致松弛的染色质;其他化学标记则产生相反的结果。
后成密码编码较DNA序列更易受环境的影响。桑格研究所研究人员瓦德曼 · 雷克恩(Vardhman Rakyan)指出:“它能够解释生活方式和毒性化学药品如何影响人对疾病的敏感度。某种特殊疾病的高达70%的诱因可能是非遗传性的。”的确,埃斯特尔研究小组的一项重大发现是:异地养育或有显然不同的生活方式的孪生子女,比起那些在一起生活一段时期,或共有类似的环境和经历的孪生子女来,其后成学图像是很不相同的。
虽然世界各地不同的实验室都在进行各自独立的研究,不少研究人员强调,现在已到了协作攻关的时刻了。一系列国际研究小组和政府的报道已经出现在近期的刊物上,谈论了国际人类后基因组工程的价值和研究的范围。这类工程的最终目标,是确认各类正常人体组织中的DNA以及染色体组蛋白的所有化学变化。
国际协作小组将效仿人类基因组工程的做法,设定优先项目、协调研究工作,集中使用实验材料和资源,创新必要的技术并监督研究的进展。
洛杉矶南加州大学癌症生物学家彼得 · 琼斯(Peter Jones,左下图)曾任费城美国癌症研究协会会长,他说:“后基因组学目前正处在基因组学30年前所处的阶段,当时参与工作的人员都在各司其职地从事揭示人类基因之谜的工作。现在,我们需要预见更大的前景,IHEP需要在全球范围内赢得同行的同心协力。
一切准备就绪
自人类基因组工程完成以来,出现了许多多中心的研究计划,每项计划都耗资数百万甚至数十亿美元。对于投资团体而言,一个重要问题是IHEP是否会成为另一个耗资数百万美元的庞大工程。其支持者们认为不会。马里兰州约翰 · 霍普金斯大学的人类常见病后遗传学中心主任安德鲁 · 范博格(Andrew Feinberg)指出:“IHEP的目的不是造就另一个大产业,而是要使工作做得尽可能经济有效,与正在实施的其他优秀工程接轨,这是一项意义重大的前瞻性工程。”
不少小规模的多中心后基因组工程已经在欧洲、美国、印度和日本付诸实施或正在讨论中。最著名的是2000年的欧洲人类后基因组工程联盟。继2004年推出前瞻性工程之后,欧洲人类后基因组工程联盟将对外公布6号、20号和2号人类染色体后成学的信息。
虽然很少有人质疑国际人类后基因组工程的重要性,但是这项工程如何运作仍然是争论的议题。关键的挑战是确定后基因组需要解决什么难题,以及研究什么类型的细胞。有些研究人员认为,该工程应该首先研究血液细胞,因为它们易于收集和研究,而且它们是我们观察健康人和病人的后基因组的主要“窗口”。一旦高清晰度的血液后基因组图谱得到确定,它将被用作一个参照物,可以和包括患病或老化组织在内的其他后基因组进行比较。
但是,不同细胞类型后基因组的多样性,表明它可能不合理地将前瞻工程限于单一的组织,或组织发育的一个特殊时期是没有意义的。经过近期3次国际工作会议的讨论,后成学界的研究人员现在一致认为,初期应该同时研究包括血液在内的8~10种组织。最终,所有组织包括胚胎干细胞的后基因组图谱都将被描绘出来。
另一个问题是,研究是从实验室培育的组织还是取自人体活组织。人体活组织含有不同的细胞类型,它会使图像模糊,但实验室培养的细胞可能含有异常的后成学化学标记。当前,有些生物学家倾向于实验室培育的细胞,因这样害处较小,但是细胞系的后基因组与正常组织比较起来究竟有多大差异,仍有待观察。IHEP的先期研究中包括了细胞系,相信应能解决这个问题。
最后的前沿
也许IHEP面临最大的挑战是技术方面的难题:必须研制出大量生产型的、具用破解后基因组的工具,包括将一大堆信息资料加以贮存和分析的工具。目前用于确定DNA甲基化位置的主要方法是可靠的,不过开支极其昂贵。此外,用于研究组蛋白标记的技术在准确性和复制能力上仍有待提高。
科学家希望把IHEP工程与诸如酵母菌、果蝇和小鼠之类实验室动物的后基因组工程联系起来,因为研究这些动物的技术已成熟。计算机科学家也在研制精巧的生物信息工具,用于贮存和分析多维的后基因组信息资料。
面对技术上的挑战,人们自然会质疑有关研究团体是否准备好并承诺完成这项艰巨的使命:吸取HGP工程的早期经验,从事后成学研究的人员认为他们能够做到这一点。奥地利维也纳分子病理学研究所分子生物学家托马斯 · 詹纳维恩(Thomas Jenuwciw)说:“任何人都无法百分之百地准备好。我们已拥有60%的技术去迎接真正的挑战。一旦行动起来,问题将迎刃而解。我们应该有投身大工程的远见卓识。”
· 相关链接 ·
为疾病贴注标签
鉴于后遗传学编码有能力引导细胞如何“执行”在DNA中编排好的遗传指令,它正证明其在处置诸如发育、衰老、癌症、精神健康和繁殖能力方面发挥的核心作用。特别是癌症研究人员正在研究后遗传学编码以便推出诊断和预后器具以及药物。
后遗传学可能在DNA自身变异方面对癌症研究进展作出重大贡献,例如一种据悉可抑制肿瘤发育的基因Wink2,在某些脑肿瘤中由于后遗传变化往往被关闭,进而由于遗传学上染色体的中间缺失更被“遗失”。
后遗传学标记可能还有助预测临床刚试结果。研究人员现已确认雄激素(oestrogen)受体基因内后遗传学变更模式,这种基因对治癌药物塔莫西芬起反应,从而和癌症患者的生存几率相互关联。
采取增加或消除所涉及的化学标记方法,后遗传变化较遗传变异更容易逆转。有这方面功效的药物目前处于癌症治疗的最前沿。例如科罗拉多州波尔德市法莱厄恩公司研制的药物vidaza已获得美国食品与药品管理局(FDA)批准用于治疗脊髓发育不良综合征,也称为白血病前期病症。
从理论上而言,这种阻断DNA甲基化的药物应该在所有细胞中表现活跃,但实际上似乎只对癌细胞作用活跃,从而刺激多种基因表达,包括那些抑制癌扩散的基因。现在多种其他后遗传药物还处在不同的临床测试阶段。