中国科学院北京基因组研究所 于 军 方向东 杨运桂 雷红星
基因组学是一门新兴的、发展迅速的生命科学。其普遍应用及向其他学科、领域的不断渗透日趋明显,这些学科涵盖了现代农业、生物能源、生态环境和人类健康等各个方面。日前举办的2009国际基因组学大会带来了最新发展趋势。
生物适应 直指肿瘤个体化治疗
自然选择下的生物适应是生物学的中心主题。“适应”可以体现在各个层面,从细胞的产生发展和进化、复杂表型的产生、物种的形成到种族差别和群落结构的多样性,乃至生物多样性本身都是生物适应的表现形式。对于所有上述现象,遗传基础是非常关键的因素。然而,由于不能获得这些现象中完备的遗传信息,我们很难揭示“适应”的生物学本质。第二代大规模基因组测序技术将测序通量提高了1000倍,为生物学研究带来了革命性的技术突破。在下一个浪潮中,更多物种的基因组会被测出,能更好地解决那些过去困扰生物学家的问题。
我们以人体内细胞进化为例,来说明基因组学如何解决细胞水平生物适应的遗传基础。在长寿的动物中(如人类),有一种特殊的进化,这种进化将一直持续到其生命的终结,而这种短期进化的明显表现就是癌症。癌症从某种层面上说也是一种适应,即游离的细胞适应某种组织环境的过程。肿瘤组织可以看成是含有多种异常突变细胞的细胞大群体。因此,肿瘤组织的基因组不是单个个体,而是多种突变个体的混合群体。
运用大规模测序手段,我们可以在癌症病理学的指导下,对肿瘤、癌旁和正常组织样品的多个样本点进行基因组测序,分析多样本点上变异之间的关系,从而描述癌症在发生发展过程中的关键变异,以及变异激增过程中的进化关系。最终解释细胞在某种组织环境下形成肿瘤的适应过程,这对于阐明肿瘤的发生发展机制和未来提供肿瘤个体化治疗将提供重要的线索。
基因组稳定性 探索精确化药物应用
在生物体内以及其外部环境中存在许多针对遗传物质DNA的损伤因素:如紫外线、电离辐射、重金属污染物等。DNA损伤对于单细胞生物最大的威胁是造成细胞死亡,对高等生物可导致多种疾病,如发育缺陷、过早老化、癌症和抗感染能力降低乃至死亡。DNA损伤修复是保障基因组稳定性,维持其编码信息不变,并将遗传信息准确无误的传给子代细胞的关键过程。高等生物已经进化出一套由众多的DNA修复因子和细胞周期调控蛋白质构成的基因组稳定性维护体系。
目前大多数科学家都认为,维持遗传物质基因组稳定性重要因子功能的缺失,可引起基因组出现不稳定性和基因突变,造成其他肿瘤抑制基因和致癌基因突变积累,而这反过来又引起生长增殖失调,最终在生物宏观现象中导致发育缺陷、过早老化、癌症和抗感染能力的降低。
了解癌症的分子基础对于发展有针对性的干预战略至关重要。但是确定这些难以预料的指标一直是个老大难问题。基因组学的深入研究和不断发展为解决这类复杂疾病提供了重要的技术平台,比如将来可以根据病人药物作用相关蛋白的基因型来选择合适的药物及合适的剂量。这将有助于最大限度地提高药物治疗效应,同时减少药物不良反应和毒副作用。
表观遗传 希冀突破重大医学问题
真核生物基因的表达是一个高度复杂、精确调控的过程,是遗传调控和表观遗传调控协同作用的结果。表观遗传学是研究在没有DNA序列变化的情况下,可以经过有丝分裂和减数分裂等遗传方式在细胞和个体世代间传递,从而引起基因表达或表型改变的生命信息,它是不符合传统孟德尔遗传规律的核内遗传。
表观遗传学的真正兴起始于上世纪90年代后期,目前它已成为后基因组时代的重要前沿和热点。正如诺贝尔奖获得者Watson所说:“你可以继承DNA序列之外的一些东西。这正是现代遗传学让我们激动的地方。”
欧盟早在1998年就启动了解析人类DNA甲基化谱式的“表观基因组学计划”以及“基因组的表观遗传可塑性”研究计划。美国国家人类基因组研究所也于2003年启动DNA组分总汇计划。中国科技部于2005年开始启动表观遗传学研究工作至今,已经取得了令人鼓舞的进展,多项研究成果在《细胞》、《自然》等国际刊物上发表。
在未来的5~10年中,我国表观遗传学的研究将主要围绕以下主题展开:
在表观遗传的机制与功能方面,表观遗传信息的建立和维持、表观遗传修饰、与表观遗传调控相关的非编码RNA的研究仍将持续。深入认识从信号到表观遗传调控乃至个体生长、发育和对环境适应的分子机理。
在重大医学问题方面,将重点阐明干细胞分化与组织再生、学习和记忆、发育与衰老、重大疾病的发生发展、DNA损伤与修复等过程中的表观遗传学调控机制。
在技术研究方面,将注重优化现有的依赖于PCR、芯片、质谱等系统的表观遗传学检测技术。而新一代测序平台的高通量表观遗传学技术体系的进一步完善和逐步推广,将是上述研究计划顺利进行的有力保障。
生物计算 深度挖掘生物信息资源
基因组学数据的积累,同时推动了生物信息学的发展,这两个“孪生”学科成为推动生命科学发展的重要动力。
生物信息资源是关系到国民经济和社会可持续发展的重要战略资源,以数据挖掘为核心的生物信息技术则是生物信息资源能否充分利用、生命科学研究能否取得突破的技术关键。
伴随着新的高通量生物技术的不断涌现,生物信息数据急剧增长,形式日趋多样。功能基因组学、蛋白质组学、结构基因组学乃至代谢组学、基因组药物学等领域的发展越来越依赖于整合的生物信息数据库、基因组信息分析挖掘方法和生物计算软件分析工具等。 (李天舒整理)