未来的基因研究靠“谱”了

人类基因组图谱更新,由“一条线”升级成“一道彩虹”,更能代表全人类,结构变异检测率提高104%

版次:009    作者:来源:    2023年05月12日

泛基因组 管状图谱

你患冠心病的几率有多大?对哪种癌症治疗反应最好?答案可能就在你的DNA中。

研究人员10日发布新版人类基因组图谱。相比先前图谱,新图谱更全面地反映人类群体基因序列,对科学研究更具参考价值。

这项工作可以改善各种疾病的基因检测,甚至为人类进化和生物学提供新的见解。

相关研究报告刊载于最新一期英国《自然》杂志。

老版图谱

70%来自一名有非洲和欧洲血统的美国男子

人类基因组蕴藏人类遗传信息,破译它能够为疾病诊断、新药研发和新疗法探索带来革命性的进步。

21世纪之初,第一版人类参考基因组草图发布,标志着解读人类生命蓝图的突破性里程碑。然而由于当时的测序技术所限,这版草图中留有许多空白。

最初的参考序列在此后的20年里不断更新,包括修复错误和填补空白。2003年,人类基因组计划产生了占人类基因组90%以上的序列。然而直到2019年,人类基因组测序结果中仍有数百万个碱基位置上是空白的。

就在去年,填补人类基因组空白的工作取得重大突破。由于长读长和超长读长测序技术的发展,研究者读取生物样本的DNA时可以一次性解码几千甚至百万个碱基对,然后通过专门的算法将这些DNA长片段组装成更完整的基因组序列。直到去年4月首份完整的人类基因组图谱才真正问世。

不过,上述这些都是单个参考基因组的不断升级。原有参考基因组序列的一个重要局限在于,它是由大约20个志愿者的遗传数据拼凑组成的一套基因组,大部分参考序列(约70%)实际上只来自一名美国男子,其余30%来自另外约20人。这名男子被研究人员称为“布法罗的家伙”,有非洲和欧洲血统。1997年,他在美国纽约州布法罗市一份报纸上读到招募研究对象的广告后应聘。

“无论你对一个基因组的表征有多准确,都不能代表所有人类群体”,从一开始就参与人类基因组计划、此次也是人类泛基因组参考联盟一员的David Haussler教授解释说。

新版图谱:

人类基因组测序以47个人的DNA为基础

据路透社报道,新版人类基因组图谱不是单个人的基因组序列图谱,而是种族构成更多元化的多人基因组序列近乎完美的“合集”。

新版图谱的人类基因组测序以47个人的脱氧核糖核酸(DNA)为基础,他们分别有非洲、东亚、南亚、欧洲、北美洲、南美洲和加勒比地区血统。研究报告主要作者、美国加利福尼亚大学圣克鲁斯分校研究人员贝尼迪克特·帕滕说,这是多个基因组图谱的合集,是人类泛基因组图谱。

泛基因组指人类群体基因序列的总和。研究人员说,如果说原来的人类基因组图谱是一条线,那么泛基因组图谱则是一道彩虹。

帕滕说,绘制新版图谱的意义在于,能够就人类基因组序列创建一个多元、包容的“基础参考结构”,平等地造福每个人。

研究人员计划不断完善人类基因组图谱,预计在2024年上半年纳入350人的DNA数据。帕滕说,绘制高质量、完整的基因组图谱,能令科学家深入了解人类基因组存在差异的最复杂区域。“截至目前,对我们而言,这些快速演化的区域大部分仍然未知。”

新闻纵深

这是我们等待了十年的一个里程碑

人类泛基因组参考联盟的主要研究者之一、德国海因里希海涅大学的Tobias Marschall教授指出:“人类泛基因组参考是我们已经等待了十年的一个里程碑,这是在测序技术和生物信息学方面取得了诸多创新后才得以达成的。”

为什么需要更多样化的参考基因组?

有助于疾病诊断、治疗和预测

每个人都是独一无二的,每个人的基因组也略有不同。平均来说,你与另一个人的基因组有大约0.4%的差异。读懂这些微小的差异,可以更好地掌握一个人的健康与疾病状况,有助于疾病的诊断、治疗方法的选择、治疗结果的预测。

当科研人员或临床医生想要根据一个人的基因组找出与疾病相关的变异,他们需要将这个人的DNA与一个作为标准的参照物进行比较,从而确定哪些位置的碱基出现了特殊变化。参考基因组就是这样一个标准,但目前为止的人类参考基因组中基本上每条染色体只有一个序列,这个序列基本上来自一个个体。然而,人类群体中存在大量遗传变异,有些变异在某些特定人群(例如特定祖源)存在,在另一些人群中不存在。

因此,在临床使用基因组学信息——例如预测一种遗传病时,如果想要减少偏差,作为标准的参照物就不能只是某个单一人群的代表,而需要扩大其代表性。

新的泛基因组参考便提供了更多样化、也更准确的标准。研究人员通过复杂的算法,将组装完成的单个基因组序列集合编译为图形结构。如果过去的参考基因组只是一根线,现在的人类泛基因组参考是多个基因组序列的多线并行图。在碱基完全相同的序列,它还是单线形式;而存在人群差异的序列部分,线条则从一根“分化”出地铁轨道般交错的多根,提供了更广泛的参考选择。

最新的图谱哪些地方比旧的厉害?

遗传变异参考准确性提高34%

最新的泛基因组参考图谱比当下的参考人类基因组多了1.19亿个新碱基,其中有大约9000万个碱基来自结构变异。结构变异包括序列的倒置、插入、缺失或串联重复,通常涉及50个以上的碱基,由于其复杂性,过去在使用单一参考基因组的情况下,人类基因组中存在的结构变异70%以上难以识别。而现在,基于更全面的泛基因组参考图谱进行基因组分析,结构变异的检测率可以提高104%,研究人员有机会在未来将结构变异与疾病更好地联系起来。

除了结构变异的检测率提高外,检测较小的遗传变异(例如只有一个或数个碱基差异)时,使用泛基因组参考的准确性也有34%左右的提高。

最新的泛基因组参考图谱还有一项重大突破。我们的染色体成对存在,一套遗传自母亲,一套遗传自父亲,而泛基因组参考包括的单倍型信息——来自47个人的94套基因组序列,可以在分析一个人的基因组时更准确地区分出来自父母的不同染色体。这也将帮助我们更好地理解各种基因和疾病的遗传方式。

人类泛基因组研究的下一个里程碑在哪里?

明年发布“最终版本”,目标“从1到全世界”

人类泛基因组参考联盟的研究人员介绍,该项目还在继续采样,目标是纳入350名个体的基因组信息,尤其是目前还未纳入的人群代表,以便扩大多样性和增强不同人群之间的平衡性。他们计划在2024年发布人类泛基因组参考的最终版本,力求代表人类这个物种尽可能多的DNA序列。

参与研究的王艇教授指出,这不是一个项目的结束,而是一个新领域的开始,以便更有意义地将人类多样性纳入生物学、生物医学和临床科学。新的人类参考基因组将继续增长、扩大和打磨,从而更准确地描绘我们这个物种的生命蓝图——这需要全世界的努力。

人类参考基因组问世20多年,尽管并不完整,却已经在生物医学领域产生了深远的影响;随着包容性更强、多样性更全面的泛基因组参考上线,下一个10年、20年,这一成果必将通过临床研究、药物开发和医疗实践的发展造福全球。据新华社

英国第一批三亲婴儿诞生

相关新闻

英国人类受精与胚胎学管理局证实,英国首批体内含有三人脱氧核糖核酸(DNA)信息的三亲婴儿已经诞生。这是在监管环境中、线粒体捐赠治疗(MDT)背景下于英国出生的首批三亲婴儿,婴儿数量少于5名。

线粒体是真核细胞的“能量工厂”,线粒体内有一套独立于细胞核的遗传物质。线粒体病属于母系遗传,一旦母体存在缺陷,婴儿也会受到影响。英国人类受精与胚胎学管理局强调,目前线粒体捐赠治疗仍处于早期阶段,只有极有可能将严重线粒体疾病遗传给子女的人才有资格接受线粒体捐赠治疗。

从基因上讲,三亲婴儿会有两个母亲,但是捐赠线粒体的“母亲”和孩子的遗传联系较少。这些孩子体内绝大部分的DNA(超过99.8%)依旧来自他们的父母,但还有大约0.1%的遗传物质来自线粒体捐赠女性。

2015年,英国成为首个立法生效批准线粒体捐赠治疗的国家。此后,英国纽卡斯尔生育中心于2017年获得第一个有争议的治疗许可,并开创了MDT的研究。

英国不是借助MDT诞生第一个三亲婴儿的国家。2016年,美国医生为一名携带线粒体突变的约旦女性实施了相关治疗,世界上首例三亲婴儿在墨西哥诞生。

不过,对于线粒体捐赠治疗,舆论褒贬不一。支持者认为,对于患有线粒体缺陷的女性而言,该技术能帮助她们诞下健康的孩子。反对者则认为,这是一种变相的基因改造,不符合医学伦理。

据新华社