英国《自然》《自然·通讯》《自然·医学》杂志近日同时发表来自多家研究机构的一系列报告,集中描述了对一个汇集了逾14万人样本的数据库——基因组聚集数据库的应用,该数据库拥有迄今最大规模的人类遗传变异体公开目录,是我们深入认识人类基因功能、发现新疾病相关基因的宝贵资源。
人类基因组中绝大多数基因的功能依然未知。揭示基因功能的一种方法是观察基因发生突变后的结果。这些变异体往往会产生不良结果,但通常较为罕见。大规模基因测序研究有助于考察这些功能丧失型变异体的效应,或能带来对人类生物学特征和疾病的重要见解。
此次《自然》发表的一篇概述性报告中,美国麻省理工学院—哈佛大学博德研究所科学家康拉德·卡泽维斯基及其同事,描述了从125748个全外显子组和15708个全基因组测序数据集中鉴定出的443769个预测的功能丧失型变异体。鉴于这些变异体预计会影响其编码蛋白的正常运作,团队进而评估了这些变异体对生理机能的影响:究竟是几乎没有影响,还是会导致严重的健康问题。《自然》同时发表的另外两篇报告,利用该数据库创建了一个结构性变异体资源库,并评估了基因缺失、复制,甚至是颠倒方向所产生的影响。
同时出炉的其他报告,探讨了如何利用人类功能丧失型变异体评价候选药物靶点,提升对遗传变异体的临床解读,以及如何更详细地考察特异性功能丧失型变异体。譬如英国帝国理工学院科学家尼古拉·威芬和同事分析了与帕金森病风险增加相关的一个基因的变异体,结果显示靶向这个基因或是一种安全的治疗方法。
科学家们表示,基因组聚集数据库项目的样本量是其前任的两倍多,之前的外显子组聚集联盟收录了6万多个外显子组数据。卡泽维斯基与同事也指出,他们距离鉴定出人类全部的预测功能丧失型变异体还很遥远,尽管如此,他们认为这项资源能够提升我们对罕见和常见遗传病的评估。