想象一下人体的指导手册,即基因组:这里的单词是基因,字母是DNA,相当于错别字的后果可能是灾难性的。
近年来,科学家对基因组语言的使用越来越流利,但其中很多仍然是神秘的,包括我们许多基因的功能。
发现这些基因的用途以及它们的工作方式,是了解它们发生故障,导致疾病,甚至导致死亡时会发生什么的关键。
现在,一组科学家正在利用来自14万多人的大量遗传信息数据库,以更好地了解我们的哪些基因很重要,以及我们如何更好地靶向治疗遗传病的药物。
数据库本身是一个里程碑。它被称为基因组聚合数据库或gnomAD(发音为nomad),包含超过15,000个全基因组序列(相当于全长说明手册)和超过125,000个完整外显子序列,类似于人类指南中的关键点身体。
在周三发表在《自然》,《自然通讯》和《自然医学》杂志上的七篇论文中,科学家们梳理了gnomAD数据,重点研究了有效破坏基因的一种拼写错误。
在我们的基因组中,我们所有人都有一些这样的错误,称为功能丧失变异。但是在大多数情况下,它们会关闭或破坏基因而没有不良影响。例如,我们可能最终会减少嗅觉,但否则会保持健康。
但是,当这些错误发生在更重要的基因中时,它们可能导致严重的疾病。
寻找药物靶标
在重要基因中具有这些变异的人通常不会将其遗传,因为它们死于幼年或无法生育。
这意味着科学家可以搜索gnomAD之类的巨大数据集,以寻找变异少于预期的基因。
他们可以推断这些基因对我们的健康必不可少,因为由于自然选择,这些基因的变异并未传承下来。
“有144,000人,我们开始拥有足够大的数量,如果我们看不到特定基因的功能丧失变异,这告诉我们携带该基因破损副本的人们正在人口中流失,这可能是由于严重的遗传病”,领导gnomAD项目的Daniel MacArthur说。
“我们无法确切说出该疾病是什么,但这告诉我们该特定基因可能在某种程度上很重要。”在哈佛大学和哈佛大学进行的七篇论文中有六篇的资深作者麦克阿瑟补充说。麻省理工学院的广泛研究所。
知道哪些基因在疾病中很重要,不仅为新药提供了靶标,而且还可以暗示新疗法是否安全。
这是埃里克·瓦尔拉布·米尼克尔(Eric Vallabh Minikel)的研究重点,他正在布罗德研究所(Broad Institute)研究一种罕见疾病,称为pr病毒疾病。
该研究是Minikel的私人研究。他的岳母死于这种疾病,而他的妻子(也是一位科学家)患有一种基因突变,这意味着她也有可能患上这种疾病。
他和他的妻子想找到一种可以预防这种疾病的药物,而对自然发生的基因失活进行检查,就可以洞悉这种新疗法可能产生的副作用。
他告诉法新社:“使基因失活的DNA变化的影响可以帮助预测如果我们用针对该基因的药物治疗人们会发生什么。”
需要更大的数据集
同样,另一个团队使用该数据预测关闭与帕金森氏症相关的基因是否可能引起副作用。
他们发现了由于功能丧失而自然关闭了该基因的基因组,并且在大多数情况下,这并未对健康造成有害影响。
这可能表明靶向该基因的药物可能会预防帕金森氏症,尽管研究人员警告说,还需要进一步的工作。
麦克阿瑟现在是加万研究所人口基因组学中心的主任,他说,要进一步突破,需要比gnomAD更大的数据集,这可能涉及亿万人民和他们的健康信息。
“我们需要这种类型的信息……以至于我们可以真正开始完全理解基因组中所有基因变异对人类疾病风险的影响。”