来源: 学术经纬
20年前的世纪之交,人类基因组草图宣告绘制完成。当时科学家们仅仅获得了几个人的基因数据,却足以让生物学迈入一个全新的阶段。20年后的今天,如果把40多万人的基因数据放在科学家们的前面,他们会发现什么?
昨日,顶尖学术期刊《自然》以“加速预览”形式,发表了一篇具有里程碑意义的论文。科学家们分析了英国生物银行(UK Biobank)中45万多人的外显子组数据,将大量基因变异与人类的疾病联系在一起。从遗传学角度看,这项工作具有里程碑的意义。
本研究的负责人之一Goncalo Abecasis教授在个人推特上对这项研究做了详细解读。首先,是为什么要做这个研究,而这要追溯到生物学家们最初的梦想。
或许每一个生物学家都希望搞清每一条人类基因的功能,可是他们要怎么做呢?科学家们在小鼠中的常规做法,是挨个敲除小鼠的基因,然后观察小鼠会有什么变化。但显然由于伦理因素,我们无法在人类身上重复这个实验。
但大自然已经为我们提供了足够的资源——每一个人体内都带有足够多的基因变异。如果说一两个人的基因还不具有代表性,十万级的人口已经足以提供分析所需的多样性,而英国生物银行的大规模数据库可以满足这一需求。这个数据库里不仅有数十万人的基因序列,还记录了他们的健康情况,好将两者挂起钩来。因此对这几十万人的基因分析,不仅可以回答“为什么我和我妈妈的眼睛一个颜色”等问题,还可以找到让癌症风险升高的基因变异。
可以想象,这样的分析所产生的数据量是巨大的。研究人员们一共找到了780多万个错义突变(missense variants),会影响到蛋白质的特定氨基酸。他们还找到了90多万个比较严重的突变,会严重干扰特定蛋白的功能,或是让翻译过程提前终止。
平均下来,研究人员们在每个基因里找到了400多个突变。
从这几百万个突变中,研究人员们挑选了一些进行后续研究,而他们侧重的是那些严重突变,或是能明显改变蛋白性质的错义突变。随后,科学家们开始评估这些突变会对健康造成什么影响。
分析结果让他们感到振奋,因为他们不用真的敲除人体内的基因,就可以知道这些基因有什么功能。举例来说,有96个人的EP400基因出现了明显突变,而且这96个人的突变类型都不一样。但很有意思,这96个人的握力都出现了明显下降。另外的一些发现也与之类似,都指出一些基因在失去作用后,会导致怎样的后果。
当然,并不是所有的基因在突变后都会导致疾病。相反,有些基因在失去功能后,反而能预防疾病!Abecasis教授提到,APB、PCSK9与APOC3基因在突变后,能预防高脂血症;ABCG5基因失活后能预防胆结石;失活的IL33基因则能预防一些过敏性疾病。
总体来说,他们找到的不乏过去医药行业已经发现的药物靶点。但也有一些属于全新发现。
长远来看,如果能获得来自全球不同地区更多人的数据,科学家们就可以做出更多发现,这也是他们未来的工作方向。他们也期望在未来四年里,能分析的数据会从近50万人增长到500万人,带来更多洞见。
注:原文有删减