大部分常见疾病和遗传性状受多基因和环境因素的相互作用所影响。近年来,人类疾病遗传性定量分析主要依赖于利用GWAS来识别常见的变异体,通过GWAS分析许多新的易感基因特定生物学通路得到确定。截止2016年5月,已开展的GWAS研究共有2437项,确定了16617种疾病相关的SNP(单核苷酸多态性)。近年来,GWAS研究确定了中国人群的多个多态性位点,这为精准医学和复杂疾病的个性临床管理奠定了科学基础。贺林院士和张学军教授等在新综述中简要地总结了当前的遗传学研究,并讨论了GWAS研究的意义和面临的挑战。
GWAS在中国
近年来,针对中国人群的GWAS研究显著增多,作者认为主要由以下三个因素所致:
首先,中国是全球人口最多的国家,拥有庞大的医疗系统和医疗团队来为数百万名患者服务,以家庭为基础的社会结构有利于获取家族的遗传史。
其次,中国科学家参与了多项国际级基因组研究项目,包括人类基因组计划、国际HapMap计划以及千人基因组计划等,中国在这些国际合作中培养了大量的人才,也储备了多种国际先进技术,促进了GWAS在国内的发展与应用。
第三,中国医疗保健体系的变化导致了人民生活方式的改变和人口老龄化爆炸性增加,一些慢性疾病如冠心病、精神障碍、糖尿病、癌症以及高血压等发病率也逐渐增加。因此,确定遗传易感因素和了解疾病的发病机制迫在眉睫,GWAS能为疾病的发展机制、诊断和治疗提供新的见解,所以这也是时代所需。
目前,中国已报道的GWAS研究超过30项,作者认为这些针对中国人群的GWAS研究对了解常见疾病的性状和遗传基础有显著贡献,揭示了中国人群特有的一些易感位点,从而突出了中国不同民族群体之间的遗传异质性。
展望
尽管GWAS不断被应用,但仍面临一些挑战,作者对GWAS的局限性进行了总结和展望。
尽管能识别与疾病相关的多个SNP,GWAS也只能揭示复杂疾病相关遗传因素的一小部分。由于基因-基因、基因-环境之间的相互作用以及低频、罕见变异或其他变异的存在,遗传性缺失在GWAS研究中很明显。
新技术的发展,例如全基因组和外显子测序能够提供更多的遗传信号。虽然GWAS研究已经确定了与多种复杂疾病相关的SNP,这些SNP大多数位于非编码区,并作为同个单体域中所有SNP的标志,但位于高度连锁不平衡区域中的其他SNP也可能在疾病中发挥关键作用。因此仅仅根据GWAS结果来理解或预测疾病风险是不足的。
许多复杂疾病由多种基因突变引起,其中每一个基因对发病机制都有一定的影响,因此,测序新技术的发展以及成本的不断下降,使通过易感基因的大规模测序来确定疾病遗传因素成为了可能。
然而,仍有一些重要的问题需要考虑:虽然基因组测序可以发现一些与疾病相关的新变异,但这些变异的功能也许是次要的或是孤立的;基因测序并不能直接反映疾病发展过程中蛋白质的变化,尤其是外显子测序。基于此,确定易感基因的本质仍需进行功能性研究。因此基于转录组和蛋白质组的大样本GWAS研究仍然十分有价值。
大规模基因型-表型的研究应包含遗传关联研究,然而,目前大多数的GWAS研究未将这种关联性联系起来,这可能是由于临床表型数据的收集需要大量的时间和人力,另外一个因素可能是疾病存在动态过程,基因型和表型的实际关联可能会随疾病的发展发生变化。
作者指出,为了解决这些问题,我们应该收集详细的临床资料和后续的随访资料;此外,环境效应在疾病的发生过程中也起到举足轻重的作用,应纳入研究中。GWAS数据从根本上为疾病的个性化诊断和治疗提供了与基因相关的基本信息,中国研究者应考虑建立GWAS数据库/联盟,利用GWAS来了解中国人群的基因组序列变异模式。
总结
GWAS是确定复杂疾病易感基因/位点的有效研究策略,为复杂疾病的研究指明了方向,为实现个性化诊断、预后和治疗奠定了坚实的基础,为新生物学提供丰富的见解,促进了人类遗传学和基因组学研究的发展。
作者表示,虽然GWAS为复杂疾病的遗传基础提供了重要线索,但所得结果仍需进一步研究,例如精细定位易感位点以及对风险基因进行功能性研究。此外,二代及三代测序技术对探索功能性变异来说是必要的。
最后作者指出,短期内面临的主要挑战是如何将GWAS研究中确定的SNP转换至复杂疾病的致病分子机制,未来的研究新趋势是将遗传学、表观遗传学、转录组学、蛋白质组学、代谢组学以及临床中间表型整合到GWAS研究中,这将显著有利于人们对发病机制的理解,进一步推动精准医疗的发展。
原文献:Liangdan Sun, Xuejun Zhang, Lin He. GWAS promotes precision medicine in China, Journal of Genetics and Genomics (2016), http://dx.doi.org/10.1016/j.jgg.2016.05.009