结直肠癌全基因组关联分析研究进展及展望
结直肠癌是最常见的消化系统恶性肿瘤,和肺癌、乳腺癌一起,列为当前全球的三大恶性肿瘤。年全球新发结直肠癌病例共例,占恶性肿瘤发病总数的10.2%,发病率在总人群中仅次于肺癌和乳腺癌,位列第三;死亡病例共例,占恶性肿瘤死亡总数的9.2%,死亡率在总人群中仅次于肺癌,位列第二。在我国,随着人口老龄化及生活方式的改变,结直肠癌的发病率逐渐升高。据年国家癌症中心数据,年我国新发结直肠癌病例约为37万,占恶性肿瘤发病总数的9.74%,人口标化发病率为17.52/10万。其中男性结直肠癌发病例数是21.4万例,女性是15.6万例,人口标化发病率分别为20.72/10万和14.40/10万,发病率在男性中位于肺癌、胃癌、肝癌之后,在女性人群中位于乳腺癌、肺癌之后。结直肠癌死亡病例约为18万例,其中男性和女性结直肠癌人口标化死亡率分别为9.58/10万和6.33/10万,分别位居恶性肿瘤死亡率的第五位和第四位。结直肠癌严重影响人类健康,因此非常必要进一步研究其发病机制,为结直肠癌防治提供更好的方法。
结直肠癌的发生、发展是一个多步骤、多因素参与的过程,是遗传和环境因素共同作用的结果,其中遗传因素在结直肠癌中发挥了重要的作用。2%~5%的结直肠癌患者携带已知的遗传缺陷,如Lynch综合征、家族性腺瘤样息肉病、黑斑息肉综合征、幼年息肉综合征等,携带者罹患结直肠癌的风险极高。基于双生子的大规模流行病学研究表明,大约35%的结直肠癌与遗传因素相关。基于家系的关联研究发现了许多结直肠癌患者带有的易感基因遗传突变,但这些人群中罕见的、高外显率的基因遗传突变(如MMR基因的常见突变MLH1/MLH2)只能解释一小部分结直肠癌的发生、发展。基于“常见疾病,常见变异”假设,大部分结直肠癌患者的遗传易感性是由人群中多个常见的、低外显率的基因遗传突变共同作用所导致的。全基因组关联分析研究(genome-wideassociationstudy,GWAS)是在全基因组层面上开展的多中心、大样本、多阶段验证的遗传变异,即单核糖核酸多态位点(singlenucleotidepolymorphisms,SNP)与疾病的关联性研究,使我们有可能在全基因组范围内发现与疾病相关的基因遗传变异。自年第一篇关于结直肠癌GWAS文章发表至今,全球有关结直肠癌的GWAS研究已有数十项,发现了许多新的遗传易感位点,极大地推动了结直肠癌的遗传机制研究。为了进一步研究结直肠癌的遗传易感性,本文将对结直肠癌GWAS研究进展进行综述。
1
结直肠癌GWAS研究的现状
从年起,许多研究者对结直肠癌进行了GWAS研究,在结直肠癌的遗传机制方面取得了一些进展,发现了许多与结直肠癌相关的遗传变异位点和区域(表1)。
1.1结直肠癌GWAS研究发现的易感区域
1.1.1染色体8q24区域8q24区域是最早被发现与结直肠癌遗传易感性相关的区域,其标签位点有rs、rs、rs和rs,这些SNP的比值比(oddsratio,OR)位于1.1~1.3之间。后续研究证明,8q24区域的遗传变异不仅影响结直肠癌的遗传易感性,还与前列腺癌、乳腺癌等多种恶性肿瘤的遗传易感性相关,表明该区域的遗传变异可能影响多种肿瘤的遗传易感性。8q24区域内无蛋白编码基因,其两端连接有MYC基因和FAM84B基因。研究发现,8q24区域的遗传变异可能影响癌基因MYC的表达,进而影响肿瘤的发生发展。
1.1.2染色体18q21区域18q21区域内的主要遗传位点有rs、rs和rs,这3个SNP的OR值在1.1~1.2之间,且这3个SNP均位于SMAD7基因内含子内,相互间存在较高的连锁不平衡(linkagedisequilibrium,LD)。众多研究表明TGF-β/SMAD信号通路与细胞增殖、分化和迁移有关,在结直肠癌的发生发展中起一定作用。
1.1.3与TGFβ信号通路相关的位点研究发现,TGFβ信号通路与细胞增殖、分化、迁移密切相关,该信号通路的基因突变在结直肠癌的发生发展中发挥了重要的作用。除了前述18q21区域位点外,前期的结直肠癌GWAS研究中还发现了4个SNP标记的LD区域。这些区域包含了TGFβ信号通路中的相关基因,分别为GREM1(15q31/rs)、骨形成蛋白BMP2(20p12/rs)、BMP4(14p22/rs)、CDH1(16q22/rs和rs)以及RPHN2基因(19q13.1/rs和rs)。这些位点单个效应都不大,OR值处于0.87~1.12之间,但可能是多个低效应的位点共同作用影响结直肠癌的遗传易感性。
1.1.4其他位于基因或邻近基因的位点染色体6q25.3区域(SLC22A3基因)的遗传变异位点rs与结直肠癌遗传易感性显著相关。SLC22A3是有机阳离子转运基因家族的一员,该家族在转运阳离子药物、毒物和内源性发挥重要作用,从而影响结直肠癌的发生。该位点OR值为1.28,该位点联合8q24区域的位点rs以及18q21区域位点rs,在饮酒人群中结直肠癌发病风险增加了2倍。
染色体8q23.3区域(EIF3H基因)的遗传变异位点rs与结直肠癌遗传易感性显著相关,OR值为1.25。研究发现,EIF3H调节细胞生长和发育,其表达增加可以提高结直肠癌的生长和侵袭能力,可能机制为rs所在区域能与EIF3H的启动子相互作用,从而影响EIF3H的表达。
染色体11q23区域(C11orf93基因)的遗传变异位点rs和rs与结直肠癌遗传易感性显著相关,OR值为1.11。C11orf93基因也称为COLCA2(colorectalcancerassociated2)。目前有研究认为,11q23区域SNP所在部位可能是基因增强子或转录因子的结合区域。
染色体20q13.3区域(LAMA5基因)的遗传变异位点rs与结直肠癌遗传易感性显著相关,OR值为0.93。LAMA5基因在许多细胞的黏附、分化、转移中发挥着重要的作用。研究认为LAMA5基因可能通过影响肿瘤细胞与肿瘤微环境的相互作用,从而影响肿瘤细胞的侵袭转移。
染色体3q26.2区域(MYNN基因)的遗传变异位点rs与结直肠癌遗传易感性显著相关,OR值为0.93。MYNN基因编码的蛋白属于BTB/POZ和锌指结构域蛋白家族,有研究证实该基因可通过影响端粒长度,促进多种肿瘤发生。
染色体11q13.4区域(3基因)的遗传变异位点rs与结直肠癌遗传易感性显著相关,OR值为1.08。该位点位于POLD3基因的内含子区域,POLD3基因编码DNA聚合酶亚基,影响细胞DNA修复功能,与肿瘤的发生发展密切相关。
染色体10q25区域(VTI1A基因)的遗传变异位点rs与结直肠癌遗传易感性显著相关,OR值为1.19。该位点位于VTI1A基因的内含子区域,VTI1A基因编码的蛋白在细胞内小体转运作用中起作用。有研究发现,融合基因VTI1A-TCF7L2可以促进结直肠癌细胞生长和转移。
染色体3q14.1区域(LRIG1基因)的遗传变异位点rs与结直肠癌遗传易感性显著相关,OR值为1.09。该位点位于LRIG1基因的内含子区域。研究发现LRIG1基因编码的蛋白是结肠隐窝干细胞激活后的标志,但与肿瘤的关系尚不明确。
染色体12q24.22区域(NOS1基因)的遗传变异位点rs与结直肠癌遗传易感性显著相关,OR值为1.16。该位点位于NOS1基因的内含子区域。该基因编码的蛋白涉及炎症、感染、抗肿瘤等功能,但与结直肠癌的关系尚不明。
染色体20q13.13区域(PREX1基因)的遗传变异位点rs与结直肠癌遗传易感性显著相关,OR值为1.07。该位点位于PREX1基因的内含子区域,该基因编码参与细胞迁移和侵袭的信号蛋白,与结直肠癌的关系尚不明确。
1.1.5其他区域目前GWAS研究发现的与结直肠癌遗传易感性相关的其他区域有10p14、1q41、12q13.1、15q13.3、6p21、Xp22.2、1p33、8p12、10q26.12、12p13.32、20p12.3、5q31.1、5q23.3、17q12、10q24.2、3p22.1和12q24.12,这些区域的SNP位点都位于目前未知生物学功能的基因间隔区域,尚待大量研究探索其具体的生物学功能。
1.2不同种族人群的结直肠癌GWAS研究
1.2.1欧美人群结直肠癌GWAS研究始于欧美人群。结直肠癌遗传性研究(colorectalcancergenetics,COGENT)自年开展以来,在英国、加拿大人群中,通过多中心、大样本、多步骤的重复验证,发现了11个结直肠癌遗传易感位点:rs、rs、rs、rs、rs、rs、rs、rs、rs、rs、rs。这11个位点的效应均不高,OR值为1.10~1.30。后续的Meta分析和进一步的病例分析新发现了8个位点:rs、rs、rs、rs、rs、rs、rs、rs。这些新发现的位点OR值大约为1.10。
1.2.2亚洲人群年CUI等和年JIA等在亚洲人群中开展了GWAS研究,发现了5个新的位点:rs、rs、rs、rs和rs,这些位点OR值为1.1~1.3。8q24位点在亚洲人群中得到验证,但同时发现了新的位点,提示欧美人群和亚洲人群的差异对结直肠癌遗传易感性的影响有所不同。
1.3.3其他人群年DUNLOP等在西班牙人群中开展的GWAS研究,发现了2个新位点:rs和rs,这2个位点的OR值分别为0.73、0.69,提示该位点在西班牙人群的结直肠癌发生中起保护作用。
2
结直肠癌GWAS研究的优势和局限性
2.1结直肠癌GWAS研究的优点
在GWAS研究之前,为了研究结直肠癌这类复杂疾病的遗传易感性与SNP的关联,研究者主要采用候选基因策略。该策略主要基于疾病发展过程中已知的具有生物学功能的基因或者生物学通路,选择该通路中的基因或者其调控区域内的SNP开展关联研究,从而找出与结直肠癌易感性相关的SNP。但显而易见,该研究策略不能全面系统地研究基因组内全部或者大部分SNP,遗漏了基因组内大部分的遗传信息。随着DNA测序技术的进步,人类基因组计划(humangenomeproject,HGP)和人类基因组单体型图(HapMap)计划的完成,为研究人类全基因组的SNP提供了理论基础和信息资料,GWAS研究亦快速发展。GWAS研究摒弃了候选基因方法中的预先假设,不再着眼于已知的生物学通路基因,而是从人类全基因组范围内筛选出与复杂疾病遗传易感性关联的变异。此外,GWAS研究一般基于极大的样本量,采用严格的统计水准,且一般要求进行多步骤、多中心验证,因此研究结果的可靠性大大提高。
2.2结直肠癌GWAS研究的局限性
2.2.1GWAS研究基于严格的统计水准,可能损失潜在易感位点GWAS研究本身因其严格的统计水准,一般只选择少量的峰值位点(如1.0×10)进行后期验证,这虽然降低了假阳性,但是可能损失其他潜在的遗传位点,目前认为也可以采用较宽松的检验水准,如FERNANDEZ-ROZADILLA等在研究中采用了1.0×10至1.0×10检验水准,进而发现了新的遗传易感位点。也有研究者通过Meta分析扩大研究样本,发现了结直肠癌新的遗传易感位点。
2.2.2GWAS研究目前主要
转载请注明:http://www.ningbohuodai.com/yyjj/12545.html