乳腺癌多通路遗传易感基因及其常用检测技术的临床应用价值
单位:北京大学人民医院检验科
世界卫生组织国际癌症研究机构(International Agency for Research on Cancer, IARC)于2021年2月发表的最新数据显示,2020年全球女性乳腺癌新增病例数达226万,在新增癌症病例中占11.7%,首次超越肺癌成为全世界最常见的恶性肿瘤,也是全球女性死亡率最高的恶性肿瘤[1]。中国女性乳腺癌年新发病例约为30.4万例,占我国女性恶性肿瘤发病人数的17.1%,居女性恶性肿瘤发病首位;死亡例数约为7.0万例,居我国女性恶性肿瘤死亡人数第五位[2]。乳腺癌的早期预防和及时诊治对保护女性生命健康至关重要。
乳腺癌的发生发展是一个多因素、多阶段的过程,与各种环境因素、社会因素以及基因层面的变化密切相关。目前已有共识的乳腺癌高危因素包括月经初潮小于12岁、绝经后肥胖、高剂量电离辐射暴露等,但研究显示BRCA1/2基因突变、个人或家族的乳腺癌史等在内的遗传因素发挥更重要的作用[3-5]。癌症基因组图谱计划(The Cancer Genome Atlas, TCGA)的一项大规模研究显示,散发性乳腺癌存在强大的胚系遗传贡献[6]。另有研究通过分析双胞胎的患癌数据,评估遗传因素与28种癌症的因果关系,其中遗传基因对乳腺癌风险的贡献率为27%,仅次于前列腺癌的42%和结直肠癌的35%[7]。由此可见,乳腺癌的发生发展与遗传因素密切相关。随着精准医疗理念的普及,基因组学技术的发展,分子水平的多基因联合检测可为乳腺癌诊断与治疗提供个体化依据。为明确乳腺癌发生风险和临床诊疗方案在中国人群中的相关情况,我们应尽可能全面地检测我国肿瘤患者携带基因突变的情况,为乳腺癌的发生发展、治疗、预后评估及其相应的信号转导机制研究提供全面的分子信息。本文将从乳腺癌的遗传易感基因及其通路,乳腺癌基因的检测技术,乳腺癌多基因联合检测产品的临床应用进展等方面进行综述。
一、乳腺癌的遗传易感基因
乳腺癌具有家族聚集的特点,大多由于遗传易感基因变异所导致。目前被广泛认知且接受的乳腺癌胚系易感基因是BRCA1和BRCA2。但是数据提示,BRCA1/2的胚系突变、重排或缺失只能解释小部分的遗传性乳腺癌[8],许多早发性或有家族史的乳腺癌患者在已知的易感基因中没有变异,75~80%的乳腺癌病例风险变异仍不清楚[9],其他未被发现或证实的乳腺癌相关基因变异仍有待进一步探索。早期诊断和预防性干预可以改善易感基因突变携带者的发病率和生存率,如果能全面认识乳腺癌发生发展的基因层面的危险因素,包括DNA损伤修复通路、血管内皮生长因子信号通路等多通路多基因的突变情况,将对乳腺癌的防治起到重要作用。
1. DNA损伤修复通路基因:DNA损伤具有潜在的改变和抑制DNA复制和转录的能力,其导致的分子结构不完整和基因组不稳定是包括乳腺癌在内的众多癌症发生的主要原因之一。DNA损伤修复机制是哺乳动物细胞防御机制的重要部分之一,为了维持细胞的生存和功能,机体会启动特异性的修复系统,根据损伤的类型,选择一系列不同的修复诱导物、中介物、效应物等进行修复,从而维持基因组的完整与稳定[10]。正常情况下人类具备修复DNA损伤的能力,但DNA修复系统基因突变导致修复能力缺陷,将增加正常细胞恶变的可能性。针对不同的DNA损伤类型,DNA损伤修复系统(DNA Damage Repair, DDR)包含多条修复通路,其中包括专门修复DNA双链断裂(DNA double -strand breaks, DSBs )的非同源末端连接通路(non-homology end joining, NHEJ)和同源重组修复通路(homologous recombination repair, HR),此外还有错配修复通路(mismatch repair, MMR)、碱基切除修复通路(base excision repair, BER)等重要通路[11, 12]。
2. 同源重组修复通路基因:同源重组修复是涉及许多基因产物的复杂调控过程,它是一种精确修复,与NHEJ相比,HR能更准确地修复严重和复杂的DNA双链损伤[13]。HR修复过程一般在S后期到G2期,以完整DNA分子的同源序列区域为模板合成新的DNA片段,最大程度地保持了基因组信息的准确性。作用机制也可总结为3个过程:DNA损伤位点的加工处理;链侵入和修复合成;DNA分子交叉的形成与解离。
乳腺细胞微环境处于雌激素暴露中,雌激素既是生长刺激激素又是链断裂诱导剂,双链损伤修复能力受损将无法保证染色体的稳定性,因此乳腺细胞中的DNA双链损伤修复通路至关重要,此通路中关键因子的基因状态异常可能造成HR功能失调,双链断裂修复受损,导致肿瘤的易感性增加[14, 15]。BRCA1/2是HR通路中的关键因子,此外也存在调节同源重组修复的其他相关性基因,包括ATM、ATR、CHEK2、BARD1、FANCD2、FANCI、RAD51C、PALB2、XRCC2等在内的四十余种基因。
(1)BRCA1/2: BRCA1和BRCA2是最早发现的,也是目前被公认的乳腺癌易感基因。BRCA1/2胚系突变是双侧乳腺癌和具有乳腺癌家族史患者中最常见的突变[16]。BRCA1/2基因突变对不同人种的乳腺癌发病风险的影响具有差异性。在西方国家,健康人群中每300~500人约有1例为BRCA1/2突变携带者[17]。基于英国人群的一项研究表明BRCA1基因突变携带者70岁前发生乳腺癌的风险为60%,BRCA2基因突变携带者为55%[18]。而在一项纳入了3434 名德裔犹太女性的研究中,BRCA1和BRCA2突变携带者70岁前的乳腺癌累积发病风险分别为46%和26%[19]。对于我国人群,BRCA1和BRCA2突变在1763名中国健康人中的检出频率为0.34%和0.11%[20]。Lang GT等人对2991名中国乳腺癌患者和1043名健康志愿者进行研究,BRCA1/2在健康人群中的突变率为0.38%,乳腺癌患者BRCA1和BRCA2的突变率分别为3.7%和4.5%[21]。北京大学肿瘤医院解云涛教授团队对5931名中国乳腺癌女性患者进行综合分析,BRCA1和BRCA2的突变率分别为1.9%和2.1%,42.7%和30.3%的BRCA1,BRCA2基因突变携带者在40岁前被诊断患有乳腺癌,而非突变携带者的这一比例为18.6% (P<0.001)[22]。
BRCA1和BRCA2基因突变与乳腺癌临床病理特征的关系存在差异性,目前大多数研究支持BRCA1基因突变相关的乳腺癌病理类型倾向于基底细胞样乳腺癌,常表现为激素受体阴性乳腺癌或三阴性乳腺癌;而与BRCA2相关的乳腺癌病理特征与散发性乳腺癌相似[23, 24]。此外,另有研究表明携带BRCA1/2胚系突变的乳腺癌患者,双侧乳腺癌患病风险提高至25倍[25]。
BRCA1与BRCA2编码的蛋白在DNA损伤修复、转录调控、细胞周期调控中发挥重要的作用[26, 27]。在BRCA1/2缺陷的细胞中,同源重组修复功能异常,修复DNA双链损伤的精准性降低,可能导致基因突变,重排和拷贝数变异,严重影响基因组的稳定性,促使肿瘤的发生和演进[28]。BRCA1/2基因检测结果已应用于临床治疗过程,影响临床用药决策。PARP是一种DNA修复酶,可识别并修复常见的DNA单链断裂损伤,PARP抑制剂将导致单链断裂累积,作用于BRCA缺陷的细胞时,失去了正常细胞的双保险机制,导致“合成致死”,因此与BRCA突变相关的乳腺癌可从中获益[29]。目前PARP抑制剂已被批准应用于携带BRCA胚系有害突变的HER2阴性乳腺癌,BRCA基因突变患者靶向药物的使用和普及为胚系突变相关乳腺癌的精准诊疗奠定了良好的基础。
(2)ATM: ATM基因最早发现于共济失调性毛细血管扩张综合征,又叫毛细血管扩张共济失调突变基因。癌症基因组图谱计划(The Cancer Genome Atlas, TCGA)对507例乳腺癌患者进行全外显子测序,其中47例患者存在ATM,BRCA1,BRCA2,BRIP1,CHEK2,NBS1,NBN,PTEN, RAD51C 和TP53的胚系有害突变,ATM突变携带者为9例,仅次于BRCA1/2的13例和14例[6]。ATM突变携带者的乳腺癌患病风险为普通人群风险的2~7倍[30, 31]。根据Easton DF等人的总结,ATM可以被认为是乳腺癌的中度外显率易感基因[32]。在蛋白水平也有研究显示,ATM蛋白低表达的乳腺癌患者预后较差[33]。
ATM编码的蛋白属于磷脂酰肌醇酶蛋白家族(PI3K),位于DNA损伤应答上游,作为开关分子激活下游蛋白,磷酸化包括BRCA1,P53在内的多种细胞周期关键蛋白,参与DNA双链修复和细胞周期信号转导[34]。ATM和BRCA2与BRCA1和RAD51一起作用于双链DNA损伤区域,ATM蛋白常与BRCA1、CHEK2发挥相互作用,影响双链DNA 损伤修复,从而对乳腺癌的发病产生影响[35]。ATM作为HR通路中的关键因子,可能导致与BRCA1/2突变相似的DNA双链损伤修复功能缺陷。McCabe等人使用siRNA方法证明ATM具有和BRCA相似的与PARP抑制剂的协同致死效应[36, 37],Williamson和Weston VJ等人通过细胞学方法和动物实验证明了有ATM缺陷的肿瘤细胞较无ATM缺陷的肿瘤细胞具有更好的PARP抑制剂敏感性[38, 39]。因此,ATM基因状态常可能成为预测PARP抑制剂敏感性的另一个分子标志物。另外,有研究报道ATM的表达促进了HER2阳性乳腺肿瘤的生长,ATM基因沉默会降低HER2过表达细胞对靶向药曲妥珠单抗的敏感性[40],曲妥珠单抗是特异性作用于HER2的单克隆抗体,可抑制HER2过度表达的肿瘤细胞的增殖,它的出现曾显著改善了HER2过表达型乳腺癌的治疗,但仍存在耐药性问题有待解决。因此ATM状态或可为 HER2 过表达型乳腺癌的预后和治疗提供信息。
3. 错配修复通路基因:错配修复通路(MMR)是高度保守的修复途径,它的主要作用是纠正DNA合成过程中单个碱基的错配和短核苷酸重复偏差,修复重组过程中产生的不相同的双链DNA分子。MMR基因功能缺陷会导致微卫星不稳定(microsatellite instability, MSI),即基因组中短串联重复序列的错误累积,从而使细胞生长和凋亡的调节功能失常,导致正常细胞发生恶性转变。目前已发现多种基因与MMR通路有关,包括MLH1、MSH2、MSH6、PMS2、POLD等二十余种。MMR通路基因缺陷常见于Lynch综合征,散发性大肠癌和子宫内膜癌[41, 42]。Lynch综合征是一种可引起结直肠及其他部位肿瘤(包括胃、小肠、卵巢、子宫内膜等)的常染色体显性遗传病,约占所有结直肠癌患者的2%~4%。约90%的Lynch综合征患者存在MMR基因的变异,主要是MLH1、MSH2、MSH6及PMS2基因[43, 44]。西方国家基于结直肠肿瘤的大样本研究中MMR通路基因突变率为2.5-3.8%[45, 46],有研究在遗传性高危乳腺癌患者中检测到了MMR胚系突变,并发现 Lynch 综合征患者具有较高的乳腺癌发病风险,但上述结论目前仍存在争议[47]。既往研究显示,MMR通路基因的作用在人类多种恶性肿瘤,如结肠癌、前列腺癌、卵巢癌、乳腺癌中是不同的,并且与肿瘤预后的关系也不一致。
(1) MSH6: MSH6基因是一种错配修复基因,含有11个外显子,编码1358个氨基酸。DNA损伤发生后,MMR可通过多种异源二聚体进行修复,MSH2和MSH6形成异二聚体复合物,识别单碱基错配和短的插入/缺失,而MSH2:MSH3可识别较大的插入、缺失错配[48]。
它与MSH6的胚系突变关系最密切的疾病是Lynch综合征,而MSH6突变与其它恶性肿瘤相关性的报道也陆续出现。有研究显示,携带MSH6突变的Lynch综合征患者常伴随子宫内膜癌,癌组织表现为微卫星低度不稳定[49]。Roberts ME等人在白种人和欧洲血统人群的研究中表明,MMR四个重要基因(MLH1、MSH2、MSH6、PMS2)中只有MSH6和PMS2两个基因与乳腺癌患病风险增加有关,MSH6突变携带者60岁前患乳腺癌的累积风险为31.1%[50]。另有研究表明,携带MLH1,MSH2,MSH6和PMS2任一基因突变的Lynch综合征患者二十年患乳腺癌风险为11%,风险比一般人群高4倍[51, 52]。在Lynch综合征患者患乳腺癌人群中观察到MMR基因突变导致的MMR蛋白缺失,同时乳腺肿瘤具有低分化、高核分裂指数、雌激素受体(estrogen receptor, ER)阴性、孕激素受体(progesterone receptor, PR)阴性等特点[53]。Wasielewski M等人的研究发现正常人群频率低于1%且致病性不明确的稀有MSH6突变在遗传性乳腺癌家族中的基因频率为11.8%,提示MSH6基因变异与乳腺癌的发生发展有关,但致癌机制尚不明确[54]。
(2)PMS2:PMS2基因包含16个外显子,编码由862个氨基酸组成的蛋白。PMS2编码的蛋白与MLH1结合形成异二聚体,具有内切核苷酸的能力,参与错配链的切除和修复,同时也参与DNA损伤细胞的凋亡过程[55]。
PMS2基因与MSH6基因同为Lynch 综合征相关基因,但PMS2被确定为相关基因的时间较晚,且引起的肿瘤有外显率低,家系特征不典型等特征[56-58]。Rasuck CG等人的研究认为PMS2缺失会引起微卫星不稳定性增高,PMS2人群基因分布呈多态性,易发生突变[59]。既往研究报道 PMS2 基因突变患者在Lynch 综合征中的比例约为6% ~ 15%[60, 61],较MLH1的40%和MSH2的39%低[62]。但对于乳腺癌,PMS2也许发挥了更大的作用,Roberts ME 等人的研究显示,PMS2突变携带者较MSH6突变携带者患乳腺癌风险更高,60岁前患乳腺癌的累积风险为37.7% [50]。Balogh GA等人的研究发现在原发性乳腺癌中存在PMS2的缺失突变和移码突变,出现mRNA转录错误,产生缺陷蛋白[63]。
4. 碱基切除修复通路基因:碱基切除修复通路(BER)的作用是修复最普遍形式的DNA损伤,包括氧化应激、水解作用、烷化剂及电离辐射等[64]。8-oxodG是最重要的DNA氧化损伤产物,如果8-oxodG不能及时修复,在复制中易与A错配,导致碱基替换,从而引起基因功能的改变[65]。BER修复过程是通过葡萄糖基转移酶释放碱基,最终由DNA连接酶完成缺口的连接修复,BER可明显降低8-oxodG的致突变作用[66, 67]。BER通路包括MUTYH、XRCC1等在内的三十余种基因。虽然目前针对乳腺癌与BER通路的相关性研究较少,但BER相关基因变异也可能影响DNA损伤的修复效率,增加乳腺癌的发病风险[68]。
(1)MUTYH:MUTYH基因含有16个外显子,编码535个氨基酸,编码的蛋白是一种糖基化酶, 定位于细胞核和线粒体内[69]。,MUTYH酶可切除DNA复制过程中与8-oxodG错配的A,是重要的BER通路基因[70]。如果MUTYH功能缺陷,则易导致碱基的错误颠换,基因功能的失常。
Jenkins MA等人对家系病例进行分析,证明MUTYH 基因的双等位突变会显著增加罹患结直肠癌的风险[71],但单等位突变对结直肠癌的作用仍然存在争议。此外,在家族遗传性胃癌中也发现了MUTYH突变[72, 73]。从既往研究来看,MUTYH 基因突变与乳腺癌风险的关系不甚明确。多项研究观察到MUTYH相关的结肠息肉病女性患者患乳腺癌的风险显著增加[74, 75],但Out AA等人的病例对照研究显示MUTYH与乳腺癌风险并无关联[76]。一项基于中国人群的研究发现在有一级亲属乳腺癌家族史的健康人中 MUTYH c.892-2A > G可能致病突变率高于被确诊的乳腺癌患者,且在两个家系中观察到先证者未携带该突变,但未患乳腺癌的亲属却携带MUTYH可能致病突变[77]。
(2)XRCC1:XRCC1是人类X射线交错互补修复基因,包含17个外显子,编码了由633个氨基酸组成的蛋白质分子,影响细胞对电离辐射的敏感性,在DNA碱基切除修复中发挥着十分重要的作用。XRCC1可通过其N端与DNA聚合酶β、DNA连接酶III、聚腺苷二磷酸核糖基聚合酶PARP等相互协同,发挥支架蛋白的作用,将切口重新连接,完成DNA链的修复[78, 79]。
既往研究显示,人体中XRCC1基因存在着基因多态性,并与头颈部鳞状细胞癌、食管癌、胃癌、结肠癌、胰腺癌、肺癌等肿瘤易感性具有相关性。目前对于XRCC1突变与乳腺癌发生风险的研究结果存在差异,在白种人和伊朗人中均发现XRCC1 rs25487位点的Gln突变使乳腺癌发病风险增高,且随着该位点等位基因数目的增加,患乳腺癌的风险升高;基于亚洲人群的研究也认为该位点的突变能导致亚洲人群及绝经后妇女的乳腺癌易感性风险上升,且可能增强铂类药物化疗的疗效[80-84]。但是,同样有研究表明,XRCC1的rs25487位点与乳腺癌致病风险无相关性,rs3213356位点突变导致乳腺癌发生的可能性降低[85, 86]。
5. 血管内皮生长因子信号通路基因:乳腺癌是一种实体瘤,实体瘤的生长和转移依赖于肿瘤新生血管的形成,许多血管生成因子在多种肿瘤中均有表达,参与血管新生过程。血管内皮生长因子与血管内皮细胞表面受体特异性结合促进内皮细胞增殖、改变细胞外基质、增加血管通透性,从而对肿瘤的发生发展产生影响[87]。
(1) VEGF:血管内皮生长因子(vascular endothelial growth factor, VEGF)基因含有8个外显子,包含14kb的编码区。VEGF编码的蛋白是血管内皮生长因子,是血管新生过程中效力最强的因子之一,它可以诱导内皮细胞钙浓度的变化,影响内皮细胞的基因表达,增加血管的通透性[88]。
既往研究指出,VEGF基因多位点的突变与VEGF血浆水平和表达活性增加相关,从而通过VEGF的表达变化影响肿瘤的发生发展[89-91]。VEGF基因多态性与肺癌,鼻咽癌,多囊卵巢综合征易感性有关[92-94],Brustmann H等人的研究证实,卵巢癌的VEGF表达较良性卵巢肿瘤明显增高,且VEGF表达水平越高,患者的预后越差[95]。乳腺癌患者的血清VEGF含量显著高于乳腺良性肿瘤患者和健康女性[96],乳腺癌在早期阶段VEGF表达就已提高,VEGF表达可能成为乳腺癌早期诊断的依据[97]。
(2) KDR:激酶插入区受体(kinase insertion region receptor, KDR)基因,又称血管内皮生长因子受体-2(vascular endothelial growth factor receptor 2, VEGFR-2),含有30个外显子,编码1356个氨基酸的蛋白质分子。KDR是血管内皮生长因子特异性受体,具有受体型酪氨酸激酶活性,在正常组织中几乎不表达,而高表达于增生活跃的大部分肿瘤细胞及肿瘤血管内皮细胞内[98]。VEGF诱导的肿瘤血管增生需要与KDR结合,从而激活细胞内 VEGF-KDR 信号通路,KDR在VEGF 调控的肿瘤血管内皮细胞增殖过程起重要作用[99]。
许多研究表明,KDR基因多态性与冠心病、高血压、先兆子痫等多种疾病密切相关。KDR基因型与星形胶质细胞瘤的患病风险[100],结直肠癌患者的预后和复发风险[101, 102],和慢粒白血病的化疗反应有一定关系[103]。KDR的表达与小细胞细胞肺癌、肾细胞癌等多种肿瘤的发生发展具有相关性[104, 105],目前国内外对于KDR基因在乳腺癌中的研究相对较少,Price DJ等人的研究表明,乳腺癌组织与良性乳腺组织相比,KDR在乳腺癌中表达明显升高,提示KDR基因变异也许会通过改变其所编码蛋白的表达,进而对乳腺癌的发生发展产生影响[106]。
靶向血管内皮生长因子通路的抗肿瘤药物已取得很大进展,贝伐珠单抗是一种重组人源化单克隆抗体,它可以抑制VEGF-A与其受体KDR结合,减少肿瘤营养物质的供应从而抑制肿瘤生长[107, 108]。但贝伐珠单抗可能诱发严重的副作用,包括中风、肺出血或器官损伤[109],从患者受益和不良反应的平衡上考虑,贝伐珠单抗不适合作为乳腺癌的一线治疗,美国食品药品管理局已撤销了贝伐珠单抗的乳腺癌适应征。中国晚期乳腺癌临床诊疗专家共识(2018版)指出[110],晚期乳腺癌应用贝伐珠单抗,可以使无进展生存期(progression free survival, PFS)有限获益,但不能延长总生存期(overall survival, OS),临床实践中应慎重选择患者。此外,靶点为KDR的雷莫芦单抗目前已被批准用于晚期非小细胞肺癌、胃癌、结直肠癌等实体瘤,对于乳腺癌治疗,已有临床研究显示一线化疗方案雷莫芦单抗+多西他赛的有效性和安全性[111]。
二、乳腺癌易感基因的常用检测技术
乳腺癌易感基因种类众多,突变类型多样,以经典的BRCA1和BRCA2基因为例,其含有错义、同义、无义、移码突变等多种单基因突变形式以及拷贝数变异等多种复杂的结构变异,且突变位置具有散在性,无热点突变区域[112],故以实时荧光定量PCR为技术基础的检测已知突变位点的技术无法满足需求,往往需要测序技术来进行更全面的检测。一代测序技术,又称Sanger 测序,作为基因检测的金标准,曾是基因研究的主流方法,但通量低,耗时长,操作繁琐,同时乳腺癌易感基因检测涉及多种基因和多种突变类型,使用一代测序检测基因全编码区昂贵且费时。因此,Sanger测序目前多用于对基因突变结果的验证,而近年来发展起来的二代测序技术作为一种测序速度快,成本低,通量高的测序方法,是研究乳腺癌易感基因点突变、小片段插入缺失更好的选择。另外,对于基因的大片段重排,结合了DNA探针杂交和PCR技术的多重连接探针扩增技术(multiplex ligation-dependent probe amplification, MLPA)可高效快速地进行基因大片段缺失/重复和拷贝数变异检测,但不适合检测未知突变,因此MLPA可作为二代测序技术的辅助工具,对乳腺癌易感基因检测结果进行补充和验证。
二代测序技术(next-generation sequencing, NGS),又称高通量测序技术(high-throughput sequencing),在未知序列信息的条件下,它能并行数百万计的 DNA片段进行序列测定,可以迅速地实现多基因同时分析,进行高效地基因检测。二代测序不仅可以鉴别出常见突变,也可以发现罕见基因突变,为人类对疾病遗传学的深入了解做出了重要贡献。从开创了NGS先河的Roche公司的454技术,NGS经过不断的技术开发和改进,目前广泛应用的主要是Illumina公司的Solexa和Hiseq技术,ABI公司的Solid技术,和近年来的后起之秀Thermofisher的Ion Torrent技术。第一个商业化运营的二代测序技术平台是Roche454测序系统,它运用焦磷酸测序原理,速度较快,读长可达到近500bp,但无法准确测量同聚物的长度,当序列中存在类似于polyA的情况下,测序反应会加入多个碱基T,T的个数只能通过荧光强度推测,导致测序不准确,引起插入和缺失错误。Illumina公司的Solexa和Hiseq在全球范围已被广泛使用,采用边合成边测序(sequencing by synthesis, SBS)的方法[113],此技术每次只添加一个dNTP的特点能够很好的地解决同聚物长度的准确测量问题,它的主要测序错误来源是碱基的替换。ABI公司于2007年推出Solid测序平台,以连接酶法为基础,对单拷贝DNA片段进行大规模的扩增和高通量并行,其准确性较高,但由于双碱基确定一个荧光信号的技术特点,容易产生连锁的解码错误。Ion Torrent测序仪是第一个不需要光学系统的商业测序仪,所采用的技术为半导体测序,半导体芯片可以直接将化学信号转换为数字信号[114]。Ion Torrent不需要昂贵的物理成像设备,成本较低体积小,上机测序时间较短,操作简单,但具有芯片通量稍低的局限性,适合小基因组和外显子验证的测序。
除二代测序外,基于单分子测序和合成法测序的第三代测序平台也从研究阶段逐渐走向应用,如无需PCR扩增,实时捕获信号的Pacific Biosciences公司的单分子实时合成测序技术(single molecule real-time, SMRT)和Oxford Nanopore Technologies公司的纳米孔单分子测序技术[115]。它们缩短了测序的准备时间,能够有效避免因PCR偏向性而导致的系统错误,同时提高读长。三代测序目前也存在一定的局限性,SMRT测序错误率较高,不存在测序错误的偏向,随机错误需通过多次测序有效纠错。纳米孔测序技术准确性很高,但制作材料要求高,制造费时且昂贵[116]。此外还有真单分子测序(true single molecular sequencing, SMS),荧光共振能量转换技术 (fluorescence resonance energy transfer, FRET)等,但第三代测序平台目前尚未广泛临床应用[117]。
三、乳腺癌多基因联合检测产品的临床应用
乳腺癌由于基因组学、表观遗传和微环境的差异,从而产生高度异质性,这种异质性不仅体现在病理类型和临床特征之间,即使乳腺癌患者具有相似的年龄、肿瘤分型、分期、大小、转移情况、免疫组化等状态,也仍存在着个体差异,同样的治疗方式会产生不同的效果。因此,全面了解乳腺癌的分子生物学特征和基因状况,对乳腺癌患者的精准诊疗至关重要。通过对乳腺癌患者或高风险个体进行基因测序,获得基因信息,从而实施更具有针对性和准确性的判断和治疗。目前,国际上针对乳腺癌的多基因检测组合主要是以下五种:Oncotype DX 21基因检测;MammaPrint 70基因检测;PAM50基因检测;EndoPredict基因检测和Breast Cancer Index基因检测。
1. Oncotype DX 21基因检测:Oncotype DX 21基因检测是Paik S等人通过美国乳腺与肠道外科辅助治疗研究计划(National Surgical Adjuvant Breast and Bowel Project, NSABP)的B14和B20进行研究,再结合基因库及文献数据和患者的预后状况,从250个候选基因中挑选出21个具有较高预测能力的基因,涵盖16个癌症相关基因和5个内参基因,主要包括增殖相关的基因Ki67、CCNB1,激素受体基因ER、PR,通路激活基因HER2、GRB7,和细胞侵袭相关基因CTSL2、MMP11等[118, 119]。根据21个基因的表达情况计算复发风险评分(recurrences core, RS),可有效地预测ER阳性,HER2阴性和腋窝淋巴结(axillary lymph nodes, ALN)阴性的早期乳腺癌患者预后情况及治疗效果(辅助内分泌治疗,辅助内分泌治疗+辅助化疗)[120]。Oncotype DX也有一定的局限性,一部分人群的检测结果为中危风险,处于高低风险间的“灰色地带”,这部分检测结果的解读还需要进一步的研究。总体来说,Oncotype DX基因检测可为临床医生制定治疗方案提供依据,一定程度上减少了辅助化疗的使用,提高患者的生存质量。因此,Oncotype DX已成为包括美国国立综合癌症网络(National Comprehensive Cancer Network, NCCN)和美国临床肿瘤协会在内的国际临床指南的推荐检测项目。
2.MammaPrint 70基因检测:MammaPrint 70基因检测由荷兰癌症研究院和美国Agendia公司合作研发,从近25000个目标基因和1281个参考基因中筛选出70个基因,涵盖了肿瘤转移、增殖侵袭、血管生成、细胞信号传导等相关基因[121, 122]。MammaPrint 70基因检测是ER阳性,HER2阴性乳腺癌患者预后预测的重要工具,对包括腋窝淋巴结阴性、1~3个腋窝淋巴结阳性的患者均可进行预后预测,是目前唯一获批的用于指导1~3个腋窝淋巴结转移的早期乳腺癌的预后评判工具。此外,多项研究还探索了MammaPrint在临床低风险的患者中的应用价值,一项名为MINDACT的大规模、多中心的前瞻性研究提示MammaPrint可为高临床风险患者提供是否应该化疗的依据,但不可为低临床风险患者评估化疗获益[123]。MammaPrint与21基因检测相比有更广泛的患者群体并具有检测费用稍低的优势,但目前的临床研究证据不如21基因检测充分,且不能判断具体化疗药物的敏感性。MammaPrint目前已被NCCN收录为Ⅰ类基于高水平证据的建议,也于近年被纳入中国临床肿瘤学会乳腺癌诊疗指南及中国抗癌协会乳腺癌诊疗指南。
3.PAM50基因检测:PAM50基因检测来源于Parker JS等人对1906个基因的表达情况进行层次聚类,精简基因集合后得到5个分组的50个基因[124],通过测定50个基因的表达量和管家基因的标准化阴阳性对照,对患者进行内源性分子分型的划分,并根据基因的表达情况计算复发风险分数。PAM50多基因检测系统主要用于评估绝经后乳腺癌患者内分泌治疗后的预后状况,近期一项经过15年以上随访的研究表明PAM50分子分型可以独立预测乳腺癌的长期生存,与绝经状态无关,且加入缺氧相关基因可以提高风险预测作用[125],另有研究证明PAM50基因特征也可以为淋巴结转移晚期乳腺癌患者提供预后信息[126]。
4. EndoPredict基因检测:EndoPredict基因检测包含8个复发转移相关基因和3个管家基因,与上述其他多基因检测系统相比,它不仅仅根据基因信息进行评分,还纳入了包括肿瘤大小、阳性淋巴结数量等临床病理特征。EndoPredict的受众群体是ER阳性,HER2阴性的乳腺癌患者,通过计算综合风险得分将患者分为高、低风险两组。Buus R等人的研究结果表明,EndoPredict对于5-10年的晚期远处复发转移风险的预测能力强于Oncotype DX[127],但在化疗获益方面的预测效果仍无充分的证据。目前EndoPredict尚未成为NCCN指南的推荐检测项目,但其诊断试剂盒已在欧洲上市。
5. Breast Cancer Index基因检测:Breast Cancer Index基因检测,简称BCI,是2011年Jerevall PL等人基于早期乳腺癌患者开发的风险预测模型,BCI评分系统包含两部分,一为HOXB13和IL17BR基因表达的比例,二为增殖相关基因的评分[128]。BCI检测系统用来预测ER阳性、淋巴结阴性的乳腺癌的远处复发风险,也有研究证明其在淋巴结阳性患者中也一定的预测能力,尤其是对5年以上转移复发风险的预测[129]。BCI检测系统与上述系统相比,相关研究较少,有效性仍有待验证,目前在国际上还未得到普遍的临床应用。
上述国际乳腺癌多基因检测系统多用于化疗获益和复发转移预测,缺乏用于遗传咨询和治疗指导的乳腺癌多基因检测系统。Oncotype DX已成为NCCN等临床指南的推荐检测项目,但其在中国人群中的预测有效性并未得到验证。我国乳腺癌基因检测仍处于初步阶段,集中于单基因检测,中国人群胚系基因突变的数据相较于西方人群十分不足,中国人群基因突变的数据库尚不完善,我国乳腺癌多基因检测系统缺乏统一专业的行业标准,对于基因的选择范围,纳入标准的制定,目前仍缺乏研究数据的支持。
四、结 语
乳腺癌在2020年已超越肺癌成为全球最常见的恶性肿瘤,也是导致女性死亡的重要原因之一。乳腺癌发病机制影响因素复杂,胚系基因突变发挥重要作用,多基因联合检测可以获取更准确的分子层面的信息,帮助临床制定决策,也可以为风险筛查提供更充分的依据。多基因检测系统的建立基于基因表达谱,人种差异可能导致基因表达谱的不同,目前的研究数据基本源于西方人群,缺乏中国人群的完善数据库,尚无专业统一的我国人群乳腺癌多基因检测的基因选择和纳入标准。乳腺癌遗传易感基因的研究主要集中于DNA损伤修复通路的HR通路,涉及MMR、BER通路的研究仍处于探索阶段。另外,国内关于血管内皮生长因子信号通路与乳腺癌的研究更是少之又少。因此,对我国乳腺癌患者DNA损伤修复通路基因和血管内皮生长因子信号通路基因与乳腺癌发生发展相关性的研究将有助于揭示我国乳腺癌患者遗传易感性的分子机制,有利于乳腺癌高危人群的筛查,为我国乳腺癌多基因检测的基因选择和纳入标准的制定提供理论依据,并为进一步深入研究影响乳腺癌发生发展的分子机制奠定基础。
参考文献略