为了区分肺腺癌(ADC)和肺鳞状细胞癌(SqCC),并寻找新的肺癌发生驱动因素,作者对例肺腺癌和例肺鳞癌肿瘤-正常组织配对样本(tumor–normalpairs.)进行了外显子序列和拷贝数分布的分析。研究发现:肺鳞癌中的常见变异更类似于其它鳞状细胞癌而非肺腺癌。新发现的突变基因有:肺腺癌中的PPP3CA、DOT1L和FTSJD1;肺鳞癌中的RASA1;以及同时在两种类型中出现的KLF5、EP和CREBBP。新发现的的扩增峰(Newamplificationpeaks)有肺腺癌的MIR21,鳞癌的MIR,及两者共有的MAPK1。同时,缺乏RTK(receptortyrosinekinase)-Ras-Raf通路的肺腺癌存在SOS1、VAV1、RASA1和ARHGAP35的基因突变。47%的肺腺癌和53%的肺鳞癌有至少5个预测的新表位。尽管肺腺癌和肺鳞癌的靶向治疗在很大程度上是不同的,但是免疫疗法可能有助于两种亚型的治疗。
文章题目:Distinctpatternsofsomaticgenomealterationsinlungadenocarcinomasandsquamouscellcarcinomas
研究人员:来自BroadInstituteofHarvardandMIT,Dana-FarberCancerInstitute等机构的研究团队
发表时间:.05
期刊名称:Naturegenetics
影响因子:27.研究背景
肺癌是全球最常见的癌症,仅年美国就有,例新发病例和,例肺癌死亡。肺癌的两个主要组织学亚型是非小细胞肺癌(NSCLC)和小细胞肺癌(SCLC)。而NSCLC主要包括肺腺癌和肺鳞状细胞癌。这两种NSCLC亚型具有一些共同的临床和组织病理学特征,例如,吸烟是两种亚型的主要危险因素。靶向RTKs的分子靶向治疗在具有相关激酶基因变异(包括EGFR、ALK和ROS1)的肺腺癌中具有显著的反应。
近期的研究主要集中在全面地描绘肺腺癌和肺鳞癌的基因组、转录组、蛋白质组、表观基因组的改变,以发现可能在临床上可行的新癌症驱动基因。鉴定新的癌症相关基因具有一定困难,这是由于长期暴露于烟草致癌物质或遗传诱变过程(如APOBEC胞苷脱氨酶的异常活性)会导致乘客突变(passengermutations)的大量积累。大量的样品分析及跨肿瘤类型样品组合可以帮助克服这个问题,从而鉴定出更低的频率(对比其它具有乘客突变的基因的突变频率)的重要基因突变。此外,目前还没有过肺腺癌和肺鳞癌中基因突变的综合比较,这样的对比分析可以寻找二者致癌机理的相似和差异,并揭示这两种亚型对不同疗法的反应程度。
样本选择
例肺腺癌/正常配对的外显子序列(包括未发表过的例,TCGA报道过的例,和Imielinski等人搜集的的例)
例肺鳞状细胞癌/正常配对外显子序列(包括未发表的例和TCGA报道过的例)
研究成果
比较体细胞基因组改变
对上述样本进行研究,观察到肺腺癌体细胞突变率中位数为8.7mutations/Mb,而肺腺癌为9.7mutations/Mb。排除了部分表达较低的基因后((log2(FPKM)6.16forlungADCsand6.27forlungSqCCs),通过MutSig2CV鉴定出38个基因在肺腺癌中显著突变、20个基因在肺鳞癌中显著突变,但只有6个基因(TP53,RB1,ARID1A,CDKN2A,PIK3CA,NF1,重叠比例为12%,图1a)在二者中均存在显著突变,肺鳞癌中TP53、CDKN2A和PIK3CA突变频率显著较高(p0.01)。类似地,在42个局部扩增峰中只有11个为二者共有(图1b),50个局部缺失峰中只有13个为二者共有(图1c)。通过与TCGA的其它19种癌症数据对比,发现肺腺癌和和肺鳞癌的显著突变基因列表分别与其它类型肿瘤的显著突变基因列表有着更大的重叠(13%):肺鳞癌中经常突变和扩增的基因与头颈部鳞状细胞癌(HNSC)和膀胱癌(BLCA),及两种与吸烟流行病学关联的上皮癌更为相似(25%重叠),在这些重叠基因中,TP53、CDKN2A和FAT1特异性富集在HPV-阴性HNSC变异处;而肺腺癌显著突变基因与胶质母细胞瘤(GBM)和结肠直肠癌(CRC)更为相似(FDRqvalue0.1)。虽然肺腺癌与肺鳞癌存在共有的局部缺失峰,但其中5个峰为推定的脆性位点(图1c中绿色)。总的来说,肺腺癌与肺鳞癌的有致癌作用的体细胞驱动因素可能有很大的不同。
图1肺腺癌与肺鳞癌体细胞基因组改变的不同
肺癌的突变特征
先前的大规模肺癌基因组的研究已经确定了与吸烟和不吸烟状况相关的突变特征,本研究利用大样本量带来的的统计优势来扩展这些发现。使用非负矩阵分解法(NMF),我们鉴定了6组突变特征,其中有许多与COSMIC数据库中先前定义的特征密切相关,其中包括:一个紫外相关特征(TCC或CCC的CT变换,简写SI7)、一个吸烟相关特征(CA颠换,SI4)、一个错配修复(MMR)特征(GCG中的CT变换,SI15/SI6)、2个APOBEC相关的特征(TCT或TCA的CG或CT变换,SI13和SI2)、一个与COSMICsignature5(SI5)存在中等相关性的特征(被认为有“分子钟“属性)。
除了识别突变特征外,NMF还估算每个样本内的不同突变特征的突变数。SI4特征(吸烟相关)的每百万碱基突变数在肺腺癌中表现为双峰模式,但在肺鳞癌中为单峰(图2a)。利用SI4的每Mb突变率,能够将患者分为有吸烟史和从无吸烟史两类,在肺腺癌患者(AUC=0.87)中的分类效果较肺鳞癌(AUC=0.62)中更好,这表明18名无吸烟史的肺鳞癌患者的吸烟状况可能不准确。87%的无吸烟史的肺腺癌患者被归类为低颠换率组(≤0.SI4mutations/Mb;P=8.5×10?37,Fisher’sexacttest;图.2b),然而只有45%的低颠换率肺腺癌患者无吸烟史(图2b)。将特征的估计突变数除以所有特征的估计突变的总和,得出一个特征的估计突变的分数。与肺腺癌相比,肺鳞癌存在显著高的SI5突变率(p0.,Wilcoxonrank-sumtes),然而,无吸烟史的肺腺癌患者却拥有最高的SI5突变率(图2c)。在肺鳞癌中,我们还观察到肿瘤分期与SI5活性和总突变率存在中度关联(p0.01)。
图2肺癌突变特征比较
3处肺鳞癌(1%)的突变特征表现为UV相关突变(SI7,通常在黑色素瘤中观察到)模式,与其它肺肿瘤相比显示出显著更高的体细胞单核苷酸变体(SSNVs)和体细胞二核苷酸多态性(SNPs)突变率(p0.01),但indel发生率并不显著高(P0.05;图.2d)。其中一例患者(TCGA-18-)有前额基底细胞癌病史,增加了癌症从皮肤转移到肺部的可能性。具有上述特征的其他两例肺鳞癌也可能也是皮肤鳞状细胞癌的肺转移。另外7个肿瘤(4个肺腺癌和3个肺鳞癌)的突变特征表现为MMR特征(SI15/SI6,通常在微卫星不稳定(MSI)的结肠直肠癌观察到,图.2e)。这些肿瘤的错配修复基因MLH1表达水平都较低(p=0.),这表明了存在这种特征的肺癌的潜在病因。
新发现的显著突变基因
将发现的显著突变基因与来自TCGAPan-Cancer研究的其他肿瘤类型进行比较,发现几个基因只在肺腺癌中显著突变,包括STK11、RBM10、KEAP1、RAF1、RIT1和MET(MutSig2CVqvalue0.1;图.3a);而NFE2L2、KDM6A、RASA1、NOTCH1、HRAS则只在肺鳞癌中显著突变(不包括HNSC和BLCA)(图.3b)
图3 与其他癌症相比,肺癌中显显著的基因
图4 肺癌中的新显著突变基因
图4为于两种肺癌类型的新显著突变基因图,包括肺腺癌(图4a)的PPP3CA,DOT1L和FTSJD1,及肺鳞癌(图4b)的RASA1和CUL3。图4c为组合(pan-lung)分析确定的具有热点的显著突变的基因,包括KLF5和两个旁系同源基因(EP和CREBBP)。
新的体细胞拷贝数变化
大容量样本有助于我们检测新的拷贝数变化,并确定扩增和缺失的假定靶基因。对于包含许多基因的峰,本研究通过对比11种肿瘤的泛癌症拷贝数,分析其中相同的峰来推断出靶基因。肺腺癌中最显著的扩增基因是NKX2-1、MYC、TERT、MCL1和MDM2(图5a);而肺鳞癌中则是SOX2、CCND1、WHSC1L1-FGFR1、MYC和EGFR(图5b;)。肺腺癌中的KAT6A、ZNF、MYCL1扩增峰(图5a),和肺鳞癌中的IGF1、KDM5、PTP4A1-PHF3、MYCL1扩增峰都曾在其他类型肿瘤相关文章中被报道过,但很少在肺肿瘤中被发现(图5b)。
CCND3在肺腺癌中特异性扩增,它的扩增峰在MIR21–TUBD1邻近位置(图.5c),这曾在乳腺癌中被观察到。MIR21被证明是早期肺腺癌的预后因子。类似的,在肺鳞癌的新的扩增峰中发现包含YES1,YES1编码Src家族非受体蛋白激酶和MIR(图5d)。MIR的表达已被用于从NSCLC中识别出肺鳞癌,表明该miRNA的扩增可能代表了与SOX2扩增类似地的谱系特异性改变。最后,联合Pan-Lung拷贝数分析结果鉴定出了MAPK1周围的额外扩增峰。
图5肺癌中的显著扩增
识别肺腺癌中的RTK–Ras–Raf驱动
在肺腺癌中,RTK-Ras-Raf信号通路的组件的互斥变异是特别有意义的。在临床试验中观察到肿瘤对RTK抑制剂的显著反应,比如在一些对于携带EGFR突变或ALK/ROS1易位的肺腺癌的患者。然而,许多肺腺癌组织在该通路中未显示出已知的活化突变,提高了存在具有低频体细胞事件的未知基因的可能性。为了进一步了解该途径的体细胞景观,我们首先描述已知通路组件之间的变异,然后鉴定出具有互斥变异的新基因。已知通路基因的新变异包括MAP2K1中的复发性框内插入(in-frameinsertion)、MET与其相邻基因CAPZA2的基因融合(图6)。在没有其他已知活化变异的肿瘤中观察到曾被报道过的TRIM24-NTRK2和KIF5B-MET基因融合。有趣的是,在肺鳞癌中也发现了NTRK2与TP63的融合(图6)。如先前观察到的,高水平的MET和ERBB2扩增在该途径中富集在没有其他已知的活化变异的肿瘤中(P0.01;补充图16)。一例肺腺癌(TCGA-49-)具有导致激酶结构域重复的激活性EGFR变异。通过人工检查,我们在17例肿瘤样本中观察到KRAS,EGFR或ERBB2的典型突变,在11例中观察到EGFR或MET中的复杂indel。
图6涉及MET和NTRK2的基因融合
具有可影响RTK-Ras-Raf驱动的活化SSNV、indel、扩增或基因融合的肺腺癌被称为“致癌基因阳性”(n=),而其余的肺腺癌被称为“致癌基因阴性”(n=)。我们在癌基因阳性组中排除了NF1突变的肿瘤,因为该基因的突变与RTK-Ras-Raf通路相关的其他基因的突变并不完全相互排斥。为了确定此通路中的其他潜在的驱动因素,研究者对在MutSig2CV分析中显著突变的基因,或在Ras通路调节中重要的基因变异是否在癌基因阴性组中富集进行探究。结果发现共有15个基因在阴性组中显著富集,包括已知的Ras通路组件SOS1和RASA1以及Rho激酶通路组件VAV1和ARHGAP35(q值0.1;图7a,c)。我们还发现在FGFR1-WHSC1L1(8p11.21),PDGFRA-KIT-KDR(4q12)和MAPK1(22q11)附近的扩增峰仅在在癌基因阴性组中显著(q值0.25;图7b,c)。总共(76%)例肺腺癌显示发生了已知或推定的RTK-Ras-Raf驱动基因的改变(图7c)。
图7肺腺癌中RTK–Rho/Ras–Raf通路的新变化
新的共同发生的变异包括MET扩增和NF1突变(P=0.)。此外,高水平EGFR扩增与活化的EGFR突变显著重叠(P=1.9×10-8),STK11突变与活化KRAS突变显著重叠(P=1.1×10-6;图7c)。此外,28个RTK-Ras-Raf通路致癌基因阴性的肺腺癌具有STK11突变(图7c),表明STK11突变可能是一个潜在的、仍未被认识的KRAS相关基因变异。
新抗原负载和复发的评估
随着对肺癌免疫检查点抑制剂研究的日益增加,本研究全面分析了有免疫原性潜能的突变景观。
对所有患者的每个由体细胞错义突变生成的蛋白序列,我们都评估了其被加工并通过HLA提呈给免疫细胞的能力。然后,我们评估了产生免疫原性(生成新抗原表位或新抗原)突变的数量与临床特征之间的关联,并确定了在肺癌中最常见的新抗原。在有吸烟史的患者中,肺腺癌与肺鳞癌之间的非同义突变和新表位数量无显著差异(图8a,b)。但是,在肺腺癌中,无吸烟史患者的非同义突变和新表位数量显著(P0.,Wilcoxonrank-sumtest;图.8a,b)低于有吸烟史患者,并且这些数量与肺腺癌的吸烟史有关,但在肺鳞癌中并不相关(P0.,Kruskal–Wallistest)。
图8肺癌中的新抗原负载
预测为新表位的突变在至少4个肿瘤中都发生,包括PIK3CAp.EK、NFE2L2p.E79Q、BRAFp.GV和EGFRp.GA;TP53也存在若干突变,包括p.VF、p.GV、p.RG和p.PA(图8c)。C3orf59基因(也称为MB21D2)以前被报道与肺癌有关,它的高频突变编码的p.GlnGlu具有预测的新表位特性(图8c)。总的来说,47%的肺腺癌和53%的肺鳞癌样本至少具有5个预测的新表位,表明免疫治疗策略有很大的潜力。
讨论
本研究分析了例肺癌的外显子序列和拷贝数,以探究肺腺癌与肺鳞状细胞癌的相似与不同之处。与基因表达研究结果一致,分析结果显示这两种肺癌的突变基因和复发性体细胞拷贝数变异很大程度上是不同的。
本研究还观察到了肺鳞癌与头颈鳞状细胞癌和膀胱癌亚群之间的相似性。这些差异表明在不同的细胞环境中体细胞的改变可以具有不同的致癌潜能。因此,源自于不同组织但发育过程类似的癌症之间可能更为相似(对比在解剖学上定义的组织内源自不同原始细胞的癌症)。
本研究还鉴定了包含MAPK1、YES1和CCND3的蛋白质编码基因的几个新的局部扩增峰。由于本研究中的突变分析集中在蛋白编码基因的全外显子序列测序,因此我们无法分析非编码基因或调控元件中的突变。
研究还发现了RTK–Ras–Raf通路中的多个突变基因,其中包括多个新鉴定的基因,如RASA1,SOS1和VAV1。之前的相关研究由于样本量较少,无法检测重复突变的SOS1,但本研究能够检测到这些突变体,这进一步说明了增加样本量可以帮助检测稀有事件。由于缺少对应的RNA-seq数据,得到的致癌融合或METexon14skipping事件的比率可能偏低。由于15%-25%的肺腺癌在RTK–Ras–Raf通路中未发现已知的、可检测的突变,所以我们没能在已知的和新的通路元件中发现新的罕见的复发性突变。其他通路的研究可能也存在类似情况。
最后,我们检查了单个错义突变的免疫原性,以更全面地了解新表位负载与总体非同义突变率和临床变量(如吸烟状态)之间的关系。一些高频突变被预测为新抗原表位。未来的研究可能进一步揭示这些变量之间的关系,探究肿瘤对免疫检查点抑制剂和个性化疫苗疗法的临床反应。
参考文献:
[1]JoshuaD.Campbell,AntonAlexandrov,JaegilKim,et,al.Distinctpatternsofsomaticgenomealterationsinlungadenocarcinomasandsquamouscellcarcinomas[J].Naturegenetics,,48(6):–.
扫码