Week24 — 人类原发性肿瘤的染色质可及性图谱-01 上篇文章首先回顾了ATAC-seq方法的原理和优点,以及与其他研究染色质可及性方法的比较,然后介绍了这篇文章的主要结果和亮点,以及提供的数据资源。 这篇文章将会从文章思路和主要结果解读。
数据分析前的质控,TSS富集、片段长度分布特征、peaks的reads比例。 其中常用于判断实验是否失败的片段长度分布特征原理如下(摘抄于ATAC-seq交流群中来自菲沙基因小伙伴的总结):
核小体完整的话,缠绕核小体的DNA不会被切,被切的是核小体之间的片段,缠绕核小体的146bp的DNA是完整的,加上接头,就会形成特有的280-300bp左右的片段。而且以这个为基数,两倍就是两个核小体,三倍就是三个核小体,依次类推,就形成了层次分明的特征条带。如果核小体解聚,那么缠绕核小体的146bp也会被切除,自然就没有特定大小的DNA富集,形成的就是一片模糊的弥散条带。
为了识别鉴定ATAC-seq peaks和基因表达之间的假定因果联系,他们基于相关性的方法建立模型进行预测。具体方法如下图所示:
这篇文章其中的一个亮点是揭示了调控元件处的突变影响着染色质的可及性,如突变通过影响转录因子的结合调控染色质的可及性。他们通过整合WGS数据和ATAC-seq数据,鉴定到上千个体细胞突变落在启动子区域和调控元件区域。如TERT启动子区域的突变,这也表明ATAC-seq与外显子测序相比,可以鉴定调控元件处的突变,而WES是不包括启动子区域。 除了TERT启动子处的突变,还有增强子的突变,如FGD4。eFGD4的突变产生NKK TF的结合位点,导致在FGD4上游12-kb区域内的染色质可及性大幅增加。FGD4的高表达与膀胱癌低生存率显著相关,进一步表明FGD4的突变可能对特定癌症产生影响。
除了体细胞突变,他们还整合了GWAS数据,发现MYC位点附近有两个肿瘤易感性SNP位点rs6983267和rs35252396。其中SNP rs6983267与结肠癌和前列腺癌的染色质可及性增强相关,该结果与以往报道一致,同时也与乳腺癌和鳞癌染色质可及性相关,后者是之前研究没有发现的。另一个SNP位点rs35252396与肾透明细胞癌(KIRC)、乳腺癌、甲状腺癌的染色质可及性有强烈的相关性。这些结果都表明SNP可能在肿瘤中扮演者潜在的重要作用。
他们基于已知的免疫细胞特异性调节元件的可及性来估计免疫浸润的水平。这些区域的可及性还与肿瘤纯度成反比,为去卷积体瘤数据提供了附加信息。 同时他们还研究了与免疫治疗的一个重要靶标PDL1相关的峰值,PDL1的表达受50kb之内的四种调控元件的影响,并且不同癌症类型的可及性不同。了解PDL1和其他药物靶点的调节元件的状态或许可以为个性化治疗提供一个路径。