导语
随着乳腺癌的高发及对乳腺癌的深入研究,学界发现乳腺癌在发病率、分子亚型和预后等方面均表现出遗传依赖性变异。例如非洲裔女性较欧洲女性确诊乳腺癌时更年轻。因此,遗传祖先依赖性变异有可能成为乳腺癌高发及预后不良的驱动因素。
2024年8月9日,美国印第安纳大学医学院Harikrishna Nakshatri团队在Nature Medicine上发表了题为“Single-nucleus chromatin accessibility and transcriptomic map of breast tissues of women of diverse genetic ancestry”的研究论文,利用单核测序技术绘制了全面的乳腺组织染色质可及性及基因表达图谱,为进一步探索健康乳腺的遗传祖先依赖性变异提供了重要资源。
研究人员收集了92名妇女的健康乳腺组织,通过遗传祖先定位[1]将供体进行了估计单细胞核图谱揭示了不同血统女性患乳腺癌的风险差异分类(图1a)。基于祖先的单细胞核转录组测序(snRNA-seq)与单细胞核染色质可及性测序(snATAC-seq)综合分析一共鉴定出10个主要细胞群(图2b)及其差异表达基因(DEGs)(图1e, f),并鉴定了各种细胞类型不同的状态(图1c, d)。其中成熟管腔细胞、管腔祖细胞和基底细胞经CD49f和EpCAM标记区分。
随后,研究人员使用SCENIC推断出71个基因调控网络,使用Signac在snATAC-seq数据中进行了转录因子结合位点分析,发现了一些在特定上皮细胞类型中富集的转录因子,例如GHRL-1转录因子在管腔适应性分泌前体(LASP)细胞中表达水平较高,其结合位点在LASP_ AP细胞中富集。这些发现扩展了健康乳腺上皮细胞的基因调控网络。
图1 健康女性乳房的snATAC-seq和snRNA-seq综合分析
随后,研究人员关注了管腔激素感应(LHS)细胞、基底肌上皮(BM)细胞和LASP细胞的标记基因,包括LHS 细胞的ESR1、FOXA1和 GATA3;LASP细胞的ELF5、EHF和KIT;BM细胞的TP63和KRT14(图2a-v)。基于IHC计算20名供体的乳腺导管和小叶中细胞核的百分比,观察到GATA3的阳性评分较高,其次是 ERα,FOXA1是乳腺组织导管和小叶中表达最少的蛋白质(图2w)。
图2 FOXA1,EHF,ELF5,TP63和KRT14显示上皮亚型富集表达和染色质可及性特征
接下来,研究人员使用空间转录组学比较了同一供体不同时间点(相差10年)的乳腺导管和小叶上皮细胞的差异,发现MGP,ANXA1,TACSTD2,KRT14,KRT17,WFDC2,STAC2和 ALDH1A3在导管上皮细胞中升高,而APOD和SNORC在小叶上皮细胞中升高。关于年龄依赖性变化分析显示,PTBP1在所有乳腺癌亚型中均过表达;表达随年龄增长而减少的上皮细胞基因(168个基因,P < 0.05)与蛋白激酶A (PKA)信号通路相关,而表达随年龄增长的上皮细胞基因(183个基因)参与真核起始因子2(eIF2)和氧化磷酸化通路。
接着研究人员分析了基于遗传祖先分组的BRCA1和BRCA2突变状态。首先观察到各血统人群乳腺组织的AP细胞比例不一(图3a, b),分析认为这些差异并非因年龄、体重、分娩数量及细胞增殖速率而出现。研究人员注意到ESR1在美洲土著的LASP细胞中表现出遗传祖先依赖性变异(图3c),于是检查了该基因及其他基因在LHS、LASP和BM细胞中的染色质可及性(图3d),并未发现相关性(图3e-h)。然而,在LASP第9簇细胞中,研究人员发现该群的ER和EGF信号串扰可能占主导地位。
图3 细胞状态的遗传祖先依赖性变异
研究人员对欧洲血统女性的乳腺组织进行了独立的snRNA-seq检测(图4a),发现在非洲和欧洲血统妇女的乳腺组织中,上皮细胞和成纤维细胞状态有很大的差异。例如,非洲人群的LASP细胞群主要由BL细胞状态组成,而欧洲女性中有相似数量的BL和AP细胞。ESR1和 FOXA1的表达仅限于两组的LHS细胞(图4b)。与美国土著人的乳腺组织不同,AP细胞与其他LASP细胞相比不高表达ESR1。非洲和欧洲女性的细胞差异不可归因于增殖率(图4c)。
研究人员分析了PROCR,ZEB1和PDGFRα的表达模式,它们在成纤维细胞均表现阳性(图4d)。健康乳腺中的成纤维细胞存在四种不同的状态: 纤维基质前体、纤维基质SFRP4、纤维主体和纤维基质。成纤维细胞状态存在遗传祖先依赖性变异,非洲血统女性显示特定的富集基因,以牺牲纤维-基质状态为代价生成纤维-前基质状态(图5e, f)。比较其他祖先组和BRCA1、BRCA2突变携带者的成纤维细胞群发现,细胞状态有相当大的变化(图4g)。
图4 使用snRNA-seq对非洲血统妇女与欧洲血统妇女的乳房组织进行比较分析
最后,研究人员检查了内皮细胞和T细胞标记基因用于显示细胞类型特异性染色质可及性的可靠性,发现CD4 + T细胞富含的IL7R和CD8 + T细胞富含的IFNγ可显示T细胞特异性表达和染色质可及性;CD8+ T细胞富集的GZMK其表达和染色质可及性仅限于T细胞;巨噬细胞富含的FCGR3A的染色质可及性仅限于巨噬细胞。
在内皮细胞中,淋巴内皮细胞标志物LYVE1在内皮细胞2亚群和巨噬细胞亚群中表达,但是这两种细胞类型中的染色质可及性模式不相似;内皮茎样亚型标志物ACKR1在内皮细胞1亚群的一个子集中表达,但是该基因调控区域中的染色质在所有细胞类型中均可获得;在内皮细胞1亚群和成纤维细胞中表达的CXCL12在除T细胞外的所有细胞类型中都表现出相似的染色质可及性模式。
以上结果表明,乳腺组织细胞同一性基因特点与造血系统不同,细胞同一性基因的染色质可及性和基因表达并不一致。
综上所述,研究团队通过单核测序技术绘制了不同血统女性的乳腺组织基因表达图谱与染色质可及性图谱,建立起全球性的乳腺单核数据集。基于分析结果,研究人员提出了两个主要的遗传祖先依赖性差异细胞群:土著美国人健康乳房的管腔祖细胞,和非洲血统妇女的基质成纤维细胞。美洲土著的管腔祖细胞表达较高水平的 ESR1,这可能影响这些妇女乳腺组织中的雌激素信号传导;非洲裔女性成纤维细胞亚型可影响乳腺微环境。
原文链接:https://www.nature.com/articles/s41591-024-03011-9
[1]Kumar, B. et al. Stromal heterogeneity may explain increased incidence of metaplastic breast cancer in women of African descent. Nat. Commun. 14, 5683 (2023).
- THE END -
想了解更多关于单细胞测序信息,欢迎点击“阅读原文”留下联系方式,我们将安排同事与您对接。
收藏
登录后参与评论