乳腺肿瘤异质性的分子定义概要:有明显包括干细胞状属性表型的细胞被提出存在于正常的人类乳腺上皮和乳腺癌,但他们的详细的分子特征和临床意义尚不清楚。我们通过使用优先与干细胞状属性相关联的标记确定了从癌细胞和正常乳腺组织中纯化出的细胞的基因表达和遗传图谱。来自不同个体肿瘤的CD24+和CD44+细胞是相关的同源细胞,但并不总是完全相同的。CD44+细胞特异的基因包括许多已知的干细胞标志物基因及与降低病人存活率相关的基因。TGF-β通路是专门活跃在CD44+癌细胞中的,其抑制剂诱导产生更上皮样的表型。我们的数据显示了CD44+细胞和不同的肿瘤细胞群体治疗靶点的预后的相关性。介绍:虽然起源于正常细胞的肿瘤由于积累了遗传的和表观遗传学的改变,但是肿瘤起始细胞的身份很大程度上是未知的。干细胞已经被提议作为具有吸引力的目标,这是因为他们与癌细胞有很多相同的特征,包括自我更新的能力、产生异构的后代并且迁移侵入周围组织。与此相关联的,正常干细胞功能所需的几个通路和基因在肿瘤细胞中被激活并且在肿瘤发生中发挥重要作用。癌症干细胞被定义为具有干细胞状属性的肿瘤细胞的一个子集,干细胞状属性被认为是负责肿瘤生长、恶化、复发的。许多年前提出了这个假说且近年来通过新的实验方法得以复兴。通过频繁地使用细胞表面标记物特异的标记来自相同器官的正常干细胞,假定的癌症干细胞已被从各种人类的肿瘤类型中纯化出来了。通过在体外克隆性和体内致瘤性的研究中的演示,这些孤立的细胞的致瘤性和“干细胞特性”已经被证明了。人类乳腺上皮细胞分化的阶段和独特的识别分化细胞和祖细胞的标记物是没有明确定义的。体外克隆性研究表明双极的祖细胞的存在能增加腔上皮和肌上皮细胞、谱系限制性腔上皮细胞和肌上皮细胞的祖细胞,以及分化的腔上皮和肌上皮细胞。MUC1和CD10(CALLA/MME)被认为是分别由腔上皮细胞和肌上皮细胞表达的。CD44是出现在祖细胞中,然而在正常人类乳腺中上皮细胞表达CD24尚未确定。在乳腺癌中,Al-Hajj等人证明了来自于乳腺癌患者的恶性胸腔积液的Linˉ/CD44+/CD24ˉ/CD24低(后来归类为CD44+)细胞在NOD/SCID小鼠中比在CD44/CD24+(后来归类为CD24+)细胞中具有更多的肿瘤发生,结果xenografts复制原始肿瘤的异质性,从而产生CD44+细胞是乳腺癌干细胞的假设。随后在乳腺癌和前列腺癌的研究中证实,CD44+细胞是肿瘤发生细胞,当将其注入免疫缺陷小鼠时则产生祖细胞状的性状。所有这些研究都没有分析复杂的分子结构和临床CD44+细胞和CD24+细胞的相关性或提供确凿的证据证明CD44+肿瘤细胞是干细胞且CD24+肿瘤细胞是他们的后代。此外,癌症干细胞和肿瘤恶化基因克隆发展的假设之间的关系也没有被研究。为了着手解决这些问题,我们使用CD44和CD24从乳腺癌组织中纯化出了细胞并且确定了他们全部的基因表达和基因图谱。相比之下,我们也从正常人类乳腺上皮分离特化了CD44+和CD24+细胞。CD44+乳腺癌细胞特定的基因标签被优化为已知的干细胞标记物和相关的临床结果以及信号通路的活跃性,但癌症的CD44+和CD24+细胞并不总是基因完全相同的。结果:净化和基因表达谱数据不同的乳腺上皮细胞群我们使用在分化的细胞或具有干细胞性状的细胞中有特异表达的细胞表面标记纯化了正常乳腺上皮和乳腺癌细胞不同的细胞亚群(图1A)。我们从来源于乳房缩小整形术和不同时期的乳腺肿瘤的正常人类乳腺组织中纯化出了CD44+和CD24+细胞。基于最初的从胸膜积液和腹水样本纯化出的CD44+细胞的基因表达图谱,我们发现了一个CD44+细胞特异的基因(PROCR),它编码一个细胞表面受体,并且与同样表达在白细胞和肌纤维的CD44细胞相比更特异的表达于CD44+上皮细胞。PROCR已被作为一种造血、毛囊、神经和胚胎干细胞的标记。在证实100%的CD44+肿瘤细胞呈PROCR阳性后(数据没有显示),我们使用这个标记从主要入侵的乳腺肿瘤中分离CD44+/PROCR+(后来归类为PROCR+)细胞(参见在补充数据中可提供的这篇文章的在线数据中的图S1A)。在补充数据中提供了纯化过程和组织样品的详细描述。图1.不同细胞亚群的纯化和基因表达分析(A)来自正常乳腺组织和侵入性转移性乳腺癌癌组织的各种细胞的纯化原理图解。使用对每个细胞类型特异的抗体耦合磁珠捕获细胞。有矩形框的纯化步骤并不总是包括在流程中,而标有星号的肌纤维只存在于侵入性肿瘤。IDC表示浸润性导管癌。分离于正常乳腺组织的纯化后的细胞片段的半定量PT-PCR分析(N1)(B)胸腔积液(PE2)(C)主要浸润性导管癌(IDC28)(D)来自于CD24+,CD44+和PROCR+细胞的RNA的已知分化(Diff)和干细胞特异基因的表达检测。CD44+和PROCR+细胞缺乏分化标记且呈干细胞标记物阳性。在主要的侵入性肿瘤,CD44+片段被白细胞污染了,说明它有高水平的CD45白细胞共同抗原(PTPRC)的表达。ACTB作为上样对照。每个三角形表明一个PCR循环的增加(25、30、35)。(E)来自CD44+、PROCR+和CD24+细胞的SAGE库的系统树图描绘了其相关性。层次聚类应用于SAGE数据显示的库,并且聚类热图选定的部分显示在这里。每一行代表一个标签,并且用最佳匹配那个标签的基因符号标记(或“不匹配”如果没有发现匹配的记录)。红色和绿色分别显示高和低的表达水平。正常的和肿瘤的CD44+和PROCR+细胞的表达图谱之间比那些来自同一个组织的CD24+细胞更相似。ASC,腹水;PE,胸腔积液;N,正常;IDC,浸润性导管癌。(F)基因本体生物过程类别高度代表了来自不同的细胞类群的SAGE库。至少在一个库中,使用DAVID功能注释工具绘制的类别的富集得分2。细胞类群代表包括癌症CD44+和PROCR+(红色),正常的CD44+和PROCR+(粉色)、癌症CD24+(深蓝色)和正常的CD24+(浅蓝色)细胞。我们使用白细胞,管腔上皮细胞,肌上皮细胞和干细胞标记物通过半定量的RT-PCR证实了纯化和分化状态的细胞分数(图1B-1D和图S1B)。已知的腔上皮细胞和干细胞的标记分别在CD44+和CD24+细胞中有接近互斥地专一的表达,这表明他们可能的确分别代表腔上皮和祖细胞状的细胞。正常乳腺组织和乳腺癌组织的CD44+细胞中都存在低丰度的雌激素受体α(ESR1),意味着这些细胞对雌激素没有反应(图1B-1D和表1Ⅱ)。在正常CD44+细胞中雌激素和孕激素受体以及ERBB2的缺乏进一步证明这些细胞可能代表祖细胞,因为鼠乳腺上皮干细胞不表达这些蛋白质。我们还分析了包括BMI1和刺猬(Hh)-信号通路基因在内的与自我更新相关的基因的表达。Gli2和Gli1在CD44+细胞中比在CD24+细胞中表达量更多,这反映了(Hh)信号的活性,而BMI1在两种细胞中的表达本质上是相同的(图S1C和S1D)。为了确定纯化细胞全面的基因表达图谱,我们从纯化于从乳腺癌患者体内收集的正常乳腺上皮细胞和胸腔积液、腹水以及原发性浸润性肿瘤样本的CD44+和CD24+细胞中生成了SAGE(基因表达的系列分析)库(具体描述见补充数据)。我们给每个SAGE库分配了一个基于样本和用于纯化细胞的细胞表面标记的名称。SAGE数据进一步支持了假设CD44+和CD24+细胞分别代表更多分化的腔上皮和祖细胞状细胞,因为在各自的SAGE库发现已知的这些细胞的标记几乎是相互专一的(表1i和1ii和表s1-s6)。SAGE库在无监督下的层次聚类证明正常的和癌症的CD44+和PROCR+细胞之间要比同来自同一组织的CD24+细胞更相似(图1E)。在各种SAGE库中基因功能的分类表表1.选择的基因在CD44+或PROCR+和CD24+细胞之间的差异表达匹配的SAGE标签序列,在每个指明的SAGE库中计算每200000个标签,并且列出了基因符号和为基因编码已知的干细胞(Ⅰ)或分化(II)细胞标记物或TGF-β通路组件和目标物(III)的描述。N,正常;PE,胸腔积液;ASC,腹水;IDC,浸润性导管癌。达揭示癌症的和正常的CD44+和PROCR+细胞含有更丰富的参与细胞运动、趋化性、止血、血管生成的基因,而CD24+细胞更多的高度表达的基因与碳水化合物代谢和RNA剪接有关(图1F)。在CD44+和CD24+乳腺癌细胞中基因的改变为了确定个体肿瘤内CD44+和CD24+细胞的克隆关系,对从这些细胞分离出的基因组DNA进行了SNP序列分析。结果数据显示,在图2.不同的肿瘤细胞亚群遗传图谱分析(A)对来自同一患者的存在于分离于胸腔积液(PE2和PE6)和浸润性导管癌(IDC31)的CD44+CD24+和PROCR+细胞中的正常白细胞的拷贝数量相对改变的SNP阵列分析。PROCR+*细胞是经CD44抗体进一步选择后的PROCR+细胞。红色和蓝色分别表明拷贝数量的增加和减少。来自每个肿瘤的一对不同的细胞类群总体似乎有相同的拷贝数变化。Chr,染色体。(B)分别使用具有成对的FITC和PE的抗CD24和抗CD44抗体对初级培养的胸腔积液(pcPE)CD44+和CD24+细胞进行的FACS分析。在CD44+和CD24+细胞中CD44和CD24是相互排斥表达的。(C)使用BACRP11-157A11标记到1q21.3(绿色)和BACCTD-2349A18标记到8q24.3(红色)对来自初级培养的胸腔积液(pcPE)CD44+和CD24+细胞的中期染色体和间期核进行的FISH分析。有8q24.3特异探针的FISH显示在所有三个细胞片段中一个在这个位点重排的杂交模式特点(两个更亮,更大的和两个更弱,更小的信号)。有1q21.3特异探针的FISH显示在中期染色体和间期核中有多个信号(4-7),特征是来自染色体1长臂(q)的染色体物质的获得。(D)使用BACRP11-157A11标记到1q21.3和1号染色体着丝粒(cen)探针(D1Z5)对未培养的胸腔积液(PE)CD24+细胞进行的FISH分析。有代表性的间期核显示有多个对1q21.3位点(绿色)特异的杂交信号以及三个和四个对着丝粒区(红色)特异的杂交信号,这符合染色体1物质的增加。一些肿瘤中两种细胞片段有相同拷贝数的改变,似乎他们是基因完全相同的(图2A)。为了分析CD44+和CD24+细胞在单细胞水平下的基因组成,我们提出了一个供他们短期体外培养的方案,就是根据细胞表面和细胞类型特异的标记的分析来维持他们的表型(图2B和4C)。这些初级的培养被用于中期FISH分析,该分析使用BAC探查相应的染色体区域,这些区域在乳腺癌中经常被放大并且包含肿瘤CD44+或CD24+细胞中特异地高表达的基因。这个分析确定了基因改造对于所有的细胞片段(8q24.3重排)来说是常见的,并且发现了仅在CD24+细胞中有的一个基因改造(1q21.3增加)(图2C)。在所有CD24+细胞中都能发现这种独特的基因变化,并且这样的变化也存在于原始肿瘤中(图2D)。因此,我们确定个体肿瘤内的CD44+和CD24+细胞是具有相关同源性的,但CD24+细胞可以有额外的不出现在CD44+细胞的基因变化。活跃于CD44+细胞中的信号通路为了识别基于我们SAGE数据的在CD24+或CD44+细胞中具有特异活性的信号通路,我们利用了最近应用于高通量数据的功能分析的MetaCore数据挖掘技术。首先,我们排列了基因实体的功能过程和规范的途径,根据统计显著适合于与相应的CD24+细胞SAGE库相比在正常或癌症CD44+细胞SAGE库中含量最高的基因的表达(图S2A和S2B及未显示的数据)。在基因实体功能过程中,细胞运动、细胞粘附、蛋白质的生物合成、蛋白质折叠和细胞增殖强烈地适应正常CD44+细胞中的基因上调以及癌症CD44+细胞中的基因上调。细胞运动和细胞粘附在此分析中有高的色散分数,这表明每个过程中不同的基因在癌症和正常CD44+细胞中是上调的。在典型的途径中,TGF-β和WNT信号、细胞骨架重塑,整合素