发布信息

用于乳腺癌转移和/或预后诊断的生物标志物及其应用

作者:admin      2022-11-03 09:16:12     456



有机化合物处理,合成应用技术1.本发明属于生物医药技术领域,更具体地,涉及一种用于乳腺癌转移和/或预后诊断的生物标志物及其应用。背景技术:2.乳腺癌分为luminal a、luminal b、her2+和三阴四种亚型,其中三阴乳腺癌(triple-negative breast cancer,tnbc)患者的预后效果很差,5年生存率仅为11%。tnbc具有高度侵袭性,大约46%的患者会发生远端转移,多发生在确诊后的第三年,通常有向肺或其它的内脏器官转移的趋势,转移后中位生存期平均仅为13.3个月。非tnbc患者的平均复发时间为35-67个月,而tnbc患者仅为19-40个月,复发后患者3个月内的死亡率高达75%。由于tnbc具有高度的侵袭性,辅助化疗无法完全清除肿瘤,而且残留的转移灶最终会导致肿瘤的复发和转移,导致患者治疗失败和死亡。对tnbc的转移机制进一步深入研究,有助于发现在肿瘤转移过程中的致癌基因,为tnbc转移机制研究提供新思路。3.单细胞转录组测序技术能够通过深度测序技术有效检测样本中每个细胞的基因表达水平,分析癌细胞群中异常活跃的信号通路,是解析肿瘤细胞转移机制的途径之一。利用单细胞转录组测序技术可以在单细胞水平上对乳腺癌组织进行细胞亚群的分析,进而挖掘与乳腺癌发生发展和转移相关的分子,在乳腺癌的诊断和临床治疗中具有重要的应用研究价值。技术实现要素:4.针对现有技术的缺陷,本发明的目的在于提供一种用于乳腺癌转移和/或预后诊断的生物标志物及其应用,通过单细胞转录组测序技术筛选参与乳腺癌发生发展和转移的分子,为乳腺癌转移和预后提供新的诊断及评估方法。5.为实现上述目的,本发明的第一方面提供了一种用于乳腺癌转移和/或预后诊断的生物标志物,所述生物标志物为taf7、ikzf1、elf1和srebf1中的一种或多种。6.优选地,所述生物标志物为taf7。7.优选地,所述乳腺癌为三阴性乳腺癌。8.本发明的第二方面提供了本发明第一方面所述生物标志物在非诊断目的的分选具有转移风险的乳腺癌细胞中的应用。9.本发明的第三方面提供了本发明第一方面所述生物标志物的检测试剂在制备乳腺癌转移诊断产品中的应用,所述生物标志物的检测试剂能检测乳腺癌细胞中所述生物标志物的表达水平。10.本发明的第四方面提供了taf7的检测试剂在制备乳腺癌预后诊断产品中的应用,所述taf7的检测试剂能检测乳腺癌细胞中taf7的表达水平。11.本发明的第五方面提供了taf7的抑制剂在制备抑制乳腺癌细胞转移的药物中的应用。12.本发明的第六方面提供了一种抑制乳腺癌细胞转移的药物,所述药物包括taf7的抑制剂。13.总体而言,通过本发明所构思的以上技术方案与现有技术相比,具有以下有益效果:14.(1)本发明通过对来自临床转移部位的乳腺癌组织的单细胞转录组数据分析,识别乳腺癌样本中不同的癌细胞群,进而筛选出新的能够促进乳腺癌细胞增殖和转移的转录因子,为深入解析乳腺癌转移机制提供理论依据。15.(2)本发明通过实验验证taf7高表达会导致乳腺癌患者的不良预后,而低表达可以明显延长患者存活时间,意味着通过检测细胞内taf7的水平可以诊断乳腺癌的预后情况。16.(3)本发明通过敲低乳腺癌细胞中的taf7,发现敲低后癌细胞转移得到明显抑制;可针对taf7设计靶向抑制剂,抑制taf7基因的表达或其表达蛋白的活性,从而抑制乳腺癌细胞的转移。附图说明17.图1为本发明实施例1中样本原始数据质量检测结果,其中,a为原始数据基本信息,包括细胞数目(number of cells),平均序列数(mean reads per cell),基因中位数(median genes per cell);b为原始数据质量检测结果,方框中为质量检测标准,分别是有效cell barcode序列占比和cell barcode序列质量大于q30的序列占比;c为原始数据与数据库对比结果,方框中为质量检测标准,表示比对到基因组上的序列占比。18.图2为本发明实施例1中在数据质量控制前每个样本细胞中基因数(a)、mrna数(b)和线粒体基因占比(c)的分布统计结果,图中每个点代表不同的细胞。19.图3为本发明实施例1中单细胞转录组测序数据的降维聚类结果,图中横坐标和纵坐标分别代表t-sne降维后第一和第二主成分,每个点代表不同的细胞。20.图4为本发明实施例1中不同细胞群的标记基因表达水平热图,图中横坐标代表每个细胞,顶部渐变色带代表0-12细胞群,纵坐标为每个细胞群的标记基因,图中颜色由深到浅表示基因的表达水平由低到高。21.图5为本发明实施例1中不同细胞群类型鉴定结果。22.图6为本发明实施例1中不同细胞群中基因krt8、krt18、krt19、foxa1、muc1、cd24的mrna表达情况。23.图7为本发明实施例1中样本细胞群染色体拷贝数变异水平热图,图中横坐标为不同细胞群,纵坐标数字为染色体序号,图中颜色由深到浅表示染色体拷贝数由缺失到增加。24.图8为本发明实施例1中样本乳腺癌细胞鉴定结果。25.图9为本发明实施例2中taf7(a)、ikzf1(b)、elf1(c)和srebf1(d)基因的不同表达水平与tnbc患者总生存期之间的相关性分析,图中横坐标表示生存时间,纵坐标表示存活率,hr表示风险比,logrank(mantel-cox)检验计算p值。26.图10为本发明实施例2中正常mda-mb-231细胞和敲低taf7的mda-mb-231/sh-taf7细胞(a)以及正常lm2细胞和敲低taf7的lm2/sh-taf7细胞(b)中emt标志蛋白表达量的westernblot检测结果。27.图11为本发明实施例2中si-nc组、si-taf7-3#组和si-taf7-2#组穿过小室膜的细胞显微镜观测图(a)和细胞数量统计图(b)。具体实施方式28.为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。29.本发明提供的一种用于乳腺癌转移和/或预后诊断的生物标志物,所述生物标志物为taf7、ikzf1、elf1和srebf1中的一种或多种。30.优选地,所述生物标志物为taf7。31.优选地,taf7、ikzf1、elf1和srebf1中的一种或多种生物标志物用于三阴性乳腺癌的转移和/或预后诊断。32.本发明还提供了taf7、ikzf1、elf1和srebf1中的一种或多种生物标志物在非诊断目的的分选具有转移风险的乳腺癌细胞中的应用,该应用不以乳腺癌诊断结果为直接目的,而仅为了分选出具有转移风险的乳腺癌细胞,进而为后续乳腺癌诊断提供理论依据。33.此外,本发明提供了taf7、ikzf1、elf1和srebf1中的一种或多种生物标志物的检测试剂在制备乳腺癌转移诊断产品中的应用,所述生物标志物的检测试剂能检测乳腺癌细胞中所述生物标志物的表达水平。34.本发明实验发现taf7表达水平的高低对乳腺癌患者的预后有显著影响,因此本发明提供了taf7的检测试剂在制备乳腺癌预后诊断产品中的应用,所述taf7的检测试剂能检测乳腺癌细胞中taf7的表达水平。35.另一方面,本发明提供了taf7的抑制剂在制备抑制乳腺癌细胞转移的药物中的应用。该抑制剂能够对乳腺癌细胞中的taf有下调作用,例如可以是能降低taf7蛋白的活性、降低taf7基因或蛋白的稳定性、下调taf7蛋白的表达、减少taf7蛋白有效作用时间或抑制taf7基因的转录和翻译的物质等。36.本发明还提供了一种抑制乳腺癌细胞转移的药物,所述药物包括taf7的抑制剂。37.以下结合具体实施例,对上述技术方案详细说明。38.下述实施例中所使用的实验方法如无特殊说明,均为常规方法。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。39.实施例1筛选与乳腺癌转移相关转录因子40.1、临床样本采集41.收集新鲜的三阴乳腺癌转移灶及相应的癌旁组织样本,用预冷的生理盐水冲洗上面血迹,洗干净后放入加满组织保存液的保存管,封口膜封闭。将保存管包裹气泡纸,连同冰袋一起放入泡沫盒中,拿到实验室。42.2、单细胞悬液制备43.使用酶解法将新鲜样本制备成单细胞悬液,使用冷活性蛋白酶在低温条件下,将组织样本进行解离。44.用细胞计数仪检测单细胞悬液各种指标,若符合细胞总量要大于10 000个,细胞成活率大于85%,则进行上机测序;若不符,则重新选取样本。45.3、单细胞转录组测序46.使用10×chromium测序平台,将单个细胞和带有独特条形码的寡核苷酸标签、标记单个细胞的标签形成液滴,体积约为2nl,然后将水凝胶颗粒溶解在液滴中,使得细胞裂解,寡核苷酸标签与mrna杂交,之后进行反转录反应,生成带有标签的cdna,扩增形成cdna文库。文库完成后进行库检,库检合格后测序,统计细胞内基因的表达水平,最后输出统计基因表达数据。47.使用10×genomics附带的官方质量检测软件cell ranger(2.3版),对三阴乳腺癌亚型样本单细胞转录组测序原始数据进行质量检测。符合单细胞转录组测序下游分析的原始数据质量检测标准如下:(1)有效cell barcode序列数百分比大于80%;(2)测得的cell barcode序列质量大于q30的序列数百分比大于90%;(3)比对到基因组上的序列百分比大于60%。本实施例样本原始数据质量检测结果如图1所示,达到单细胞转录组测序下游分析的标准。48.对原始数据进行质量控制,避免在测序过程中空油滴、双细胞油滴和线粒体基因占比过多的细胞油滴对测序结果造成误差。质控标准设定为细胞基因数和mrna数在平均值±2倍标准差范围内,且线粒体基因比例低于30%。图2为本实施例样本在数据质量控制前每个细胞中基因数、mrna数和线粒体基因占比的分布统计结果。49.4、生物信息学分析50.(1)细胞降维聚类:首先将质控后数据进行规范化对数处理,采取全局缩放归一化方法,通过r语言“lognormalize”函数对每个基因表达值进行归一化处理,再进行对数转化;然后使用r语言“findvariablegenes”函数,根据0.125到3之间的平均表达式以及超过0.5的分数位归一化方差来计算高度可变基因;接着使用r语言“runpca”函数针对高度可变基因进行主成分分析初次降维处理,通过snn算法使用r语言“findclisters”函数将相似细胞类型聚类;最后通过t-分布邻域嵌入算法使用r语言“runtsne”函数进行可视化。单细胞转录组测序数据的降维聚类结果如图3所示,标注出12个细胞群。51.(2)细胞类型鉴定:首先在指定细胞群和其余细胞群之间进行基因表达的差异检验,寻找指定细胞群中的标记基因。标记基因的筛选标准是该基因在指定细胞群中高表达,而在其余细胞群的细胞中不表达或只有少部分细胞有较低的表达,同时还要求该基因在此细胞群的表达相对于其余的细胞群是显著上调的。使用r语言“findallmarkers”函数寻找每个细胞群的标记基因,并通过热图进行可视化。图4中所示12个细胞群中差异表达排名前5的标记基因,颜色越浅表示基因表达水平越高。由图可知,细胞群0#的标记基因为ptn、chi3l1、scrg1、cd81、scgb1d2;细胞群1#的标记基因为ltf、cyp1b1、azgp1、cp、s100a7;细胞群2#的标记基因为mmp7、pi3、krt17、krt6b、ccl68等。其中细胞群7#的标记基因lmo7、psca等也在细胞群2#中高表达,说明细胞群2#和细胞群7#可能是同一细胞类型。52.收集每个细胞群中的标记基因输入cell marker数据库中进行查找和比对,初步的鉴定结果如下:基因krt17是上皮细胞标记,可鉴定细胞群2#是上皮细胞;基因il7r是t细胞标记,可鉴定细胞群3#是t细胞;基因col4a1是成纤维细胞标记,可鉴定细胞群10#是成纤维细胞。接着使用单细胞转录组测序细胞群类型注释软件包singler对细胞群类型进行注释。将两种注释结果比对,最终12个细胞群的注释结果如图5所示。结果显示,12个细胞群经注释有8种细胞类型,细胞群0#、细胞群1#、细胞群2#、细胞群4#、细胞群6#、细胞群7#均为上皮细胞;细胞群3#为cd8+t细胞;细胞群5#为巨噬细胞;细胞群8#为表皮细胞;细胞群9#为单核细胞;细胞群10#为成纤维细胞;细胞群11#为内皮细胞;细胞群12#为中性粒细胞。以上结果说明tnbc的临床样本中以上皮细胞和免疫细胞为主。53.(3)乳腺癌细胞群鉴定:上述细胞群类型鉴定结果显示细胞群0#、细胞群1#、细胞群2#、细胞群4#、细胞群6#、细胞群7#均为上皮细胞,该样本的临床诊断信息显示为乳腺浸润性导管癌,接下来检测乳腺上皮细胞的标记基因krt8、krt18、krt19、foxa1、muc1、cd24的mrna在各上皮细胞群中的表达水平。使用r语言“featureplot”函数检测并可视化基因krt8、krt18、krt19、foxa1、muc1、cd24的mrna表达情况。结果如图6所示,乳腺上皮细胞的标记基因krt8、krt18、krt19、muc1、cd24均在上皮细胞群0#、1#、2#、4#、6#、7#中高表达,foxa1在上皮细胞群0#、1#、2#、6#、7#中低表达。由此可得,上皮细胞群0#、1#、2#、4#、6#、7#均为乳腺上皮细胞。54.进一步鉴定以上乳腺上皮细胞中哪些属于乳腺癌细胞。已知癌细胞存在增殖速度快,不易凋亡的特点,因此其细胞核内染色体拷贝数变异的程度高于正常细胞。在单细胞转录组测序数据分析中广泛应用基于染色体拷贝数的推断来分别癌细胞与正常细胞。使用r语言软件包infercnv分析并输出每个细胞群中每个细胞的染色体拷贝数变异水平,并通过热图展示。结果如图7所示,乳腺上皮细胞群0#、1#、2#、6#、7#在1号和11号染色体上的拷贝数主要呈现增加的状态;而乳腺上皮细胞群4#、cd8+t细胞群3#、成纤维细胞群10#在1号和13号染色体上的拷贝数主要呈现缺失的状态。因此可得出结论,乳腺上皮细胞群0#、1#、2#、6#、7#是乳腺癌细胞,乳腺上皮细胞群4#是正常乳腺上皮细胞,最终细胞类型注释结果如图8所示。55.(4)三阴乳腺癌亚型关联转录因子筛选:癌细胞中的转录因子能够与真核基因的顺式作用元件发生特异性相互作用,激活或抑制靶基因的转录,进而调控癌细胞的增殖、迁移等生命活动,可作为潜在的调控因子。本实施例对各癌细胞群的异质性分析发现,各癌细胞群具有广泛的异质性,增殖和转移能力均不相同,其中癌细胞群6#具有最高的g2/m期评分,处于g2/m期的细胞占比最大,具有最高的间质转化评分,表明癌细胞群6#的增殖和转移能力最强。最后通过信号通路富集分析发现各癌细胞群所激活的信号通路差异大,其中癌细胞群6#活跃的信号通路主要有pi3k-akt-mtor信号通路、emt信号通路和g2m检查点信号通路等。上述结果可认为在这些癌细胞中癌细胞群6#是该样本中恶性程度最高的癌细胞群,在乳腺癌的生长和转移中发挥关键作用。使用r语言软件包scenic对癌细胞群6#构建基因调控网络,获得调控网络中处于枢纽地位的关键转录因子52个,具体参见表1。其中已报道在乳腺癌的增殖转移中发挥正向调控功能的有48个,如ctcf的高表达抑制乳腺癌细胞凋亡;elf3激活pi3k-akt信号通路促进乳腺癌细胞增殖;gata2是乳腺癌的预后靶标等。本实施例筛选得到4个尚未在乳腺癌中报道功能的转录因子,分别为elf1、ikzf1、srebf1和taf7。56.现有文献仅报道过以上4个转录因子在其它癌症中的部分作用。taf7和ikzf1可作为部分疾病的生物标志物,如taf7可作为胶质母细胞瘤的预后生物标志物;ikzf1可作为小儿急性淋巴细胞白血病预后标记物。elf1和srebf1的高表达促进其它癌细胞增殖迁移,如elf1高表达促进胶质瘤增殖;srebf1高表达促进鳞状细胞癌细胞增殖和迁移。本研究首次发现elf1、ikzf1、srebf1和taf7这4个转录因子与乳腺癌的发生发展相关。57.表1三阴乳腺癌亚型癌细胞群6#关键转录因子[0058][0059]实施例2筛选的转录因子与乳腺癌相关功能验证[0060]利用tcga数据库分析基因taf7、ikzf1、elf1和srebf1的表达水平与tnbc患者总生存期之间的相关性。图9中a结果显示具有不同taf7表达水平的tnbc患者之间,生存期存在显著差异(logrank p《0.001),taf7的高表达与tnbc患者生存期变短呈显著正相关,taf7低表达相比其高表达可以显著延长tnbc患者的存活率;图9中b、c和d结果显示ikzf1、elf1和srebf1的表达水平与tnbc患者的生存期无显著相关性。上述结果说明taf7高表达导致tnbc患者的不良预后。[0061]本实施例体外验证taf7在三阴性乳腺癌对迁移的影响。在稳定敲低taf7的mda-mb-231和lm2细胞中通过蛋白免疫印迹实验检测上皮-间质转化(epithelial-mesenchymal transition,emt)的标志蛋白的表达变化。结果如图10所示,敲低taf7的mda-mb-231/sh-taf7和lm2/sh-taf7细胞中的钙黏蛋白e(e-cadherin)表达明显增加,波形蛋白(vimentin)表达明显降低。上述结果说明,敲低taf7后使得tnbc细胞的emt过程被抑制,进而抑制了tnbc细胞的迁移。[0062]在敲低taf7的lm2乳腺癌细胞中也观察到穿过小室膜的数量明显低于对照组的细胞数量。参见图11,统计结果显示,以si-nc组穿过小室膜的细胞数量为对照,si-taf7-3#组和si-taf7-2#组中穿过小室膜的细胞数量显著低于对照组(p《0.001),分别为对照组的62%、54%。这表明敲低taf显著抑制了lm2细胞的体外浸润能力。上述结果表明taf7的敲低可以抑制tnbc细胞的体外浸润能力。[0063]根据以上实验结论,可以设计靶向于taf7的抑制剂,用于乳腺癌的治疗,尤其抑制乳腺癌细胞的转移。作为非限制性实施方式,抑制剂可以是任何对于下调taf7有用的物质,例如可降低taf7蛋白的活性、降低taf7基因或蛋白的稳定性、下调taf7蛋白的表达、减少taf7蛋白有效作用时间或抑制taf7基因的转录和翻译的物质,这些物质均可用于本发明。具体地,所述抑制剂可包括核酸抑制物、蛋白抑制剂、蛋白水解酶、蛋白结合分子等。[0064]本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。









图片声明:本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!




内容声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理!本站为非盈利性质站点,发布内容不收取任何费用也不接任何广告!




免责声明:我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理,本文部分文字与图片资源来自于网络,部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!的,若有来源标注错误或侵犯了您的合法权益,请立即通知我们,情况属实,我们会第一时间予以删除,并同时向您表示歉意,谢谢!

相关内容 查看全部