发布信息

一种高适应性的明场细胞活死分类算法的制作方法 专利技术说明

作者:admin      2023-07-26 11:30:29     633



计算;推算;计数设备的制造及其应用技术1.本发明涉及细胞分类技术领域,具体为一种高适应性的明场细胞活死分类算法。背景技术:2.目前传统的细胞活死识别方法主要采用两种技术路线。第一种是使用台盼蓝等染色剂对细胞进行染色,然后通过拍摄细胞的明场图像,再利用阈值分割算法将细胞图像分割成单个细胞,并利用不同阈值或聚类算法完成细胞的活死识别;该方法简单易行,但准确度有限,易受细胞形态等因素的影响,且需要使用染色剂对细胞进行处理,可能对细胞产生影响。第二种方法是使用荧光染料如calcein-am对细胞进行染色,并同时拍摄明场和荧光图像。通过将荧光图像视作活细胞的金标准,来完成单个细胞的活死识别;该方法的准确度较高,但需要使用昂贵的荧光染料,且荧光图像的拍摄和处理比较复杂;对于单个细胞图像的分类算法,传统方法主要采用实例分割算法maskr-cnn的同时预测分类和mask,即在图像中标注出每个细胞的位置和形状,并进行分类。该方法需要大量标注好的训练数据和较高的计算资源,且对细胞图像的预处理和后续的后处理过程也要求较高,为此我们提出一种高适应性的明场细胞活死分类算法用于解决上述问题。技术实现要素:3.本发明的目的在于提供一种高适应性的明场细胞活死分类算法,以解决上述背景技术中提出的问题。4.为实现上述目的,本发明提供如下技术方案:一种高适应性的明场细胞活死分类算法,首先构建多编码-自动编码器模型并进行训练,得到训练完成的多编码-自动编码器模型,明场细胞活死分类算法具体包括以下步骤:s1:给定任意一组明场图像组及对应的荧光图像组,通过细胞图像分割算法对明场图像组及对应的荧光图像组进行图像分割,得到单个细胞明场图像集合和对应的单个细胞荧光图像集合;s2:通过单个细胞荧光图像集合对单个细胞明场图像集合活细胞进行标记,制作单个细胞明场图像的活死标签,得到训练集;s3:利用训练完成的多编码-自动编码器模型对单个细胞明场图像集合和单个细胞荧光图像集合进行过滤,提取隐藏特征;s4:构建多层感知机,并用训练集训练多层感知机,得到训练完成之后的多层感知机;s5:将提取到的隐藏特征输入训练完成之后的多层感知机中,得到细胞的活死分类。5.优选的,多编码-自动编码器模型包括若干编码器,每个编码器对应一个不同的空间变化,每个编码器对于一个解码器,编码器输入单个细胞明场图像和单个细胞荧光图像,输出隐含向量,编码器以卷积层和全连接层混合构建,解码器输入隐含向量,输出重新构建的隐藏特征。6.优选的,多编码-自动编码器模型具体工作流出如下:s31:输入单个细胞明场图像和对应的细胞荧光图;s32:使用多个编码器,每个编码器对输入的单个细胞明场图像和对应的细胞荧光图进行不同的空间变化;s33:再对空间变化之后的单个细胞明场图像和对应的细胞荧光图进行隐藏特征的提取;s34:将步骤s33提取到的隐藏特征,输入到对应的解码器中,解码器依据隐藏特征对图像进行重新构建;s35:重新构建的图像与模型输入的图像进行比较,若重新构建的图像与模型输入的图像相差较小,则该提取的隐藏特征为有用特征,若重新构建的图像与模型输入的图像相差较大,则该提取的隐藏特征为无用特征。7.优选的,整个多编码-自动编码器模型通过变分推断的elbo计算公式来评估模型的特征提取的准确性,elbo1的计算公式如下:其中,z 是潜在变量,x 是观测数据,是变换函数,为逆变化函数,是真实的后验分布,是近似的后验分布。8.优选的,所述多层感知机共三层,具体结构如下:输入层:输入m个隐藏特征,将隐藏特征转为特征向量;隐藏层:设有n个神经元,输入特征向量,输出判断向量;输出层:输入判断向量,输出预测结果。9.优选的,隐藏层中每个神经元都具有权重向量和偏置向量,第i个神经元的权重向量为,偏置为,该神经元的输出为:其中,*表示向量的点积,relu函数作用是将负值变为0,x为输入的特征向量,h表示输出的判断向量。10.优选的,输出层中设有权重向量和偏置b,输出层输出为:其中,*表示向量的点积,probability表示活细胞的概率,sigmoid函数能够将输入映射到0和1之间,h表示输出的判断向量。11.优选的,整个多层感知机通过变分推断的计算公式来评估模型的优化程度,的计算公式如下:其中,表示预测的活死标记,表示通过荧光图像获取的活死标记,z 是潜在变量,x 是观测数据,为逆变化函数,是真实的后验分布,是近似的后验分布。12.优选的,步骤s1对明场图像组及对应的荧光图像组进行图像分割具体步骤如下:s11:将输入的明场图像组及对应的荧光图像组,对明场图像组和对应的荧光图像组分别进行仿射、放大变换,得到新明场图像组和对应的新荧光图像组。13.s12:新明场图像组和新荧光图像组训练第一模型,并得到完成训练的第一模型,以新明场图像组和原荧光图像组训练第二优化模型,并得到训练完成之后的第二优化模型;s13:将新明场图像组和对应的新荧光图像输入到训练完成的多编码-自动编码器模型,得到隐含空间;s14:利用pca算法对隐含空间进行降维处理,得到三维的隐藏变量;s15:将隐藏变量利用自聚类算法k-means进行聚类,将隐藏变量变为若干聚类;s16:根据聚类结果,为每个聚类选择对应的第一优化模型和第二优化模型;s17:对于每个聚类,使用对应的第一优化模型计算出待分割细胞图像的第一荧光点图,使用第二优化模型计算出待分割细胞图像的第二荧光点图;s18:第二荧光点图为种子点,第一荧光点图为前景,实现对细胞的精准分割,得到单个细胞掩码;s19:根据单个细胞掩码,提取明场图像组及对应的荧光图像组中的单个细胞图像,得到单个细胞明场图像集合和对应的单个细胞荧光图像集合。14.与现有技术相比,本发明的有益效果是:第一、利用了一个多编码-自动编码解码器,该解码器可以对单细胞图像进行处理,过滤掉其中与生物信息无关的空间信息,如旋转、仿射等信息,这样可以提高算法的精度和可靠性。15.第二、利用明场和荧光图像作为协作的特征提取,并将它们同时作为对抗的分类标签预测,这样可以通过协作的方式提高模型的准确性,并且通过对抗的方式提高分类标签的可靠性。16.第三、利用少量明场与荧光配对的图像作为训练数据,使得模型最终可以仅依赖于明场图像就能达到较高的活死细胞识别准确率,这样可以降低数据的成本和复杂度,并提高算法的实用性。17.第四、实现细胞分割、细胞特征提取和细胞活死鉴别从弱监督到无监督的过渡,这样可以根据不同的需求和数据情况,灵活地选择适合的算法和方法,提高算法的可用性和适用性。附图说明18.图1为本发明的原理流程图;图2为多编码-自动编码器模型的原理流程图;图3为多层感知机的原理流程图。具体实施方式19.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。20.参考图1-图3,本发明具体实现方案如下:s1:给定任意一组明场图像组b,及对应的荧光图像组f,,如果对应的荧光图像不存在,则将荧光图像设置为none,通过细胞图像分割算法对图像集合和进行图像分割,得到单个细胞明场图像集合和对应的单个细胞荧光图像集合;s2:通过单个细胞荧光图像集合对单个细胞明场图像集合中的活细胞进行标记,明场的图像的细胞位置对应的荧光图像存在荧光信号则认为此处的细胞是活细胞,否则认为此处的细胞是死细胞,制作单个细胞明场图像的活死标签,得到训练集;s3:利用训练完成的多编码-自动编码器模型对单个细胞明场图像集合和单个细胞荧光图像集合进行过滤,提取隐藏特征;s4:构建多层感知机,并用训练集训练多层感知机,得到训练完成之后的多层感知机;s5:将提取到的隐藏特征输入训练完成之后的多层感知机中,得到细胞的活死分类。21.利用明场和荧光图像作为协作的特征提取,并将它们同时作为对抗的分类标签预测,这样可以通过协作的方式提高模型的准确性,并且通过对抗的方式提高分类标签的可靠性。22.在一种可行的实施例下,5000组明场图像和对应的荧光图像,通过预处理算法将这些图像分割成30000个单个细胞明场图像和对应的单个细胞荧光图像,对这些单个细胞明场图像进行了活细胞标记,创建了细胞活死的标签,得到了一个丰富的训练集,通过训练这个多编码-自动编码器模型,从单个细胞明场图像和单个细胞荧光图像中提取出了1600个主要隐藏特征。23.参考图2,多编码-自动编码器模型包括若干编码器,每个编码器对应一个不同的空间变化,每个编码器对于一个解码器,编码器输入单个细胞明场图像和单个细胞荧光图像,输出隐含向量,编码器以卷积层和全连接层混合构建,解码器输入隐含向量,输出重新构建的隐藏特征。24.在一种可行的实施例下,多编码-自动编码器模型首先使用其编码器部分将输入图像映射到一个潜在空间,这个潜在空间的每一个维度都可以看作是一个隐藏特征,然后,多编码-自动编码器模型使用其解码器部分从潜在空间中生成新的图像。25.隐藏特征不是直接从原始数据中提取的,如细胞核的圆形度或细胞膜的像素平均值等;隐藏特征是通过多编码-自动编码器模型的训练过程自动学习的,隐藏特征提供了一种更深层次、更抽象的表示,使得多层感知机能够捕捉到在原始数据中不易识别的模式。26.多编码-自动编码器模型具体工作流出如下:s31:输入单个细胞明场图像和对应的细胞荧光图;s32:使用多个编码器,每个编码器对输入的单个细胞明场图像和对应的细胞荧光图进行不同的空间变化;s33:再对空间变化之后的单个细胞明场图像和对应的细胞荧光图进行隐藏特征的提取;s34:将步骤s33提取到的隐藏特征,输入到对应的解码器中,解码器依据隐藏特征对图像进行重新构建;s35:重新构建的图像与模型输入的图像进行比较,若重新构建的图像与模型输入的图像差异小于阈值,则该提取的隐藏特征为有用特征,若重新构建的图像与模型输入的图像差异大于阈值,则该提取的隐藏特征为无用特征。27.步骤s35中两个图像像素差异阈值取值为。28.编码器具体结构如下:第一卷积层:卷积核大小为3x3,步长为1,填充为1,输出通道数为32,输出尺寸为(32,w,h)张量;第一池化层:使用2x2的最大池化,输出尺寸为(32,w/2,h/2)的图像;第二卷积层:卷积核大小为3x3,步长为1,填充为1,输出通道数为64,输出尺寸为(64,w/2,h/2)张量;第二池化层:使用2x2的最大池化,输出尺寸为(64,w/4,h/4)张量;第三卷积层:卷积核大小为3x3,步长为1,填充为1,输出通道数为128,输出尺寸为(128,w/4,h/4)张量;第三池化层:使用2x2的最大池化,输出尺寸为(128,w/8,h/8)的图像;展平:将尺寸为(128,w/8,h/8)的图像展平为(128*w/8*h/8)维向量;第一全连接层:输入(128*w/8*h/8)维向量,输出1024维向量;第二全连接层:输入1024维,输出d维的隐含向量(例如d=128)。29.解码器具体结构如下:第一全连接层:输入为d维的隐含向量,输出为1024维向量;第二全连接层:输入为1024维,输出为(128*w/8*h/8)维向量;重塑:将(128*w/8*h/8)维向量重塑为(128,w/8,h/8)张量;第一反池化层:对(128,w/8,h/8)张量进行2x2的最近邻上采样输出尺寸为(128,w/4,h/4);第一反卷积层:卷积核大小为3x3,步长为1,填充为1,输入通道数为128,输出通道数为64输出尺寸为(64,w/4,h/4)张量;第二反池化层:对(64,w/4,h/4)张量进行2x2的最近邻上采样输出尺寸为(64,w/2,h/2);第二反卷积层:卷积核大小为3x3,步长为1,填充为1,输入通道数为64,输出通道数为32输出尺寸为(32,w/2,h/2);第三反池化层:对(32,w/2,h/2)张量进行2x2的最近邻上采样输出尺寸为(32,w,h);第三反卷积层:卷积核大小为3x3,步长为1,填充为1,输入通道数为32,输出通道数为1输出尺寸为(1,w,h);整个多编码-自动编码器模型通过变分推断的elbo计算公式来评估模型的特征提取的准确性,elbo1的计算公式如下:其中,z 是潜在变量,x 是观测数据,是变换函数,为逆变化函数,是真实的后验分布,是近似的后验分布,这个公式实际上表示了对于潜在变量 z 的期望,该期望是在分布下的,而期望内部是 和 的差值。30.elbo1的计算过程包含两部分:第一部分是数据的对数似然性,即在给定潜在变量 z 的情况下,观测数据 x 的概率;第二部分是近似分布 q(z) 的熵,这部分实际上是一个惩罚项,用于鼓励 q(z) 尽可能地接近均匀分布,以增加模型的鲁棒性。31.参考图3,多层感知机共三层,具体结构如下:输入层:输入1600个隐藏特征,将隐藏特征转为特征向量;隐藏层:设有512个神经元,输入特征向量,输出判断向量;输出层:输入判断向量,输出预测结果。32.隐藏层中每个神经元都具有权重向量和偏置向量,第i个神经元的权重向量为,偏置为,该神经元的输出为:其中,*表示向量的点积,relu函数作用是将负值变为0,x为输入的特征向量,h表示输出的判断向量。33.输出层中设有权重向量和偏置b,输出层输出为:其中,*表示向量的点积,probability表示活细胞的概率,sigmoid函数能够将输入映射到0和1之间,h表示输出的判断向量。34.在多层感知机使用之前需要对多层感知机进行训练,利用步骤2构建的单个细胞明场图像的活死标签训练集,来训练多层感知机,整个多层感知机通过变分推断的计算公式来评估模型的优化程度,的计算公式如下:其中,表示预测的活死标记,表示通过荧光图像获取的活死标记,z 是潜在变量,x 是观测数据,是变换函数,为逆变化函数,是真实的后验分布,是近似的后验分布,最终优化为该函数收敛即止。35.多层感知机和多编码-自动编码器模型均通过优化 elbo得到一个相对较好的 q 分布,使得它尽可能地接近真实的后验分布 p。36.在一种可行的实施例下,构建了一个由三层、总计2000个神经元组成的多层感知机,并用之前的训练集对其进行了训练,训练过程中,设定了一个停止准则,即当神经元的输出变化量小于0.01时,就认为多层感知机已经训练完成,整个训练过程持续24小时,完成模型训练后,将提取出的隐藏特征输入到训练好的多层感知机中,得到了细胞的活死分类结果,为了将多层感知机的输出映射到0和1之间,使用了sigmoid函数,这样可以得到每个细胞的生存概率。37.在一种可行的实施例下,步骤s1对明场图像组及对应的荧光图像组进行图像分割具体步骤如下:s11:将输入的明场图像组及对应的荧光图像组,对明场图像组和对应的荧光图像组分别进行仿射、放大变换,得到新明场图像组和对应的新荧光图像组。38.s12:新明场图像组和新荧光图像组训练第一模型,并得到完成训练的第一模型,以新明场图像组和原荧光图像组训练第二优化模型,并得到训练完成之后的第二优化模型;s13:将新明场图像组和对应的新荧光图像输入到训练完成的多编码-自动编码器模型,得到隐含空间;s14:利用pca算法对隐含空间进行降维处理,得到三维的隐藏变量;s15:将隐藏变量利用自聚类算法k-means进行聚类,将隐藏变量变为3个聚类;s16:将第一模型a复制三份记为a1,a2,a3,将第二模型b复制三份记为b1,b2,b3,再利用聚类{s1,s2,,s3}对模型a1,a2,a3和模型b1,b2,b3进行精调,并得到第一优化模型和第二优化模型;s17:使用对应的第一优化模型计算出待分割细胞图像的第一荧光点图,使用利用第二优化模型计算出待分割细胞图像的第二荧光点图;s18:第二荧光点图为种子点,第一荧光点图为前景,实现对细胞的精准分割,得到单个细胞掩码;s19:根据单个细胞掩码,提取明场图像组及对应的荧光图像组中的单个细胞图像,得到单个细胞明场图像集合和对应的单个细胞荧光图像集合。39.尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。









图片声明:本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!




内容声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理!本站为非盈利性质站点,发布内容不收取任何费用也不接任何广告!




免责声明:我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理,本文部分文字与图片资源来自于网络,部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!的,若有来源标注错误或侵犯了您的合法权益,请立即通知我们,情况属实,我们会第一时间予以删除,并同时向您表示歉意,谢谢!

相关内容 查看全部