计算;推算;计数设备的制造及其应用技术1.本发明涉及故障诊断技术领域,具体涉及一种基于深度学习的工业不平衡数据多分类方法。背景技术:2.在复杂的工业生产环境中,工业设备难免会出现各种各样的故障。绝大多数设备故障在发生前都会有一些征兆,如轴承故障前的振动信号、润滑油温度信号、异常声响信号等。在设备由正常状态到发生故障时,其状态信号会有一个发展变化的过程,因此根据状态信号的变化即可判断是否发生故障,并分析出故障的部位、性质、程度和发展趋势,这是设备状态管理的基础。为了正确指导工业设备的维护和检修,保证设备所具有的工作能力,工业管理者需要对设备运行状态数据的实时有效监控,并通过对设备的监控数据进行分析和处理得出设备的状态结果。3.由于设备在工业生产实践中绝大多数时刻处于正常状态,发生故障的频率很小,因此设备传感器监控到的数据也大都是正常的状态信息,异常的数据很少,这使得工业中的监控数据存在一定的数据不平衡问题。然而,由于目前主流的分类算法在训练过程中一般会偏向于多数类样本,使得少数类样本的准确率很低,不平衡数据因正常与故障数据不均衡所导致的故障类样本分类准确率较低,因此目前主流的分类算法无法适用于不平衡数据。此外,工业生产管理者会希望设备故障诊断能够提高更为精确的故障判断,即希望设备故障诊断能够提供故障的不同类型,此时需要对工业大数据进行不平衡数据多分类,不仅分类出设备是否故障,还分类出故障类型。技术实现要素:4.本发明所要解决的是现有传统分类算法在面对工业不平衡数据时所存在的因正常与故障数据不均衡所导致的故障类样本分类准确率较低的问题,提供一种基于深度学习的工业不平衡数据多分类方法。5.为解决上述问题,本发明是通过以下技术方案实现的:6.一种基于深度学习的工业不平衡数据多分类方法,包括步骤如下:7.步骤1、获取工业设备的特征图数据集,该特征图数据集中包括工业设备在正常状态和各种故障状态下的多幅带类型标签的二维特征图;8.步骤2、将特征图数据集划分为训练集和测试集;9.步骤3、利用训练集中故障类型的二维特征图对rlsgan模型的生成器和判别器进行对抗训练,通过最小化损失函数对生成器和判别器的参数进行优化,得到训练好的rlsgan模型;10.步骤4、利用训练好的rlsgan模型的生成器生成一定数量的故障类型的二维特征图,并将生成的故障类型的二维特征图并入原有的训练集中,得到平衡训练集;11.步骤5、先利用平衡训练集对resnet模型进行训练,得到初步的用于预测工业设备状态的resnet模型,再利用测试集对初步的用于预测工业设备状态的resnet模型进行测试,得到最终的用于预测工业设备状态的resnet模型;12.步骤6、获取工业设备的实时二维特征图,并将实时二维特征图送入最终的用于预测工业设备状态的resnet模型中,得到工业设备的当前状态。13.上述方案中,每幅二维特征图的时间轴表示信号的时间,频率轴表示信号的频率,像素值表示该时刻该频率的幅度。14.上述步骤1的具体过程如下:15.步骤1.1、利用振动传感器分别采集工业设备在正常状态和各种故障状态下的一维时序振动信号;16.步骤1.2、对各个一维时序振动信号分别进行分段处理,每个一维时序振动信号得到多段一维时序振动信号;17.步骤1.3、对各段一维时序振动信号分别进行短时傅里叶变换,每段一维时序振动信号得到一幅二维特征图;18.步骤1.4、在每幅二维特征图上标注其所属类别的标签,所有带类型标签的二维特征图构成特征图数据集。19.上述步骤6的具体过程如下:20.步骤6.1、利用振动传感器采集工业设备实时一维时序振动信号;21.步骤6.2、对实时一维时序振动信号进行短时傅里叶变换,得到实时二维特征图;22.步骤6.2、将实时二维特征图送入最终的用于预测工业设备状态的resnet模型中,得到工业设备的当前状态,其中工业设备的当前状态包括正常状态和具体故障状态。23.上述rlsgan模型的生成器由全连接层、维度转换层、2个上采样层、2个卷积模块和输出层组成;全连接层的输入形成生成器的输入,全连接层的输出连接维度转换层的输入,维度转换层的输出连接第一个上采样层的输入,第一个上采样层的输出连接第一个卷积模块的输入,第一个卷积模块的输出连接第二个上采样层的输入,第二个上采样层的输出连接第二个卷积模块的输入,第二个卷积模块的输出连接输入层的输入,输入层的输出形成生成器的输出。24.上述卷积模块由2个卷积层、2个标准化层和2个leakrelu激活层组成;第一个卷积层的输入形成卷积模块的输入,第一个卷积层的输出连接第一个标准化层的输入,第一个标准化层的输出连接第一个leakrelu激活层的输入,第一个leakrelu激活层的输出连接第二个卷积层的输入,第二个卷积层的输出连接第二个标准化层的输入,第二个标准化层的输出连接第二个leakrelu激活层的输入,第二个leakrelu激活层的输出形成卷积模块的输出;第一个卷积层的输入与第二个leakrelu激活层的输出跳跃连接。25.上述判别器由4个判别器模块、1个展平层和1个映射层组成;第一个判别器模块的输入形成判别器的输入,第一个判别器模块的输出连接第二个判别器模块的输入,第二个判别器模块的输出连接第三个判别器模块的输入,第三个判别器模块的输出连接第四个判别器模块的输入,第四个判别器模块的输出连接展平层的输入,展平层的输出连接映射层的输入,映射层的输出形成判别器的输出。26.上述判别器模块由卷积层、leakyrelu激活层和随机失活层组成;卷积层的输入形成判别器模块的输入,卷积层的输出连接leakyrelu激活层的输入,leakyrelu激活层的输出连接随机失活层的输入,随机失活层的输出形成判别器模块的输出。27.上述步骤3中,28.生成器的损失函数gloss为:[0029][0030]判别器的损失函数dloss为:[0031][0032]其中,d(x)为判别器对输入rlsgan模型的故障类型的二维特征图即真图的打分,d(g(z))为判别器对rlsgan模型的生成器生成的故障类型的二维特征图即仿图的打分。[0033]上述步骤4中,利用训练好的rlsgan模型的生成器生成的故障类型的二维特征图的数量等于训练集中正常类型的二维特征图的数量减去训练集中故障类型的二维特征图的数量。[0034]本发明的技术思路是:获取传感器监控的工业设备数据(如轴承或者机床主轴的一维时序振动信号数据),使用短时傅里叶变换(stft)对旋转机械的一维时序数据进行转换,得到各个类别的二维特征图;用图片数据集中的故障类数据的特征图对rlsgan模型进行训练,训练足够次数后,使用训练好的rlsgan模型生成大量的仿故障类数据特征图,平衡数据集;使用平衡后的图片数据集训练resnet模型,训练足够的次数后,使用训练好的resnet模型对经过stft转换的特征图进行多分类,根据分类结果进行设备故障诊断。[0035]与现有技术相比,本发明能在保证工业设备故障诊断准确率的基础上,解决故障类样本查全率偏低的问题,并提供多个故障类型的分类。附图说明[0036]图1为一种基于深度学习的工业不平衡数据多分类方法的流程图。[0037]图2为rlsgan模型的原理示意图。[0038]图3为rlsgan模型的生成器的结构示意图。[0039]图4为生成器的卷积模块的结构示意图。[0040]图5为rlsgan模型的判别器的结构示意图。[0041]图6为判别器的判别器模块的结构示意图。具体实施方式[0042]为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实例,对本发明进一步详细说明。[0043]本发明一种基于深度学习的工业不平衡数据多分类方法,如图1所示,包括具体步骤如下:[0044]步骤1、获取工业设备的特征图数据集,该特征图数据集中包括工业设备在正常状态和各种故障状态下的多幅带类型标签的二维特征图。[0045]步骤1.1、利用振动传感器分别采集工业设备在各个类型下(包括正常状态和各种故障状态下)的一维时序振动信号。[0046]由于工业设备绝大多数时刻处于正常状态,发生故障的频率很小,因此振动传感器所得到的正常状态下的一维时序振动信号的数量也远远多于各个故障状态下的一维时序振动信号,存在数据不平衡问题。[0047]步骤1.2、对步骤1.1所得到的各个一维时序振动信号分别进行分段处理,每个一维时序振动信号得到多段一维时序振动信号。[0048]在进行分段时,每段一维时序振动信号的时长应该大于等于一个完整的振动周期。[0049]步骤1.3、对步骤1.2所得到的各段一维时序振动信号分别进行短时傅里叶变换,每段一维时序振动信号得到一幅二维特征图。[0050]每幅二维特征图的时间轴表示信号的时间,频率轴表示信号的频率,像素值表示该时刻该频率的幅度。[0051]步骤1.4、在步骤1.3所得到的每幅二维特征图上标注其所属类别的标签,所有带类型标签的二维特征图构成特征图数据集。[0052]如正常状态下的二维特征图的类型标签为0,外圈故障状态下的二维特征图的类型标签为1,内圈故障状态下的二维特征图的类型标签为2,轴承故障状态下的二维特征图的类型标签为4。[0053]由于工业设备处于正常状态的时间要远远多于故障状态的时间,即所获得的正常状态下的一维时序振动信号的数量远远多于各个故障状态下的一维时序振动信号,因此所得到的正常状态下的二维特征图的数量也远远多于各个故障状态下的二维特征图,特征图数据集存在不平衡现象。[0054]步骤2、将特征图数据集划分为训练集和测试集。[0055]在本发明中,将特征图数据集按照的7:3比例划分为训练集和测试集。[0056]步骤3、利用训练集中故障类型的二维特征图对rlsgan(残差单元与最小二乘生成对抗网络)模型的生成器和判别器进行对抗训练,通过最小化损失函数对生成器和判别器的参数进行优化,得到训练好的rlsgan模型。[0057]由于特征图数据集存在数据不平衡问题,其训练集也相应地存在数据不平衡问题。当利用存在数据不平衡问题的训练集对分类模型进行训练时,会偏向于多数类样本,使得少数类样本的准确率很低,从而导致故障类样本分类准确率较低。为此,本发明通过构建rlsgan模型来生成故障类型的二维特征图,并将生成的故障类型的二维特征图并入到原有的训练集,以平衡数据。[0058]rlsgan模型的原理如图2所示,其具体训练过程如下:[0059]步骤3.1、rlsgan模型的生成器从高斯分布获得一个随机噪声z,并基于该随机噪声z生成二维特征图(仿图)xfake。[0060]rlsgan模型的生成器由全连接层、维度转换层、2个上采样层、2个卷积模块和输出层组成,如图3所示。全连接层的输入形成生成器的输入,全连接层的输出连接维度转换层的输入,维度转换层的输出连接第一个上采样层的输入,第一个上采样层的输出连接第一个卷积模块的输入,第一个卷积模块的输出连接第二个上采样层的输入,第二个上采样层的输出连接第二个卷积模块的输入,第二个卷积模块的输出连接输入层的输入,输入层的输出形成生成器的输出。[0061]全连接层由linear层(线性层)和sequential层(序列模型层)组成。linear层的输入形成全连接层的输入,linear层的输出连接sequential层的输入,sequential层的输出形成全连接层的输出。linear层起到全连接映射作用,在本实施例中将1×100的向量转为1×524288的向量(524288由128×64×64算出)。sequential层起到包装器作用,将多个神经网络层组合成一个整体,这有助于后续简化模型的实现和调试。[0062]维度转换层采用现有深度学习框架pytorch构建,其作用是将一维的输入转换成三维输出(因为图片信息是三维形式保存的),以便后续的操作。[0063]上采样层使用双线性插值法,将输入的特征图进行双线性插值上采样,从而将特征图的大小扩大。在本实施例中,上采样倍数为2倍(通道数不变,图片长宽变为原来的2倍)。[0064]卷积模块由2个卷积层、2个标准化层和2个leakrelu激活层组成,如图4所示。第一个卷积层的输入形成卷积模块的输入,第一个卷积层的输出连接第一个标准化层的输入,第一个标准化层的输出连接第一个leakrelu激活层的输入,第一个leakrelu激活层的输出连接第二个卷积层的输入,第二个卷积层的输出连接第二个标准化层的输入,第二个标准化层的输出连接第二个leakrelu激活层的输入,第二个leakrelu激活层的输出形成卷积模块的输出;第一个卷积层的输入与第二个leakrelu激活层的输出跳跃连接。标准化层作用是增加模型鲁棒性,即增强容错能力。跳跃连接作用是直接传递低层次的特征到高层次,从而避免了信息在传递过程中的丢失和模糊,在这里可让生成器生成更高质量的图像。在本实施例中,2个卷积模块的卷积核大小皆为3×3,步长为1(因此每经过一个判别器模块,图片长宽都不变),填充为1。[0065]输出层由卷积层和tanh激活层组成。卷积层的输入形成,卷积层的输出连接tanh激活层的输入,tanh激活层的输出形成输出层的输出。卷积层的卷积核大小为3×3,步长为1,填充为1,输入通道为64,输出通道数为3。tanh激活层保证生成的图像在像素值的范围内,同时改善模型的训练效果。[0066]生成器的输入为一个随机噪声,输出为一个图片向量。在本实施例中,从高斯分布中获得一个随机噪声z(长度为100),并将其输入生成器,最终得到一个3×256×256(通道×长×宽)的图片向量。生成器生成batchsize(设定的批量大小)个仿图。[0067]步骤3.2、rlsgan模型的判别器对训练集中的故障类型的二维特征图(真图)xreal和生成器生成的二维特征图(仿图)xfake进行打分。[0068]rlsgan模型的判别器由4个判别器模块、1个展平层和1个映射层组成,如图5所示。第一个判别器模块的输入形成判别器的输入,第一个判别器模块的输出连接第二个判别器模块的输入,第二个判别器模块的输出连接第三个判别器模块的输入,第三个判别器模块的输出连接第四个判别器模块的输入,第四个判别器模块的输出连接展平层的输入,展平层的输出连接映射层的输入,映射层的输出形成判别器的输出。[0069]判别器模块由卷积层、leakyrelu激活层和2d dropout层(随机失活层)组成,如图6所示。卷积层的输入形成判别器模块的输入,卷积层的输出连接leakyrelu激活层的输入,leakyrelu激活层的输出连接2d dropout层的输入,2d dropout层的输出形成判别器模块的输出。卷积层用于提取输入数据的特征。leakyrelu激活层使得激活函数在输入为负时仍然具有梯度,避免神经元的输出变成0和在后续的计算中不再变化,有助于提高模型的精度和稳定性。2d dropout层随机屏蔽部分信息(比例为0.25),防止过拟合。4个判别器模块的卷积核大小皆为3×3,步长为2(因此每经过一个判别器模块,图片长宽都减半),填充为1。第一个判别器模块输入通道为3,输出通道数为16;第二个判别器模块输入通道为16,输出通道数为32;第三个判别器模块输入通道为32,输出通道数为64;第四个判别器模块输入通道为64,输出通道数为128。[0070]展平层采用现有深度学习框架pytorch构建,其作用是把多维的输入转换成一维,以便最后的映射层打分。[0071]映射层采用现有深度学习框架pytorch构建,其作用是将一维向量映射为一个概率值。[0072]判别器的输入为一个图片向量,输出为一个打分值。在本实施例中,将一个3×256×256(通道×长×宽)的图片向量输入判别器,最终得到一个0到1的打分值,这个值越接近于1,代表判别器认为这个图片向量是真实图片的概率越高。判别器分别对batchsize(设定的批量大小)个的真图和仿图进行打分。[0073]步骤3.3、通过判决器的打分计算生成器和判别器各自的损失。[0074]rlsgan模型的生成器和判别器的损失函数为均方误差损失函数。[0075]生成器的损失函数gloss为:[0076][0077]判别器的损失函数dloss为:[0078][0079]其中,d(x)为判别器对真图(输入rlsgan模型的故障类型的二维特征图)的打分,d(g(z))为判别器对仿图(rlsgan模型的生成器生成的故障类型的二维特征图)的打分。[0080]步骤3.4、使用优化算法最小化损失函数来更新生成器和判别器的参数。[0081]在训练过程中,生成器和判别器的目标都是最小化损失函数,因此优化算法会同时更新它们的参数,这种同时更新两个模型(生成器和判别器)的方法被称为对抗训练,其最终目的是改善生成器的训练稳定性,从而改善生成的二维特征图(仿图)的质量。在本实施例中,所使用的优化算法为adam优化算法。[0082]步骤3.5、重复上述步骤3.1-3.4,直到所有故障类特征图都分批被判别器打分,由此完成一次迭代。重复上述每一次迭代过程,直到达到设定的迭代次数为止。[0083]通过生成器和判别器的对抗训练,让生成器和判别器都不断提升自己,生成器也因此可以生成越来越接近于真实的图片。[0084]步骤4、利用训练好的rlsgan模型的生成器生成一定数量的故障类型的二维特征图,并将生成的故障类型的二维特征图并入原有的训练集中,得到平衡训练集。[0085]利用训练好的rlsgan模型的生成器生成的故障类型的二维特征图的目的是使得训练集中的正常类型的二维特征图的数量与故障类型的二维特征图的数量尽可能相等,以使得训练集中的正常和故障数据保持平衡,以提高所训练出的resnet的预测准确性。在本实施例中,利用训练好的rlsgan模型的生成器生成的故障类型的二维特征图的数量等于训练集中正常类型的二维特征图的数量减去训练集中故障类型的二维特征图的数量。[0086]将生成的故障类型的二维特征图并入原有训练集,原有训练集大部分为正常类别的特征图,合并后,故障类别的二维特征图将与正常类别的二维特征图的数量大致相等,由此得到一个平衡训练集。[0087]步骤5、先利用平衡训练集对resnet(深度残差神经网络)模型进行训练,得到初步的用于预测工业设备状态的resnet模型,再利用测试集对resnet模型进行测试,得到最终的用于预测工业设备状态的resnet模型。[0088]步骤6、获取工业设备的实时二维特征图,并将实时二维特征图送入最终的用于预测工业设备状态的resnet模型中,得到工业设备的当前状态。[0089]步骤6.1、利用振动传感器采集工业设备实时一维时序振动信号。[0090]步骤6.2、对实时一维时序振动信号进行短时傅里叶变换,得到实时二维特征图。[0091]步骤6.2、将实时二维特征图送入最终的用于预测工业设备状态的resnet模型中,得到工业设备的当前状态,其中工业设备的当前状态包括正常状态和具体故障状态。[0092]需要说明的是,尽管以上本发明所述的实施例是说明性的,但这并非是对本发明的限制,因此本发明并不局限于上述具体实施方式中。在不脱离本发明原理的情况下,凡是本领域技术人员在本发明的启示下获得的其它实施方式,均视为在本发明的保护之内。
图片声明:本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!
内容声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理!本站为非盈利性质站点,发布内容不收取任何费用也不接任何广告!
免责声明:我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理,本文部分文字与图片资源来自于网络,部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!的,若有来源标注错误或侵犯了您的合法权益,请立即通知我们,情况属实,我们会第一时间予以删除,并同时向您表示歉意,谢谢!
一种基于深度学习的工业不平衡数据多分类方法 专利技术说明
作者:admin
2023-07-26 11:25:09
829
关键词:
计算;推算;计数设备的制造及其应用技术
专利技术