发布信息

加入特征预提取的化工过程故障快速与高准确率诊断模型 专利技术说明

作者:admin      2023-06-28 17:37:20     484



计算;推算;计数设备的制造及其应用技术1.本发明涉及一种新的化工过程故障诊断模型,特别是涉及是一种加入特征预提取的化工过程故障快速与高准确率诊断模型。背景技术:2.随着时代的发展,化工行业的规模不断扩大,一方面带动了企业与国家的经济发展,另一方面,规模化,复杂化与智能化的化工生产过程一旦发生故障,不仅将造成巨大的经济损失,还可能污染环境甚至危及人员生命。化工过程系统对过程安全性和可靠性以及产品质量的需求日益增长,引起了故障检测和诊断领域的广泛关注,实际化工过程具有非线性、时变和非高斯性等特征,故障发生表现出强烈的滞后性,目前对化工过程故障的检测与诊断基本依赖专家的经验,但效率较低,所以对复杂化工过程进行故障诊断研究具有重大的实际应用价值。3.基于数据驱动的化工过程故障诊断任务本质上是一个多分类任务,常用诊断模型由两部分组成:数据预处理+分类器。随着人工智能技术的发展,目前的主流研究主要依赖于基于各种深度学习算法的分类器。从最开始的人工神经网络到如今的复杂结构耦合的深度学习网络,故障诊断性能实现了逐步提升。但直到现在,在一个典型的化工过程(田纳西伊斯曼过程)的故障诊断研究中其故障诊断率最高也只能提升到95%左右,同时对于故障发生后较短时间的诊断效果较差,这样的性能仍然难以应用于实际工业过程。为了实现基于数据驱动的故障诊断模型具有真正实用价值,进一步提升模型的故障诊断率与故障诊断及时性具有重大的实际意义。技术实现要素:4.本发明针对已有的基于数据驱动的化工过程诊断方法忽略了对数据的前处理导致数据蕴含的高维与多元化的特征难以被分类器充分提取,从而使得故障诊断性能难以进一步提升这一困难,提供了一种加入特征预提取的化工过程故障快速与高准确率诊断模型。无论是应用于连续化工过程还是间歇化工过程都具备优异的性能。5.本发明的技术方案如下:6.一种加入特征预提取的化工过程故障快速与高准确率诊断模型;由特征预提取、数据预处理与分类器构成;其中特征预提取用于初步人为提取收集到的化工过程数据所蕴含的高维与多元的特征信息;数据预处理用于对特征预提取的结果进行数据标准化处理并进行切块得到样本矩阵,由一个滑动窗口和z-score归一化方法组成;分类器选择卷积神经网络用于实现分类任务,判断过程数据的实际运行状态。7.所述的加入特征预提取的化工过程故障快速与高准确率诊断模型;首先收集化工过程的历史数据,并选取一组正常状态的数据作为标准数据用于后续的特征预提取;在特征预提取模块,通过多个模式表示算法实现数据的特征预提取并得到三维数据矩阵;在数据预处理模块通过切块处理与数据标准化得到三维的样本矩阵;根据数据来源的过程状态进行标签,将得到的样本矩阵按8:2的比例分为训练集和测试集;在模型构筑阶段,首先设计多个cnn模型;用得到的训练集进行训练并用测试集评估其性能,如性能满足实际工业过程诊断需求,则将该模型作为在线诊断模型应用;在在线诊断过程中,对在线数据应用特征预提取与数据预处理得到样本矩阵,将样本矩阵送入在线诊断模型,最后输出故障诊断结果,判断整个化工过程是否处于故障状态,如是,则给出具体的故障原因。8.所述的加入特征预提取的化工过程故障快速与高准确率诊断模型;特征预提取模块选用用到动态时间扭曲(dtw)模块、线性回归(lr)模块、离散傅里叶变换(dft)模块或聚合近似(aa)模块的一种或几种,分别提取到对应特征,并将这些特征数据进行堆叠实现数据矩阵维度与厚度的增加,再进入后续的数据预处理,通过切块与标准化处理得到最后的样本矩阵。9.所述的加入特征预提取的化工过程故障快速与高准确率诊断模型;特征预提取通过模块动态时间扭曲(对应ⅰ)得到yⅰ=(y1ⅰ,y2ⅰ,...,ynⅰ)={yiⅰ},i=1,2,…,n,其中式中,yⅰ是在特征预提取中对输入数据实施动态时间扭曲算法提取得到的特征构成的数据矩阵,下标i表示列向量对应的索引,n为变量(列向量)数量,yiⅰ是对应第i个变量的过程数据通过动态时间扭曲算法得到的特征,m到m表示yiⅰ行向量的索引。给定一个标准序列给定一个标准序列定义d(p,q)是xi,k和从(k-m+1,k-m+1)到(p,q)的最小累计距离;dist(p,q)是欧几里得距离,定义为满足d(p,q)=dist(p,q)+min{d(p-1,q),d(p,q-1),d(p-1,q-1)},然后得到10.所述的加入特征预提取的化工过程故障快速与高准确率诊断模型;预提取模块通过线性回归(对应ⅱ)得到yⅱ=(y1ⅱ,y2ⅱ,...,ynⅱ)={yiⅱ},其中式中,yⅱ是在特征预提取中对输入数据实施线性回归算法提取得到的特征构成的数据矩阵,下标i表示列向量对应的索引,n为变量(列向量)数量,yiⅱ是对应第i个变量的过程数据通过线性回归算法得到的特征,m到m表示yiⅱ行向量的索引;给定一个横坐标bk=(k-m+1,k-m+2,...,k)t,结合子序列得到数据集{(1,xi,k-m+1),((2,xi,k-m+2),…,(m,xi,k)}用于线性回归,通过最小二乘法拟合得到直线其中式中,ai,k和bi,k分别为采用对应下标数据点拟合到的直线的斜率和截距,是预测值,然后得到11.所述的加入特征预提取的化工过程故障快速与高准确率诊断模型;预提取模块通过离散傅里叶变换(对应ⅲ)得到其中式中,yⅲ是在特征预提取中对输入数据实施离散傅里叶变换算法提取得到的特征构成的数据矩阵,下标i表示列向量对应的索引,n为变量(列向量)数量,yiⅲ是对应第i个变量的过程数据通过离散傅里叶变换算法得到的特征,m到m表示yiⅲ行向量的索引。通过离散傅里叶变换公式有换公式有最后得到12.所述的加入特征预提取的化工过程故障快速与高准确率诊断模型;预提取模块通过聚合近似(对应ⅳ)得到其中式中,yⅳ是在特征预提取中对输入数据实施聚合近似算法提取得到的特征构成的数据矩阵,下标i表示列向量对应的索引,n为变量(列向量)数量,yiⅳ是对应第i个变量的过程数据通过聚合近似算法得到的特征,m到m表示yiⅲ行向量的索引。由聚合近似公式得到13.所述的加入特征预提取的化工过程故障快速与高准确率诊断模型;滑动窗口定义一个大小为c×l×n的滑动窗口w2,式中c是指在特征预提取模块中用到的模式表示算法数量;对y通过滑动窗口采样得到ys=(ysⅰ,ysⅱ,ysⅲ,ysⅳ),其中s=m+l-1,m+1,...,m,式中s表示样本矩阵的下标。对ys进行标准化处理,使用z-score方法,得到样本矩阵score方法,得到样本矩阵其中h=s-l+1,s-l+2,...,s。14.一种结构为特征预提取+数据预处理+分类器的故障诊断模型用于化工过程的故障诊断,具有快速、高准确率的特点。在特征预提取模块,首先通过第一个滑动窗口采用多个模式表示算法对原始数据进行特征预提取,结果实现了原始二维数据矩阵厚度(维度)的增加,具有更加丰富的特征。得到的三维矩阵进入数据预处理模块,通过第二个滑动窗口进行切块处理,并在变量维度上进行数据归一化,得到的三维样本送入构筑好的卷积神经网络分类器进行训练。最终得到一个具有优异诊断性能的化工过程故障诊断模型。15.本发明在常规的故障诊断模型的基础上创新地加入了特征预提取模块,基于多个模式表示算法对原始数据进行特征预提取,增加了样本矩阵的厚度,实现了数据增强。对于给定的输入原始数据矩阵,大小为400×50,通过特征预提取模块后,经过四个模式表示算法得到的由特征数据构成的矩阵大小变为4×391×50,从二维变为了三维,其特征信息更加具体,与所选择模式表示方法关联。通过该新加入的模块,能够在数据较少的情况下提取得到数据潜在的更丰富的特征,使得故障诊断更加高效。附图说明16.图1为本发明加入特征预提取的化工过程故障诊断模型的流程图。17.图2为本发明提出的特征预提取与数据预处理流程示意图。18.图3为te过程流程图。19.图4为半间歇结晶过程流程图。具体实施方式20.下面结合附图和具体实施例对本发明做进一步的详细说明:21.本发明将多个模式表示算法组成特征预提取模块的核心,有目的地实现过程数据的特征预提取,并将提取得到的特征构成新的样本矩阵送入分类器,能够进一步实现特征的充分挖掘,提高故障诊断性能。整个故障诊断流程如图1所示,首先收集化工过程的历史数据,并选取一组正常状态的数据作为标准数据用于后续的特征预提取;在特征预提取模块,通过多个模式表示算法实现数据的特征预提取并得到三维数据矩阵。在数据预处理模块通过切块处理与数据标准化得到三维的样本矩阵;根据数据来源的过程状态进行标签,将得到的样本矩阵按8:2的比例分为训练集和测试集。在模型构筑阶段,首先设计多个卷积神经网络(cnn)模型;用上述得到的训练集进行训练,训练得到的模型用测试集评估其性能,如性能满足实际工业过程诊断需求,则将该模型作为在线诊断模型应用。22.离线阶段:23.(1)收集化工过程变量的历史数据,并记录运行状态。24.(2)选择一组正常运行状态的历史数据作为标准数据。25.(3)对历史数据进行特征预提取与数据预处理,具体流程如图2所示,首先对数据采用多个模式表示算法进行计算,在这里用到动态时间扭曲(dtw)算法、线性回归(lr)算法、离散傅里叶变换(dft)算法和聚合近似(aa)算法,分别可以提取到四个特征,并将这些特征数据进行堆叠实现数据矩阵维度与厚度的增加,再进入后续的数据预处理,通过切块与标准化处理得到最后的样本矩阵,并带有标签。26.27.[0028][0029](4)根据相应的运行状态对得到的样本矩阵进行标记,并按比例划分为训练集和测试集。[0030](5)设计一个cnn模型并进行训练和评估。如果该模型的故障诊断性能令人满意,它将被用于在线故障诊断。否则,cnn模型将被重新设计。[0031]在线阶段:[0032](1)在线收集化工过程中的数据。[0033](2)每收集到符合滑动窗口大小的数据量的数据,对其进行特征预提取和数据预处理,得到一个样本矩阵,该步骤随滑动窗口实时进行。[0034](3)将获得的样本矩阵输入所设计的cnn模型,并给出预测的诊断结果。判断过程是否正常运行,如果不正常,提供异常原因的具体信息。[0035]【实施例1】[0036]田纳西伊斯曼过(tennessee eastman,te)过程故障诊断:te过程是一个典型的非线性化工过程,广泛用于故障检测与诊断领域。te过程工艺流程如图3所示,[0037]整个过程由五个单元组成:反应器,冷凝器,分离器,压缩机和汽提器,包含a、b、c、d、e、f、g、h八种成分。其中a、c、d、e为气态反应物,b为惰性物质,f为副产物,g、h为产物。在反应器中发生的化学反应如下:[0038]a(g)+c(g)+d(g)→g(liq)[0039]a(g)+c(g)+e(g)→h(liq)[0040]a(g)+e(g)→f(liq)[0041]3d(g)→2f(liq)[0042]经过反应得到的主副产物与还没有参与反应的气态反应物通过冷凝器冷却后进入气液分离器进行分离,气相通过部分放空再循环返回反应器,液相通过泵进入汽提塔,分离得到的剩余反应物进入再循环流,产物g和h在汽提塔的塔底流出。包括50个过程变量,故障类型有20类,见表1。[0043]表1[0044][0045][0046]收集到20类故障数据与正常状态数据总共162800个(每种故障类型运行20h,采样时间设定为3min),在特征预提取与数据预处理过程,为了比较结果,设定了两种情况。在第一种情况下,直接对原始数据进行预处理,不进行特征预提取,窗口大小设置为20×50;而在第二种情况下,先对原始数据进行特征预提取,然后对得到的结果进行预处理,两个窗口大小分别设置为10×50和c×20×50,其中c是特征预提取中选择用到的模式表示的数量。按上述设定条件,对于一个400×50的原始数据矩阵,通过特征预提取模块得到的特征矩阵大小为c×391×50,通过数据预处理模块可以得到372个c×20×50大小的样本矩阵。本发明选择了组合不同数量的特征预提取模块(即c=0,1,2,3,4)进行了比较分析,最后得到数据集的总数为16。得到的数据集按8:2的比例分为训练集和测试集,通过本发明提出的特征预提取与数据预处理过程,得到162240个样本矩阵按照8:2的比例分为训练集和测试集用于cnn分类器进行训练与评估。cnn结构设计为conv(64)-pool(2×2)-conv(128)-pool(1×2)-conv(128)-fc(256)-fc(21)。评估总体平均故障诊断率和故障发生后不同时间的平均故障诊断率。16个测试集的平均故障诊断率和及时性的结果分别见表2。[0047]表2[0048][0049][0050]结果表明在四种单一的模式表示算法(i、ii、iii和iv)中,i表现突出。例如,i+ii、i+iii和i+iv明显优于ii+iii、ii+iv和iii+iv;i+ii+iii、i+ii+iv和i+iii+iv则远远高于ii+iii+iv。由此可见,作为dtw算法的"i"在te过程的故障诊断中有着至关重要的贡献,在模式表示算法的组合中也是不可或缺的。性能提高的最大贡献来自于dtw,这表明由dtw处理的数据具有更容易被cnn学习的特征。这也揭示了四种模式表示算法(i、ii、iii和iv)的重要性是不一样的,适当选择算法是必要的。正因为如此,我们在下面的分析中只需要考虑包括i在内的那些组合。当比较无特征预提取、i、i+ii、i+iii、i+iv、i+ii+iii、i+ii+iv、i+iii+iv和i+ii+iii+iv的总体平均故障诊断率时,可以看出一个总的趋势,即通过更多的模式表示算法的组合进行特征预提取的故障诊断的准确性更好。换句话说,对于te过程,故障诊断的准确性几乎与模式表示算法的数量成正比,也就是与三维数据矩阵的厚度成正比。当然,当模式表示算法的数量从3个增加到4个时,准确率的变化非常小,甚至完全没有变化。这是因为这两种情况的总体平均故障诊断率都相当高(约96%),进一步提高准确率是非常困难的。这也意味着,连续使用越来越多的模式表示算法是没有必要的。对于大多数情况下的故障诊断,三到四个就足够了。显然,本发明具有更加优异的性能。[0051]【实施例2】[0052]半间歇结晶过程故障诊断:该半间歇结晶过程体系为乙酰水杨酸,通过流量控制策略实现。其流程图如图4所示。图4是一个乙酰水杨酸(asa)的半间歇结晶过程的流程图。低温乙醇中的asa晶体浆料和高温纯水在混合容器中混合,生成高温饱和的asa溶液,溶剂为55wt%的水-乙醇,这是结晶器的进料流股。结晶器事先装入一定体积的在结晶温度(低温)下饱和的asa溶液,进料流的流量由流量-过饱和度控制(f-ssc)策略控制,以便在整个结晶过程中保持过饱和度不变。结晶器的工作温度设定为0℃,结晶器的初始溶液体积为0.1m3,其浓度相当于0℃时的溶解度,进料溶液温度设定为35℃,其浓度相当于30℃时的溶解度,进料溶液的停留时间设定为10s。在初始阶段,进料流量设定为0.0001m3,当结晶器中溶液的过饱和度达到设定值(10kg/m3)时,加入预期晶体质量的1wt%的种子,其晶体尺寸分布相同(正态分布,平均尺寸为75μm,方差为25μm),采用f-ssc控制策略调节流速,使过饱和度保持在设定值,直到进料完成,此时结晶器中溶液的体积达到1.1m3。此后,当过饱和度自然下降到几乎为0时停止结晶过程,在正常状态下,每批结晶的运行时间设定为35分钟。包括10个过程变量,故障类型有14类,见表3。[0053]表3[0054][0055]收集到14类故障数据与正常状态数据总共109200个(每种故障类型运行10min,采样时间设定为1s),在特征预提取与数据预处理过程,为了比较结果,设定了两种情况。在第一种情况下,直接对原始数据进行预处理,不进行特征预提取,窗口大小设置为10×10;而在第二种情况下,先对原始数据进行特征预提取,然后对得到的结果进行预处理,两个窗口大小分别设置为10×10和c×10×10,其中c是特征预提取中选择用到的模式表示的数量。按上述设定条件,对于一个400×10的原始数据矩阵,通过特征预提取模块得到的特征矩阵大小为c×391×10,通过数据预处理模块可以得到382个c×10×10大小的样本矩阵。本发明选择了组合不同数量的特征预提取模块(即c=0,1,2,3,4)进行了比较分析,最后得到数据集的总数为16。得到的数据集按8:2的比例分为训练集和测试集,通过本发明提出的特征预提取与数据预处理过程,得到162240个样本矩阵按照8:2的比例分为训练集和测试集用于cnn分类器进行训练与评估。cnn结构设计为conv(64)-conv(128)-pool(2×2)-conv(128)-fc(256)-fc(15)。评估总体平均故障诊断率和故障发生后不同时间的平均故障诊断率。16个测试集的平均故障诊断率和及时性的结果分别见表4。[0056]表4[0057][0058][0059]很明显,半间歇结晶过程的总体平均故障诊断率的结果与te过程的结果很相似。dtw(i)仍然是突出的、不可缺少的。在所有的模式表示算法组合中,包括i的算法明显优于没有i的算法,只有一个例外,即i+iii。然而,在比较无特征预提取、i、i+ii、i+iv、i+ii+iii、i+ii+iv、i+iii+iv和i+ii+iii+iv的总体平均故障诊断率时,仍然可以看到类似的普遍趋势。在特征预提取中使用更多的模式表示算法,故障诊断的准确性更高。对于半批量结晶过程,平均精度也与模式表示算法的数量和三维数据矩阵的厚度成正比。同样地,在三种和四种模式表示算法的两种情况下,准确率的提高也是非常小的(从97.7%到98.1%的总体平均故障诊断率)。在故障诊断时效性的角度,与没有特征预提取的故障诊断相比,其平均故障诊断率总是低于70%,而有特征预提取的故障诊断的平均故障诊断率通常要高得多。例如,在故障诊断中只使用dtw(ⅰ)的情况下,平均故障诊断率总是超过80%,使用i+ii和i+iv的情况下,平均故障诊断率超过90%,使用i+ii+ii、i+ii+iv和i+iii+iv的情况下,平均故障诊断率超过95%,而使用i+ii+iii+iv的故障诊断性能最好,平均故障诊断率约99%。通过特征预提取之后的模型从相对较短的时间内学习数据,可以获得较高的故障诊断精度,因为对于不同的故障持续时间(从0-1min到5-10min)的每个案例,使用更多模式表示算法的故障诊断精度普遍较高。例如,通过学习故障发生后仅1分钟内的数据,i+ii+iii+iv的组合的平均故障诊断率可以达到94.7%。本发明在半间歇结晶过程故障诊断中也具有显著的优势。[0060]本发明公开和提出的技术方案,本领域技术人员可通过借鉴本文内容,适当改变条件路线等环节实现,尽管本发明的方法和制备技术已通过较佳实施例子进行了描述,相关技术人员明显能在不脱离本发明内容、精神和范围内对本文所述的方法和技术路线进行改动或重新组合,来实现最终的制备技术。特别需要指出的是,所有相类似的替换和改动对本领域技术人员来说是显而易见的,他们都被视为包括在本发明精神、范围和内容中。









图片声明:本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!




内容声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理!本站为非盈利性质站点,发布内容不收取任何费用也不接任何广告!




免责声明:我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理,本文部分文字与图片资源来自于网络,部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!的,若有来源标注错误或侵犯了您的合法权益,请立即通知我们,情况属实,我们会第一时间予以删除,并同时向您表示歉意,谢谢!

相关内容 查看全部