测量装置的制造及其应用技术1.本发明涉及石油化工领域的油品性质快速检测分析领域,具体为基于近红外光谱快速分析技术,面向馏分油性质检测建立一种自动添加校正集样本的方法。背景技术:2.在油品分析领域,近红外光谱分析技术相比较传统的分析方法具有成熟、快速、无损等优点,因而该技术越来越多应用在油品性质的分析中。利用该技术预测油品的性质,首先要建立与待测样本接近的校正集。3.在炼化企业生产中,馏分油是广泛存在且需要实时检测以便控制优化的。作为中间产物,馏分油不同于质量要求不变的最终产品,其性质往往会在不同的工况范围内变化。例如炼化企业在更换原油或改变加工工艺后,馏分油品性质会有不同程度的改变。因此在一段时间后,新样本的分布会偏离原模型校正集样本的分布区域。当待测样本周围分布的校正集样本较少,处于稀疏区时,模型预测效果(特别是采用相似样本建模方法)将变差,预测误差增大,影响生产控制和产品质量。4.因此需要不断对模型的校正集进行更新,将处于稀疏区中的新油样添加进去,以保证模型的预测精度。目前有企业采用定期人工更新校正集的方法,但这种方法在一次更新较久后的一段时间里,预测精度往往无法保障。自动将稀疏区样本添加进入校正集可有效避免上述问题。技术实现要素:5.针对上述问题,本发明公开一种面向馏分油性质近红外检测的校正集样本添加方法,可自动将新样本添加到校正集,以保证模型预测精度,便于生产控制。6.本发明采用以下技术方案:7.(1)收集馏分油样本的近红外光谱,对样本光谱数据进行常规预处理;8.(2)对预处理后的光谱数据进行主成分分析,选取前n个主成分,绘制n维主成分分布图;9.(3)在主成分分布图中以新样本为中心,建立n维的固定框;10.(4)统计n维框内相似样本数量并与阈值比较,判断样本是否处于密集区,若相似样本数量大于阈值则新样本处于密集区,不添加到校正集,返回步骤(1);否则转步骤(5),考虑加入校正集;11.(5)按下式计算样本光谱x的梯度向量gs:12.gs(x)=(x2-x1,x3-x2,...,xl-xl-1)13.其中xi(i=1,2,...,l)为光谱x的第i个波数点对应的吸光度,l为最大波数点;14.(6)按下式计算t1和t2两个不同时刻采集的光谱xt1和光谱xt2的梯度向量光谱梯度角αgs:[0015][0016](7)计算当前样本光谱xt0的梯度角变化趋势k0i:[0017]k0i=αgs(xt0,xti)-αgs(xt0,xt(i+1))[0018]xti为按采样时间逆序排列的光谱,i=1,2,...;[0019](8)采用如下方法判断趋势变化是否相同:[0020]若在邻近m个样本xt1,xt2,...xtm中,存在αm个以上样本的夹角符号相同,则认为趋势变化相同转步骤(9),否则丢弃该样本,转步骤(1);[0021](9)自动将处于稀疏区的样本添加进模型校正集。[0022]优选的,光谱预处理包括基线校正、导数和矢量归一化。[0023]本发明中,主成分数n取2或3:当n=2时,建立二维平面框图;当n=3时,建立三维立体框图。[0024]优选的,当n=2时,二维平面框图的长宽比为2:1;当n=3时,三维立体框图的长宽高比为3:2:1。[0025]本发明中,采用如下方法判断趋势变化是否相同:若在邻近m个样本中有αm个样本的夹角符号相同,则认为趋势变化相同,其中m≥10,α≥0.7。[0026]有益效果:[0027]本发明公开了一种面向馏分油性质近红外检测的校正集样本添加方法,该方法可有效避免建模一段时间后,新样本偏离原校正集样本分布区域导致的预测精度降低的情况,能够及时更新校正集,保证模型预测精度,特别适用于炼化企业生产工况变动情况,对于企业实时控制和优化生产具有重要应用价值。附图说明[0028]图1是本发明一种面向馏分油性质近红外检测的校正集样本添加方法流程图。[0029]具体实施过程[0030]下面结合附图以及具体的算例,给出详细的计算过程和具体操作流程,以对本发明作进一步说明。本实施案例在以本发明技术方案为前提下进行实施,但本发明的保护范围不限于下述的实施案例。[0031]本案例以某炼化企业石脑油初馏点为例,依据该馏分油的近红外光谱建立预测模型。原模型校正集由该企业在2019年1月至2022年11月期间生产的897个馏分油样本组成。近年来,随着原油采购市场的变化以及工艺路线的调整,企业生产工况发生变化。本实施例中将向校正集中添加2022年12月至2023年1月的馏分油采样中处于稀疏区的样本,以建立新的校正集,并选取2023年2月1日至2023年2月底的28个样本进行初馏点预测,说明自动添加校正集样本后对预测精度的影响。[0032]本案例实施流程如图1所示,具体的实施过程如下:[0033]扫描企业石脑油样本获得近红外光谱数据,截取近红外光谱信息量较大的4000~4800cm-1波数段的吸光度数据,对截取的数据进行预处理,包括基线校正、一阶倒数和矢量归一化。[0034]对预处理后的样本光谱数据进行主成分分析,选取分析结果中的前n个主成分进行分析,本实施例中选取n=3,即当选取3个主成分后,已能覆盖该馏分油的总体特征。经分析,该馏分油的光谱分布并不均匀。事实上,其对应的馏分油初馏点性质也不均匀。经统计,石脑油初馏点分布范围从37℃到69℃,范围较广,且大部分处于中间及前端位置,末端偏少,如表1所示。[0035]表1石脑油终馏点分布统计[0036]序号分段范围(℃)数量1[37-45)1902[45-53)2973[53-61)3444[61-69]66[0037]为判断新样本是否处于稀疏区,建立三维空间上的立体框,立体框的长为0.3,宽为0.2,高为0.1,相似样本阈值取为50。对2022年12月至2023年1月采样的51个馏分油样本进行判断。[0038]首先按下式计算51个馏分油样本光谱x的梯度gs:[0039]gs(x)=(x2-x1,x3-x2,...,xl-xl-1)[0040]其中xi(i=1,2,...,l)为光谱x的第i个波数点对应的吸光度,l为最大波数点,并按下式计算t1和t2两个不同时刻采集的光谱xt1和光谱xt2的梯度向量光谱梯度角αgs:[0041][0042]计算当前样本光谱xt0的梯度角变化趋势k0i,其中xti为按采样时间逆序排列的光谱,i=1,2,...,m:[0043]k0i=αgs(xt0,xti)-αgs(xt0,xt(i+1))[0044]采用如下方法判断趋势变化是否相同,即:若在邻近m个样本中有αm个以上样本的夹角符号相同,则认为趋势变化相同。本实施例中取m=10,α=0.8,即在该样本与前面10个时间上最近的样本中,如果发现8个以上样本夹角的变化趋势相同,则将该样本纳入校正集,否则丢弃。[0045]经判断,发现其中有48个样本处于稀疏区,有3个样本为异常样本,因此将48个样本添加到校正集。[0046]基于更新得到的校正集建立模型,对2023年2月1日至2023年2月底的28个样本进行终馏点预测,说明添加校正集样本对样本预测精度的影响。[0047]首先获取待测样本和校正集馏分油样本的近红外光谱,经过常规预处理后进行主成分分析,寻找相似样本,然后根据相似样本采用偏最小二乘法建立模型,对28个待测样本的性质进行预测,预测结果分别如表2所示。[0048]表2石脑油初馏点更新后的模型预测结果[0049][0050]为便于比较,采用原模型对上述28个待测样本的性质进行预测,预测结果分别如表3所示。[0051]表3石脑油初馏点原模型预测结果[0052][0053]根据表2可以计算得到28个样本的预测标准偏差为0.85℃,而根据表3计算得到的预测标准偏差达到2.68℃。可见,采用更新后的模型样本总体预测偏差降低,更能适应企业工况变化带来的影响,预测精度显著提高。
图片声明:本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!
内容声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理!本站为非盈利性质站点,发布内容不收取任何费用也不接任何广告!
免责声明:我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理,本文部分文字与图片资源来自于网络,部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!的,若有来源标注错误或侵犯了您的合法权益,请立即通知我们,情况属实,我们会第一时间予以删除,并同时向您表示歉意,谢谢!
一种面向馏分油性质近红外检测的校正集样本添加方法与流程 专利技术说明
作者:admin
2023-07-26 11:49:06
485
关键词:
测量装置的制造及其应用技术
专利技术