发布信息

一种电网安全态势预测方法、装置、设备及存储介质与流程 专利技术说明

作者:admin      2023-07-19 15:09:10     710



计算;推算;计数设备的制造及其应用技术1.本发明涉及电网控制技术领域,尤其涉及一种电网安全态势预测方法、装置、设备及存储介质。背景技术:2.目前,税电模型用于电网安全态势预测。税电模型是将企业税收销售发票数据和用电数据结合起来的税电指数,经过测算得出的指标,所产生的税电模型。例如,在电网稳定运行情况下,企业用电量与企业开票金额在一定程度呈现正相关性,当出现税电背离情况时,则通常代表电网安全态势可能出现异常或风险。税电背离主要包括两种情况:一是用电规模与开票额规模背离;二是用电量增长趋势与开票额增长趋势背离,可以通过构建税电背离风险度风险指标体系,对税电背离风险进行量化分析。3.在实际应用中,由于税务数据和电力基础数据本身存在异常,而现有的预测方法无法对异常数据进行处理或简单舍弃、覆盖异常数据,导致其建立模型后,对电网安全态势预测的准确度不高。技术实现要素:4.本发明提供了一种电网安全态势预测方法、装置、设备及存储介质,以解决现有的预测方法无法对异常数据进行处理或简单舍弃、覆盖异常数据,导致其建立模型后,对电网安全态势预测的准确度不高的技术问题。5.第一方面,为了解决上述技术问题,本发明提供了一种电网安全态势预测方法,包括:6.获取待预测电网的初始电力数据和初始税务数据;7.根据预先配置的税电数据匹配模型对所述初始电力数据和所述初始税务数据进行数据匹配,得到异常数据;8.利用插值法对所述异常数据进行处理,得到填补后的电力数据和税务数据;9.根据所述填补后的电力数据和税务数据,计算得出均票额年度差异度、均票额行业差异度和税电增长率差异度;10.根据所述均票额年度差异度、均票额行业差异度和税电增长率差异度建立税电背离风险预测模型;11.根据所述税电背离风险预测模型的输出结果得到安全态势预测值,并根据所述安全态势预测值对电网进行控制。12.优选地,所述税电背离风险预测模型包括:13.p=0.3*p1+0.3*p2+0.4*p314.其中,p为安全态势预测值,p1、p2、p3分别为均票额年度差异度、均票额行业差异度和税电增长率差异度。15.优选地,所述根据预先配置的税电数据匹配模型对所述初始电力数据和所述初始税务数据进行数据匹配,得到异常数据,包括:16.计算所述初始电力数据与所述初始税务数据之间的最小编辑距离;17.根据所述最小编辑距离进行数据匹配,得到异常数据;18.其中,当所述最小编辑距离大于预设阈值时,将对应的数据确定为异常数据。19.优选地,所述最小编辑距离的计算方法包括:[0020][0021]其中,x和y表示两个字符串,x长度为n,y长度为m;x[1..i]表示x的前i个字符,y[1..j]表示y的前j个字符;d[i,j]为x[1..i]到y[1..j]的最小编辑距离;del-cost表示删除操作的代价值,ins-cost表示插入操作的代价值,sub-cost表示替换操作的代价值,source表示原字符串,target表示转换的目标字符串;定义插入和删除的代价值为1,替换的代价值为2。[0022]优选地,所述利用插值法对所述异常数据进行处理,包括:[0023]利用箱盒图、正态分布对所述异常数据进行识别,并采用填补中位数法对数据进行处理。[0024]优选地,所述方法还包括:[0025]根据所述安全态势预测值将税电背离风险划分为高风险、较高风险、一般风险、低风险、无风险。[0026]优选地,所述异常数据包括电量异常数据和/或开票异常数据。[0027]第二方面,本发明提供了一种电网安全态势预测装置,包括:[0028]数据获取模块,用于获取待预测电网的初始电力数据和初始税务数据;[0029]数据匹配模块,用于根据预先配置的税电数据匹配模型对所述初始电力数据和所述初始税务数据进行数据匹配,得到异常数据;[0030]数据处理模块,用于利用插值法对所述异常数据进行处理,得到填补后的电力数据和税务数据;[0031]数据计算模块,用于根据所述填补后的电力数据和税务数据,计算得出均票额年度差异度、均票额行业差异度和税电增长率差异度;[0032]模型建立模块,用于根据所述均票额年度差异度、均票额行业差异度和税电增长率差异度建立税电背离风险预测模型;[0033]电网预测模块,用于根据所述税电背离风险预测模型的输出结果得到安全态势预测值,并根据所述安全态势预测值对电网进行控制。[0034]第三方面,本发明还提供了一种终端设备,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现上述中任意一项所述的电网安全态势预测方法。[0035]第四方面,本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行上述中任意一项所述的电网安全态势预测方法。[0036]相比于现有技术,本发明具有如下有益效果:[0037]本发明提供一种电网安全态势预测方法,包括获取待预测电网的初始电力数据和初始税务数据;根据预先配置的税电数据匹配模型对所述初始电力数据和所述初始税务数据进行数据匹配,得到异常数据;利用插值法对所述异常数据进行处理,得到填补后的电力数据和税务数据;根据所述填补后的电力数据和税务数据,计算得出均票额年度差异度、均票额行业差异度和税电增长率差异度;根据所述均票额年度差异度、均票额行业差异度和税电增长率差异度建立税电背离风险预测模型;根据所述税电背离风险预测模型的输出结果得到安全态势预测值,并根据所述安全态势预测值对电网进行控制。[0038]本发明通过数据进行匹配从而得到异常数据,并对异常数据进行填补,然后在建立模块进行电网安全态势预测,采用的数据更加全面完善,能够提高模型的精准度,有利于进行电网安全控制。同时,利用预先配置的税电数据匹配模型,通过模型来匹配数据,能够有效提升数据的匹配率,提高了计算和控制的效率。附图说明[0039]图1是本发明第一实施例提供的电网安全态势预测方法流程示意图;[0040]图2是本发明第二实施例提供的电网安全态势预测装置结构示意图。具体实施方式[0041]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。[0042]参照图1,本发明第一实施例提供了电网安全态势预测方法,包括以下步骤:[0043]s11,获取待预测电网的初始电力数据和初始税务数据;[0044]s12,根据预先配置的税电数据匹配模型对所述初始电力数据和所述初始税务数据进行数据匹配,得到异常数据;[0045]s13,利用插值法对所述异常数据进行处理,得到填补后的电力数据和税务数据;[0046]s14,根据所述填补后的电力数据和税务数据,计算得出均票额年度差异度、均票额行业差异度和税电增长率差异度;[0047]s15,根据所述均票额年度差异度、均票额行业差异度和税电增长率差异度建立税电背离风险预测模型;[0048]s16,根据所述税电背离风险预测模型的输出结果得到安全态势预测值,并根据所述安全态势预测值对电网进行控制。[0049]需要说明的是,本发明由电子设备执行,根据最终得到的安全态势预测值对电网进行控制,例如报警、给出优化建议等控制操作。[0050]本发明通过数据进行匹配从而得到异常数据,并对异常数据进行填补,然后在建立模块进行电网安全态势预测,采用的数据更加全面完善,能够提高模型的精准度,有利于进行电网安全控制。同时,利用预先配置的税电数据匹配模型,通过模型来匹配数据,能够有效提升数据的匹配率,提高了计算和控制的效率。[0051]在具体实施例中,初始电力数据包括名称、用电地址、户名,初始税务数据包括纳税人名称、生产经营地址、法人等。通过电力数据的名称与税务数据的纳税人名称,税务数据的生产经营地址和电力数据的用电地址,税务数据的法人和电力数据的户名,三对两两匹配,前者没匹配到的用后者填充。[0052]在本实施例中,所述根据预先配置的税电数据匹配模型对所述初始电力数据和所述初始税务数据进行数据匹配,得到异常数据,包括:[0053]计算所述初始电力数据与所述初始税务数据之间的最小编辑距离;[0054]根据所述最小编辑距离进行数据匹配,得到异常数据;[0055]其中,当所述最小编辑距离大于预设阈值时,将对应的数据确定为异常数据,所述异常数据包括电量异常数据和/或开票异常数据。[0056]所述最小编辑距离的计算方法包括:[0057][0058]其中,x和y表示两个字符串,x长度为n,y长度为m;x[1..i]表示x的前i个字符,y[1..j]表示y的前j个字符;d[i,j]为x[1..i]到y[1..j]的最小编辑距离;del-cost表示删除操作的代价值,ins-cost表示插入操作的代价值,sub-cost表示替换操作的代价值,source表示原字符串,target表示转换的目标字符串;定义插入和删除的代价值为1,替换的代价值为2。[0059]值得说明的是,税务和电力基础数据本身存在数据量不一致、数据维度不一致、数据准确性不一致的问题,因此利用nltk算法构建税电数据匹配模型,通过模型来匹配能够有效提升数据的匹配率。[0060]nltk是在处理预料库、分类文本、分析语言结构等多项操作中最常用到的数据清理算法。其收集的大量公开数据集、模型上提供了全面、易用的接口,涵盖了分词、词性标注(part-of-speech tag,pos-tag)、命名实体识别(named entity recognition,ner)、句法分析(syntactic parse)等各项nlp领域的功能。[0061]本发明通过计算电力数据的户名与税务数据的纳税人名称的编辑距离来实现两个数据集之间的贯通,编辑距离又称为levenshtein距离,是用于计算一个字符串转换为另一个字符串时,插入、删除和替换的次数。[0062]编辑距离公式如下:[0063][0064]其中,[0065]具体地,从一个字符串转到另一个字符串的可能路径是非常多的,所有不同的操作路径,最终都会到达一种状态。采用动态规划的方法,每一种状态都记录下来最短的路径,然后从最终状态进行回溯。动态规划把一个大的问题转换成很多的子问题来处理。[0066]先定义两个字符串间的最小编辑距离。有两个字符串x和y,x长度为n,y长度为m。d[i,j]为x[1..i]到y[1..j]的最小编辑距离。x[1..i]表示x的前i个字符,y[1..j]表示y的前j个字符,d[n,m]为x和y的最小编辑距离。[0067]然后,采用动态规划方法计算d[n,m],d[i,j]从小到大采用上述算法计算,del-cost表示删除操作的代价值,ins-cost表示插入操作的代价值,sub-cost表示替换操作的代价值,source表示原字符串,target表示转换的目标字符串。如果定义插入和删除的代价值为1,替换的代价值为2。计算方法如下式:[0068][0069]为了提高匹配速度,通过提取电力数据的区域、税务数据的地址,对两类数据按区域进行分类,最后形成多个类别的数据集分别进行数据匹配。[0070]在一种实施方式中,所述利用插值法对所述异常数据进行处理,包括:[0071]利用箱盒图、正态分布对所述异常数据进行识别,并采用填补中位数法对数据进行处理。[0072]具体地,在数据匹配的基础上,对部分缺失数据、异常数据进行预处理。其中,行业电量数据是发展统计数据,属于二次加工数据,不需要预处理,存在缺失情况,利用均值法,对其进行数据预处理。而对于电量数据异常、开票数据异常的情况,利用箱盒图、正态分布进行识别,并采用填补中位数法对数据进行处理。[0073]示例性地,若数据缺失或为0,样本数据存在部分数据数值为空的情况,可以利用pandas模块interpolate函数处理(左右采样插值法)。[0074]在一种实现方式中,其中,所述税电背离风险预测模型包括:[0075]p=0.3*p1+0.3*p2+0.4*p3[0076]其中,p为安全态势预测值,p1、p2、p3分别为均票额年度差异度、均票额行业差异度和税电增长率差异度。[0077]其中,度均票额(元/度)指的是增值税销售开票额与用电量的比值,表示每消耗单位千瓦时电量所产生的增值税销售开票额,该指标反映电网运行效率,度均票额越大标识消耗单位千瓦时电量所产生的增值税销售开票额越多,电网运行效率越好。[0078]需要说明的是,电网度均票额年度差异度表示度均票额规模与历史同期相比的差距。电网度均票额年度差异度小于0则表示电网当期度均票额低于上期度均票额,存在背离风险,该数值越小,则电网税电背离风险越大。[0079]电网度均票额行业差异度表示电网度均票额规模与同行业度均票额平均水平相比的差距。电网度均票额行业差异度小于0则表示电网当期度均票额低于当期行业平均度均票额,存在背离风险,该数值越小,则税电背离风险越大。[0080]电网税电增长率差异度表示开票额增长率与用电量增长率相比差距。当电网税电增长率差异度小于0,则表示出现背离风险,即用电量增速大于开票额增速,不符合行业电网发展规律,增长率差异度数值越小,表示背离越严重。[0081]具体地,度均票额年度差异度(p1)=某2021年度均票额/某2020年度均票额-1;度均票额行业差异度(p2)=度均票额行业差异度=某2021年度均票额/某行业2020年度均票额-1;税电增长率差异度(p3)=增长率差异度=开票额增长率-用电量增长率;度均票额=增值税销售开票额/用电量的比值。[0082]在另一种实现方式中,所述方法还包括:[0083]根据所述安全态势预测值将税电背离风险划分为高风险、较高风险、一般风险、低风险、无风险。[0084]示例性地,各指标p1、p2、p3按照分段评价法评价,pi》=0,则为0分;-20%=《pi《0,则为1分;-40%=《pi《-20%,则为2分;-60%=《pi《-40%,则为3分;-80%=《pi《-60%,则为4分;-100%=《pi《-80%,则为5分;pi《-100%,则为6分。[0085]进一步地,p》=4分为高风险,4》p》=3较高风险,3》p》=2一般风险,2》p》0低风险,p》=0无风险。[0086]本发明通过数据进行匹配从而得到异常数据,并对异常数据进行填补,然后在建立模块进行电网安全态势预测,采用的数据更加全面完善,能够提高模型的精准度,有利于进行电网安全控制。同时,利用预先配置的税电数据匹配模型,通过模型来匹配数据,能够有效提升数据的匹配率,提高了计算和控制的效率。[0087]参照图2,本发明第二实施例提供了一种电网安全态势预测装置,包括:[0088]数据获取模块,用于获取待预测电网的初始电力数据和初始税务数据;[0089]数据匹配模块,用于根据预先配置的税电数据匹配模型对所述初始电力数据和所述初始税务数据进行数据匹配,得到异常数据;[0090]数据处理模块,用于利用插值法对所述异常数据进行处理,得到填补后的电力数据和税务数据;[0091]数据计算模块,用于根据所述填补后的电力数据和税务数据,计算得出均票额年度差异度、均票额行业差异度和税电增长率差异度;[0092]模型建立模块,用于根据所述均票额年度差异度、均票额行业差异度和税电增长率差异度建立税电背离风险预测模型;[0093]电网预测模块,用于根据所述税电背离风险预测模型的输出结果得到安全态势预测值,并根据所述安全态势预测值对电网进行控制。[0094]需要说明的是,本发明实施例提供的一种电网安全态势预测装置用于执行上述实施例的一种电网安全态势预测方法的所有流程步骤,两者的工作原理和有益效果一一对应,因而不再赘述。[0095]本发明实施例还提供了一种终端设备。该终端设备包括:处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,例如电网安全态势预测程序。所述处理器执行所述计算机程序时实现上述各个电网安全态势预测方法实施例中的步骤,例如图1所示的步骤s11。或者,所述处理器执行所述计算机程序时实现上述各装置实施例中各模块/单元的功能,例如模型建立模块。[0096]示例性的,所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器中,并由所述处理器执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述终端设备中的执行过程。[0097]所述终端设备可以是桌上型计算机、笔记本、掌上电脑及智能平板等计算设备。所述终端设备可包括,但不仅限于,处理器、存储器。本领域技术人员可以理解,上述部件仅仅是终端设备的示例,并不构成对终端设备的限定,可以包括比上述更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端设备还可以包括输入输出设备、网络接入设备、总线等。[0098]所称处理器可以是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述终端设备的控制中心,利用各种接口和线路连接整个终端设备的各个部分。[0099]所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述终端设备的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。[0100]其中,所述终端设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。[0101]需说明的是,以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本发明提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。[0102]以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步的详细说明,应当理解,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围。特别指出,对于本领域技术人员来说,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。









图片声明:本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!




内容声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理!本站为非盈利性质站点,发布内容不收取任何费用也不接任何广告!




免责声明:我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理,本文部分文字与图片资源来自于网络,部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!的,若有来源标注错误或侵犯了您的合法权益,请立即通知我们,情况属实,我们会第一时间予以删除,并同时向您表示歉意,谢谢!

相关内容 查看全部