计算;推算;计数设备的制造及其应用技术1.本发明属于电能质量时间序列聚类技术领域。背景技术:2.随着电网向能源互联和清洁高效的新型电力系统不断完善和发展,系统中电能质量的监测、分析和治理等也愈发受到重视,指标数据呈指数级增长,指标数据按采集顺序排列形成电能质量时间序列。大规模的电能质量时间序列是数据处理和信息提取的基础,对电网谐波畸变、电压偏差、不平衡、频率偏差等电能质量时间序列进行聚类分析,能够发现电网不同位置电能质量变化规律的相似性。依据聚类分析结果可以对整个网络中电能质量态势进行预测,提前掌握变化趋势,以便按实际需求实施调控。同时,根据各监测点时间序列的聚类情况,为电能质量的区域化治理提供数据支撑。目前,针对电能质量时间序列聚类方法的研究较少,现有方法计算过程复杂,快速性与有效性难以兼容,对大规模序列的处理能力不足。技术实现要素:3.本发明目的是为了解决现有电能质量时间序列聚类方法存在计算过程复杂、处理效率低的问题,提出了一种基于符号特征表示的电能质量时间序列聚类方法。4.本发明所述的基于符号特征表示的电能质量时间序列聚类方法,包括:5.步骤一、对所有待聚类的电能质量时间序列进行标准化处理,去除所述时间序列中的杂散数据,获得具有高斯分布特性的时间序列;6.步骤二、将所述具有高斯分布特性的时间序列等间隔分段,求取每段数据的均值,将所述均值作为每段间隔的特征值,获得分段后的特征序列;7.步骤三、对所述分段后的特征序列进行等概率分区;定义符号特征的数值范围区间,判断每个等概率区的特征值所属范围,确定对应的符号,将等概率区的特征值替换为对应的符号特征,获取电能质量符号特征序列;8.步骤四、根据每个符号特征所属等概率区间的起始点,计算任意两个符号特征之间的基距离;9.步骤五、利用所述任意两个符号特征之间的基距离,求任意两列所述符号特征序列对应位置符号的基距离的累加和;10.步骤六一、选择任意一符号特征序列作为第一类参考准序列,将与第一类参考序列对应位置符号的基距离累加和小于聚类阈值a的符号特征序列归为第一类,完成第一次聚类,再对未归类的符号特征序列进行聚类,直至所有符号特征序列归类完成,获得y类数据,判断y是否等于设定类的个数ε,若是,则完成聚类,否则执行步骤六二;11.步骤六二、若ε<y,令聚类阈值a=a-a,返回执行步骤六一,若ε>y,a=a+a,返回执行步骤六一,其中,ε和m均为正整数;a代表聚类阈值a的调整系数,a根据m与ε的差确定。12.进一步地,本发明中,步骤一中,获得具有高斯分布特性的时间序列的具体方法为:13.设任意电能质量时间序列为q={q1,q2,…,qn},利用标准化公式:[0014][0015]计算获得期望为0方差为1的具有高斯分布的电能质量时间序列q′={q1′,q2′,…,qn′};[0016]其中,qi为序列q中i时刻的电能质量数据,ζq为序列q中全部电能质量数据的期望值;σq为序列q中全部电能质量数据的方差值,qi'为i时刻的电能质量数据qi的标准化数据,n为电能质量数据个数。[0017]进一步地,本发明中,步骤二中,获得分段后的特征序列的方法为:[0018]将具有高斯分布特性的时间序列q′等分为k个间隔,以每个间隔子序列的平均值作为分段处理后每个间隔子序列的特征值:[0019][0020]获得分段后的特征序列所述特征序列符合高斯分布,其中,qi'为序列q′中i时刻的电能质量数据,为分段处理后序列第j个间隔的特征值。[0021]进一步地,本发明中,步骤三中,获取电能质量符号特征序列;[0022]设经过分段处理的序列q*中数据被划分为m个等概率区间,则每个区间的概率为总体区间对应的电能质量数据区间为[α,β],各概率区间的起始分割点计算方法为:[0023][0024]其中,xl为第l个概率区间的起始分割点,l=2,3,…m,根据特征值对应区间的符号特征,将序列q*转换为符号特征序列qγ,α为所有电能质量数据中的最小值,β为所有电能质量数据中的最大值。[0025]进一步地,本发明中,步骤四中,根据每个符号特征的所属等概率区间的起始点,计算任意两个符号特征之间的基距离的具体方法为:[0026]两个符号特征之间的基距离为db(p,q):[0027][0028]其中,p和q为任意两个符号特征,xp和xq分别为符号p和符号q所属概率区间的起始分割点,和分别为序列1和序列2第j个间隔的特征值。[0029]进一步地,本发明中,步骤五中,通过累加求和的方式求任意两列电能质量符号特征序列的符号距离和的具体方法为:[0030]两列电能质量符号特征序列的符号距离和d(qγ1,qγ2)为:[0031][0032]其中,qγ1和qγ2分别为两个电能质量符号特征序列,j代表时间序列等间距分割后第j个间隔。[0033]本发明所述基于符号特征表示的电能质量时间序列聚类方法,能够将电能质量时间序列转化为具有高斯分布的分段序列,去除原始序列数据分布的杂散性,提取序列分段特征,以分段特征描述原始序列的大量数据,构建电能质量时间序列的符号特征表示,定义序列间的符号特征距离,采用符号特征距离方式进行序列聚类分析,实现原始序列数据维度的大幅度压缩处理,提高计算效率,方法简单有效,实施方便。附图说明[0034]图1是本发明所述基于符号特征表示的电能质量时间序列聚类方法的流程图;[0035]图2是电能质量时间序列的符号化特征表示图。具体实施方式[0036]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。[0037]需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。[0038]具体实施方式一:下面结合图1和图2说明本实施方式,本实施方式所述基于符号特征表示的电能质量时间序列聚类方法,包括:[0039]步骤一、对所有待聚类的电能质量时间序列进行标准化处理,去除所述时间序列中的杂散数据,获得具有高斯分布特性的时间序列;[0040]步骤二、将所述具有高斯分布特性的时间序列等间隔分段,求取每段数据的均值,将所述均值作为每段间隔的特征值,获得分段后的特征序列;[0041]步骤三、对所述分段后的特征序列进行等概率分区;定义符号特征的数值范围区间,判断每个等概率区的特征值所属范围,确定对应的符号,将等概率区的特征值替换为对应的符号特征,获取电能质量符号特征序列;[0042]步骤四、根据每个符号特征所属等概率区间的起始点,计算任意两个符号特征之间的基距离;[0043]步骤五、利用所述任意两个符号特征之间的基距离,求任意两列所述符号特征序列对应位置符号的基距离的累加和;[0044]步骤六一、选择任意一符号特征序列,将与该符号特征对应位置符号的基距离累加和小于聚类阈值a的归为第一类,再从未归类的符合特征序列中任意选择一列特征序列作为第二类进行归类,直至所有符号特征序列归类完成,获得y类数据,判断y是否等于设定类的个数ε,若是,则完成聚类,否则执行步骤六二;[0045]步骤六一、选择任意一符号特征序列作为第一类参考准序列,将与第一类参考序列对应位置符号的基距离累加和小于聚类阈值a的符号特征序列归为第一类,完成第一次聚类,再对未归类的符号特征序列进行聚类(再进行聚类时,从未归类的符号特征序列中任意选择一列特征序列作为第二类标准序列,将未归类的符号特征序列中与第二类参考序列对应位置符号的基距离累加和小于聚类阈值a的符号特征序列归为第二类,剩余序列的聚类过程与上述过程相同)直至所有符号特征序列归类完成,获得y类数据,判断y是否等于设定类的个数ε,若是,则完成聚类,否则执行步骤六二;[0046]步骤六二、若ε<y,令聚类阈值a=a-a,返回执行步骤六一,若ε>y,a=a+a,返回执行步骤六一,其中,ε和m均为正整数;a为聚类阈值调整系数,a根据m与ε的差确定。[0047]本实施方式中所述的待聚类的电能质量时间序列的时间长度相同,分段个数及概率分区个数也相同,因此,每个符号特征序列的符号个数也是相同的,在进行电能质量符号特征序列的符号距离和时,是两列符号特征序列的符号按顺序对应计算符号基距离,并对两列符号特序列对应位置符号之间的基距离进行累加求和获得两列符号序列的距离和。[0048]当进行聚类时,将每列待聚类的电能质量时间序列定义一个单独的类,计算该序列与其他所有待聚类的电能质量符号特征序列距离和进行求取,将与该序列距离和小于聚类阈值的电能质量符号特征序列归为自身类,直至遍历所待聚类的电能质量时间序列的符号特征序列,则完成第一个类的聚类,再从不属于第一个类的待聚类的电能质量时间序列的符号特征序列中任选一个序列作为第二个类进行聚类计算,直至所有待聚类的待聚类的电能质量时间序列均聚类完成,判断获得的类的个数y是否等于设定类的个数ε,若是,ε<y,则领聚类阈值a=a-a,再次重新进行聚类,若ε>y时,a=a+a,可以重新进行聚类,也可以在原有完成第一个聚类的基础上,将与第一个类的第一个符号序列的距离和满足当前阈值a的序列归入第一个类,再重新选择第二个类序列进行聚类。本发明能够将电能质量时间序列转化为具有高斯分布的分段序列,提取序列分段特征,实现原始序列的符号化表示,通过计算序列间的符号特征距离对原始序列进行合并聚类,划分电网中相似度高的电能质量监测位置。[0049]进一步地,本发明中,步骤一中,获得具有高斯分布特性的时间序列的具体方法为:[0050]设任意电能质量时间序列为q={q1,q2,…,qn},利用标准化公式:[0051][0052]计算获得期望为0方差为1的具有高斯分布的电能质量时间序列q′={q1′,q2′,…,qn′};[0053]其中,qi为序列q中i时刻的电能质量数据,ζq为序列q中全部电能质量数据的期望值;σq为序列q中全部电能质量数据的方差值,qi'为i时刻的电能质量数据qi的标准化数据,n为电能质量数据个数。[0054]进一步地,本发明中,步骤二中,获得分段后的特征序列的方法为:[0055]将具有高斯分布特性的时间序列q′等分为k个间隔,以每个间隔子序列的平均值作为分段处理后每个间隔子序列的特征值:[0056][0057]获得分段后的特征序列所述特征序列符合高斯分布,其中,qi'为序列q′中i时刻的电能质量数据,为分段处理后序列第j个间隔的特征值。[0058]进一步地,本发明中,步骤三中,获取电能质量符号特征序列;[0059]设经过分段处理的序列q*中数据被划分为m个等概率区间,则每个区间的概率为总体区间对应的电能质量数据区间为[α,β],各概率区间的起始分割点计算方法为:[0060][0061]其中,xl为第l个概率区间的起始分割点,l=2,3,…m,根据特征值对应区间的符号特征,将序列q*转换为符号特征序列qγ,α为所有电能质量数据中的最小值,β为所有电能质量数据中的最大值。[0062]进一步地,本发明中,步骤四中,根据每个符号特征的所属等概率区间的起始点,计算任意两个符号特征之间的基距离的具体方法为:[0063]两个符号特征之间的基距离为db(p,q):[0064][0065]其中,p和q为任意两个符号特征,xp和xq分别为符号p和符号q所属概率区间的起始分割点,和分别为序列1和序列2第j个间隔的特征值。[0066]进一步地,本发明中,步骤五中,通过累加求和的方式求任意两列电能质量符号特征序列的符号距离和的具体方法为:[0067]两列电能质量符号特征序列的符号距离和d(qγ1,qγ2)为:[0068][0069]其中,qγ1和qγ2分别为两个电能质量符号特征序列,j代表时间序列等间距分割后第j个间隔。[0070]设有z个电能质量时间序列(q1,q2,q3,…qz),需要聚类划分为ε个类别。通过步骤一、二、三可以得到符号特征序列(qγ1,qγ2,qγ3,…qγz),将每个符号特征序列作为一个单独类别,通过步骤四计算得到任意两两符号特征序列之间的符号特征距离d(qγι,qγj),以类间最大符号特征距离值作为类间距,合并符号特征距离相近的类别,合并至满足ε个类别为止。[0071]本发明处理过程:1.对电能质量时间序列进行标准化处理,去除原始序列数据分布的杂散性,获得具有高斯分布特性的序列;2.对高斯分布的序列进行等间隔分段处理,提取每段子序列的均值作为特征值;3.将经过分段处理的序列中数据划分为若干等概率区间,根据概率区间数量确定分割点,定义各区间的符号特征来表示各分段子序列,获得电能质量符号特征序列;如图2所示,图2中给出了电能质量时间序列的符号化特征表示图,其中符号a-s均代表符号特征;4.定义符号特征基距离,通过累加计算求取序列之间的符号特征距离;5.采用符号特征距离聚类方式,以每个序列作为一个类别,合并符号特征距离相近的类别,直至满足类别设置要求。本发明提高了计算效率,方法简单有效。[0072]虽然在本文中参照了特定的实施方式来描述本发明,但是应该理解的是,这些实施例仅仅是本发明的原理和应用的示例。因此应该理解的是,可以对示例性的实施例进行许多修改,并且可以设计出其他的布置,只要不偏离所附权利要求所限定的本发明的精神和范围。应该理解的是,可以通过不同于原始权利要求所描述的方式来结合不同的从属权利要求和本文中所述的特征。还可以理解的是,结合单独实施例所描述的特征可以使用在其他所述实施例中。
图片声明:本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!
内容声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理!本站为非盈利性质站点,发布内容不收取任何费用也不接任何广告!
免责声明:我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理,本文部分文字与图片资源来自于网络,部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!的,若有来源标注错误或侵犯了您的合法权益,请立即通知我们,情况属实,我们会第一时间予以删除,并同时向您表示歉意,谢谢!
基于符号特征表示的电能质量时间序列聚类方法与流程 专利技术说明
作者:admin
2022-12-02 21:55:54
997
关键词:
计算;推算;计数设备的制造及其应用技术
专利技术