发布信息

一种联邦学习的动态分区混合博弈建模的优化方法与流程

作者:admin      2022-10-14 13:39:52     485



计算;推算;计数设备的制造及其应用技术1.本发明涉及一种联邦学习的动态分区混合博弈建模的优化方法,属于企业 应用技术领域。背景技术:2.在强调数据确权以及隐私保护的时代背景下,联邦学习作为一种新的机器 学习范式,能够在不暴露各方数据的前提下达到解决数据孤岛以及隐私保护问 题的目的。由于其能够在多方数据源聚合的场景下协同训练全局最优模型,近 年来迅速成为安全机器学习领域的研究热点;如何将联邦学习应用到产业工程 生产技术中,仍缺乏相关技术手段。技术实现要素:3.本发明的目的在于克服现有技术中的不足,提供一种联邦学习的动态分区 混合博弈建模的优化方法,能够将企业应用从单一模式转变为多层级别模式, 从传统的人工调度模式过渡到全局优化调度的系统自主决策模式,为智能无人 工厂的可靠动态调度提供了决策工具。4.为达到上述目的,本发明是采用下述技术方案实现的:5.本发明提供了一种联邦学习的动态分区混合博弈建模的优化方法,包括:6.获取设备工序并基于混合博弈进行动态分区建模;7.根据动态分析模型基于无悔学习进行能力建模,所述能力建模包括加工单 元能力建模和加工中心能力建模;8.根据能力模型基于安全防御进行能力演化建模,所述能力演化建模包括加 工单元能力演化建模和加工中心能力演化建模;9.根据能力演化模型基于非凸问题转凸问题构建系统最优调度模型;10.根据系统最优调度模型获取全局优化调度性能指标并进行领域知识修正;11.根据历史数据挖掘全局优化调度性能指标进行区域优化动态调度;12.在区域优化动态调度中,基于风险评估理论获取全局调度性能影响;13.根据全局调度性能影响以及综合性能指标评估体系和多因素隶属度函数生 成重构判据;14.根据重构判据基于深度迁移强化学习进行动态分区重构。15.可选的,所述动态分区建模包括通过对各种应用i/o模式下影响并行文件 系统性能的因素和性能指标数据进行相关性分析,结合联邦学习,挖掘各个设 备工序之间的关系以及规律,基于关系以及规律进行动态分区建模。16.可选的,所述联邦学习的迭代过程包括:17.每个客户端从中心服务器下载第t-1轮全局模型wt-1;18.第k个客户端根据全局模型wt-1训练本地数据得到第t轮本地模型wt,k;19.每个客户端上传第t轮本地模型wt,k至中心服务器;20.中心服务器对第t轮本地模型wt,k进行加权聚合操作,得到第t轮全局模型 wt。21.可选的,所述无悔学习包括:22.后悔的定义为:在t时刻,行为人因没有采用s测量而经历的后悔值为:23.r(s)=at-at(s)24.其中,at为博弈者选择的动作;25.无悔学习的定位为:如果学习规则认为,对于任何纯粹策略, pr([lim infrt(s)]≤0),则不会表现出遗憾。[0026]可选的,所述安全防御包括:在系统遭受典型攻击时,程序设计对能力建 模进行加工演化生成能力演化模型,来防御外来攻击;能力演化模型是迭代的 过程模型。[0027]可选的,所述非凸问题转凸问题包括:修改非凸问题的目标函数使之转化 为凸函数;抛弃预设的约束条件,使新的可行域为凸集并包含原可行域。[0028]可选的,所述区域优化动态调度包括:判断是否已有静态调度方案,若无, 则直接按照生产系统中工件和设备的状况以及相关信息,确定工件的加工优先 级;若有,则在已有静态调度方案的基础上,根据生产系统的现场状态,及时 进行静态调度方案的调整,确定工件的加工优先级。[0029]可选的,所述区域优化动态调度过程中,若出现不确定因素,通过对动态 调度鲁棒保性能进行及时响应;若出现异常事件,对不确定性量化和传播分析 并根据分析结果进行异常修正。[0030]与现有技术相比,本发明所达到的有益效果:[0031]本发明提供的一种联邦学习的动态分区混合博弈建模的优化方法,能够将 企业应用从单一模式转变为多层级别模式,从传统的人工调度模式过渡到全局 优化调度的系统自主决策模式,为智能无人工厂的可靠动态调度提供了决策工 具。附图说明[0032]图1是本发明实施例一提供的一种联邦学习的动态分区混合博弈建模的优 化方法的流程图;[0033]图2是本发明实施例一提供的一种联邦学习的动态分区混合博弈建模的优 化方法的路线图。具体实施方式[0034]下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明 本发明的技术方案,而不能以此来限制本发明的保护范围。[0035]实施例一:[0036]如图1-2所示,本发明实施例提供了一种联邦学习的动态分区混合博弈建 模的优化方法,包括以下步骤:[0037]1、获取设备工序并基于混合博弈进行动态分区建模;[0038]由于当前所提出的优化方法,大多数都是基于某一个时间点的、静态的优 化方法。当应用系统的功能、负载或者架构发生变化时,并行文件系统i/o访 问模式也会随之产生变化,而这种变化将导致已有的优化方法可能不再适用于 当前的系统。因此,根据某一个时间点应用系统的i/o模式对应用系统或并行 文件系统进行孤立的、静态的优化方法都有其局限性。在本实施中中,将寻求 一种新的,更具有针对性、适应性的并行文件系统性能优化方法。通过对各种 应用i/o模式下影响并行文件系统性能的因素和性能指标数据进行相关性分析, 结合联邦学习,挖掘各个设备工序之间的关系以及规律,基于关系以及规律进 行动态分区建模。[0039]其中,联邦学习的迭代过程包括:[0040]每个客户端从中心服务器下载第t-1轮全局模型wt-1;[0041]第k个客户端根据全局模型wt-1训练本地数据得到第t轮本地模型wt,k;[0042]每个客户端上传第t轮本地模型wt,k至中心服务器;[0043]中心服务器对第t轮本地模型wt,k进行加权聚合操作,得到第t轮全局模型 wt。[0044]2、根据动态分析模型基于无悔学习进行能力建模,能力建模包括加工单元 能力建模和加工中心能力建模;无悔学习是博弈论中重复博弈的一种学习类型, 其中最常用的就是一个算法叫做后悔匹配算法。[0045]后悔的定义为:在t时刻,行为人因没有采用s测量而经历的后悔值为:[0046]r(s)=at-at(s)[0047]其中,at为博弈者选择的动作;[0048]无悔学习的定位为:如果学习规则认为,对于任何纯粹策略, pr([lim infrt(s)]≤0),则不会表现出遗憾。[0049]3、根据能力模型基于安全防御进行能力演化建模,能力演化建模包括加工 单元能力演化建模和加工中心能力演化建模;[0050]安全防御包括:在系统遭受典型攻击时,程序设计对能力建模进行加工演 化生成能力演化模型,来防御外来攻击;能力演化模型是迭代的过程模型。该 模型能够使得软件开发人员逐步开发出更完整的软件版本。特别适用于对软件 需求缺乏认识或软件需求不明确的人群。[0051]4、根据能力演化模型基于非凸问题转凸问题构建系统最优调度模型;[0052]谈到凸问题以及非凸问题,首先想到的是凸与非凸。凸在机器学习中指的 主要是顺着梯度方向走到底就一定是局部最优解同时也是全局最优解,大部分 传统的机器学习都是凸问题。而非凸指的是顺着梯度的方向走到底只能保证是 局部最优,不能保证是局部最优,深度学习以及小部分传统机器学习问题都是 非凸的问题。[0053]在实际运行过程中,由于非凸问题通常情况下较难求解,其可行域集合可 能存在无数个局部最优点,求解全局最优算法复杂度是指数级(np hard)。因 为非凸优化的难度较高,我们可以考虑将非凸优化转化为凸优化问题解决:修 改非凸问题的目标函数使之转化为凸函数;抛弃预设的约束条件,使新的可行 域为凸集并包含原可行域。[0054]5、根据系统最优调度模型获取全局优化调度性能指标并进行领域知识修正;[0055]在研究半导体定制化软件系统时,结合半导体生产设备相关情况,总结出 与其有关的调度性能指标。其中,短期性能指标分为与产品有关的在制品值、 移动步数和移动速率,以及与设备有关的设备利用率、负载程度、排队队长和 瓶颈率;长期性能指标主要包括产品的加工周期、流程参数和生产率。本实施 例通过结合工业大数据中专业技术知识领域的内容,对生产设备的调度性能指 标进行全局优化以及知识修正,保证了应用的全局适用性。[0056]6、根据历史数据挖掘全局优化调度性能指标进行区域优化动态调度;[0057]态调度指在决策时刻,调度环境的部分信息可知,调度环境和任务存在不 可预测扰动情况下,根据逐步获得的信息,不断更新的调度。与静态调度相比, 动态调度能够针对生产现场的实际情况产生更具可操作性的决策方案。[0058]区域优化动态调度包括:判断是否已有静态调度方案,若无,则直接按照 生产系统中工件和设备的状况以及相关信息,确定工件的加工优先级;若有, 则在已有静态调度方案的基础上,根据生产系统的现场状态,及时进行静态调 度方案的调整,确定工件的加工优先级。[0059]在该步骤中,通过对历史数据进行挖掘,对局部进行优化,通过多个逻辑 分层建立负责不同功能的模块对设备调度问题进行智能分析。[0060]7、在区域优化动态调度中,基于风险评估理论获取全局调度性能影响;[0061]风险评佑是指采用一系列逻辑步骤,使设计人员和安全工程师能够以一种 系统的方式检查由于设备的使用而产生的灾害,从而可以选择合适的安全措施。[0062]如今现有的调度模式是基于nm(node manager)的心跳的方式进行调度 的(不考虑持续调度模式),进行调度时,一次只考虑一个节点,这很容易造 成非最优的调度。和现有的调度模式不同,全局调度需要能实现调度的时候, 可以对更多的节点进行考虑,找到与应用程序需求最匹配的那些节点。全局调 度的调度逻辑为提出候选节点的概念,不再是只考虑心跳的节点。[0063]8、根据全局调度性能影响以及综合性能指标评估体系和多因素隶属度函数 生成重构判据;[0064]隶属度函数属于模糊评价函数里的概念,若论域(研究的范围)u中的任 一元素x,都有一个数a(x)∈[0,1]与之对应,则称a为u上的模糊集,a(x) 称为x对a的隶属度。当x在u中变动时,a(x)就是一个函数,称为a的隶属 函数。隶属度a(x)越接近于1,表示x属于a的程度越高,a(x)越接近于0表 示x属于a的程度越低。用取值于区间(0,1)的隶属函数a(x)表征x属于a的 程度高低。[0065]9、根据重构判据基于深度迁移强化学习进行动态分区重构。[0066]深度学习(deep learning)是一个复杂的机器学习算法,是学习样本数据 的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音 等数据的解释有很大的帮助。[0067]强化学习(reinforcement learning),就是智能系统从环境到行为映射的 学习,以使奖励信号(强化信号)函数值最大。[0068]迁移学习,或者领域适应domain adaptation,一般就是要将从源领域 (source domain)学习到的东西应用到目标领域(target domain)上去。源领 域和目标领域之间往往有gap/domain discrepancy(源领域的数据和目标领域的 数据遵循不同的分布)。[0069]本实施例还包括,在区域优化动态调度过程中,[0070](1)若出现不确定因素,通过对动态调度鲁棒保性能进行及时响应;[0071]鲁棒控制是一个着重控制算法可靠性研究的控制器设计方法。鲁棒性 (robustness)一般定义为在实际环境中为保证安全要求控制系统最小必须满足 的要求。一旦设计好这个控制器,它的参数不能改变而且控制性能保证。鲁棒 控制理论是针对实际工程中模型不确定性发展起来的,是对时间域或频率域来 说,一般假设过程动态特性的信息和它的变化范围。其中一些算法不需要精确 的过程模型但需要一些离线辨识。本实施例在出现不确定因素时,通过对鲁棒 保性能的动态调度来及时响应出现的不可控因素,保证了系统的鲁棒稳定性和 性能指标。[0072]若出现异常事件,对不确定性量化和传播分析并根据分析结果进行异常修 正;[0073]在对系统进行建模仿真评估其性能与可靠性时,面对复杂的工程系统,由 于人类认知能力不足、输入参数的随机因素影响和实验条件与样本真实值稀缺 的限制,导致系统分析模型中的输入参数存在一定的不确定性。不确定性量化 作为不确定性分析的重要组成部分,其目的是通过对系统中存在诸多输入变量 的不确定性因素时向决策者提供高置信度的系统行为预测过程。目前,不确定 性量化方法可以分为两大类,一类是以各种理论为基础的不确定性量化方法, 主要有基于证据理论、随机集理论、凸集理论和可能性理论等其它理论的不确 定性量化方法等。这一类方法多用于处理认知不确定性系统性能水平的预测。 另一类是以概率统计理论为基础的不确定性量化方法,主要有蒙特卡罗法、高 阶统计矩法、扰动法、算子法和广义多项式混沌法等,其主要是对随机不确定 性系统性能的预测。[0074]在系统出现异常事件时,可通过不确定量化和传播分析向决策者提供高置 信度的行为预测来对异常事件进行修正。[0075]本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计 算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结 合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包 含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、 cd-rom、光学存储器等)上实施的计算机程序产品的形式。[0076]以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通 技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变 形,这些改进和变形也应视为本发明的保护范围。









图片声明:本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!




内容声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理!本站为非盈利性质站点,发布内容不收取任何费用也不接任何广告!




免责声明:我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理,本文部分文字与图片资源来自于网络,部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!的,若有来源标注错误或侵犯了您的合法权益,请立即通知我们,情况属实,我们会第一时间予以删除,并同时向您表示歉意,谢谢!

相关内容 查看全部