烟台东方威思顿电气有限公司吕家慧获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉烟台东方威思顿电气有限公司申请的专利基于强化学习动态仿真的非侵入式负荷识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121350801B 。
龙图腾网通过国家知识产权局官网在2026-04-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511891738.6,技术领域涉及:G06F18/2413;该发明授权基于强化学习动态仿真的非侵入式负荷识别方法是由吕家慧;刘骞;孙敬科;冯明全;陈近;张晓峰;黄良栋设计研发完成,并于2025-12-16向国家知识产权局提交的专利申请。
本基于强化学习动态仿真的非侵入式负荷识别方法在说明书摘要公布了:本发明公开了一种基于强化学习动态仿真的非侵入式负荷识别方法,涉及电力用户侧能耗监测技术领域。该方法首先采集各类用电设备独立运行及多个叠加运行场景下的时序数据;随后构建并训练电气耦合数据转换模型,用于学习单设备独立运行与多设备叠加运行间的电气特征映射规律;同时,构建并训练场景生成策略网络,以自动化生成多样化的多设备叠加运行场景;然后利用训练好的转换模型和策略网络协同生成海量的、接近真实场景的仿真训练样本训练分类模型。本发明有效解决了因设备启停时序组合无穷性和电气耦合效应导致的训练数据匮乏与特征失配问题,提升了非侵入式负荷识别模型在实际复杂用电环境下的精度、鲁棒性与泛化能力。
本发明授权基于强化学习动态仿真的非侵入式负荷识别方法在权利要求书中公布了:1.一种基于强化学习动态仿真的非侵入式负荷识别方法,包括: 步骤S1:准备分类模型训练样本集合; 步骤S2:基于所述分类模型训练样本集合对分类模型进行训练; 分类模型的输入是多个用电设备叠加运行场景下的总复合时序数据,输出是当前运行的用电设备所构成的设备集合及各用电设备的启停时间; 步骤S3:在实际运行场景中用户总线处采集总复合时序数据,将采集到的总复合时序数据输入至训练后的分类模型中,得到识别结果; 其特征在于: 步骤S1中基于电气耦合数据转换模型和场景生成策略网络,协同生多设备叠加运行仿真样本数据,以构成分类模型的训练样本集合; 步骤S1具体包括以下子步骤: 步骤S1-1、录制用电设备在不同运行状态下的运行数据,包括各用电设备独立运行的数据,以及在多个不同的叠加运行场景下用电设备运行的数据; 步骤S1-1中,录制个典型用电设备独立运行时的独立态复合时序数据; 对于第个用电设备,,控制其单独启动、运行至停止,并在此过程中通过录波装置采集数据,其独立态复合时序数据记为,为预设的最大采样序列长度,其中任一时刻的运行数据的结构为:;上式中,表示第个用电设备在采样时刻的功率,表示第个用电设备在采样时刻的电压数据,表示第个用电设备在采样时刻的电流数据,表示第个用电设备在采样时刻的电流谐波幅值数据; 步骤S1-1中,构建个不同的叠加运行场景,并在每个场景下分别录制数据; 对于第个场景,,首先构建一个设备集合和启停时间配置集合;其中,表示第台用电设备在本场景下的启动时间,表示其关闭时间; 按照设备集合和启停时间配置集合控制多个用电设备组合运行,同时采集两类数据:一是在每个参与用电设备所在的分路采集的叠加态复合时序数据,为时刻采集到的运行数据,结构与相同;二是在总线处采集所有参与用电设备叠加后的总复合时序数据,为时刻采集到的运行数据,结构与相同; 根据总线上采集的总复合时序数据计算第个场景的统计数据向量; 将第个叠加运行场景的完整信息记为向量; 根据第个场景下某一时序数据计算该场景的统计数据向量的方式为: ; 上式中,表示该时序数据中功率部分的均值,表示该时序数据中功率部分的标准差,表示该时序数据中功率部分通过滑动窗口计算出的局部方差,和分别表示该时序数据中功率部分的最大值与最小值,表示基于该时序数据中的功率、电压和电流所计算出的功率因数; 步骤S1-2、构建电气耦合数据转换模型,并基于步骤S1-1录制的数据训练电气耦合数据转换模型; 数据转换模型的输入包括两部分:第一部分是独立态数据集,第二部分是叠加运行场景对应的向量; 数据转换模型采用“双编码器-单解码器”结构,具体包括: 第一编码器:采用双向长短期记忆网络,输入为独立态数据集,输出为设备隐特征; 第二编码器:采用多层感知机,输入为向量,输出为场景隐特征; 解码器:解码器为多层感知机,输入为拼接后的特征,输出为对应场景下所有用电设备的叠加态复合时序预测数据以及在总线处的总复合时序预测数据;表示第个叠加运行场景下第个用电设备在时刻的运行数据,为第个叠加运行场景下总线处在时刻的运行数据,二者结构均与相同; 基于步骤S1-1获得的数据集训练电气耦合数据转换模型:独立态数据集、各叠加运行场景对应的向量以及各叠加运行场景对应的总复合时序数据; 对数据转换模型进行训练时,目标函数定义为: ; 上式中,是将当前输入的向量中的统计数据向量替换为基于总复合时序预测数据计算出的统计数据向量后所得到的向量,为平衡两项损失的权重系数; 步骤S1-3、构建训练场景生成策略网络,并基于步骤S1-1录制的数据训练场景生成策略网络; 场景生成策略网络基于强化学习训练方式得到,强化学习的环境交互过程设计如下: 状态空间:状态即当前已构建的叠加运行场景的向量,其结构及定义与向量一致; 动作空间:动作定义为两种类型;类型一为三元组,表示将第个用电设备添加到当前场景的设备集合中,并为其分配启动时间和停止时间;类型二为特殊动作,表示终止当前场景的构建; 状态转移:当执行动作后,状态从更新为;具体更新方式为:将第个用电设备加入到状态的设备集合,并将加入到状态的启停时间配置集合,然后计算新的统计数据向量:获取当前设备集合中每一个用电设备所对应的独立态复合时序数据,再根据对应的启动时间和关闭时间,将序列在时间轴上进行平移和截断,形成一个预期独立运行数据,然后将当前设备集合所对应的所有预期独立运行数据在相同时刻进行求和完成叠加,得到预期总时序数据,然后基于预期总时序数据计算得到统计数据向量; 场景生成策略网络:采用多层感知机,输入为当前状态,输出层同时输出以下三个子概率分布:1添加用电设备与的概率分布,若最大概率对应的是用电设备的索引,则将该用电设备作为生成动作中将要添加的用电设备,若最大概率对应的是,则生成的动作为;2启动时间与的概率分布,若最大概率对应的是某一候选时间,则将该候选时间作为生成动作中的启动时间,若最大概率对应的是,则生成的动作为;3停止时间与的概率分布,若最大概率对应的是某一候选时间,则将该候选时间作为生成动作中的停止时间,若最大概率对应的是,则生成的动作为; 奖励函数:每一次以动作结束叠加运行场景的构建时,根据最终状态计算奖励函数;训练时基于奖励函数更新场景生成策略网络的参数; 所述奖励函数的计算方式为: ; 上式中,是预设的目标场景向量,表示获得最终状态的过程中的第个中间状态,为权重系数; 训练场景生成策略网络时,采用策略梯度方法并基于奖励函数更新场景生成策略网络的参数:设当前轮次经历了个动作和中间状态,生成轨迹为,则当前轮次策略梯度计算如下: ; 上式中,是策略网络在状态下输出动作的概率,由三个子概率分布中的最大概率值相乘得到;是基线值,取最近多轮奖励函数的平均值;为场景生成策略网络的参数的梯度; 通过梯度上升更新场景生成策略网络参数,其中为学习率; 步骤S1-4、基于数据转换模型和场景生成策略网络,生成分类模型训练样本集合; 步骤S1-4的具体方式为:利用训练好的场景生成策略网络生成个不同的叠加运行场景,对应的向量记为;对于每个生成的叠加运行场景,将其对应的向量与独立态数据集输入到已训练好的电气耦合数据转换模型中,得到该场景下总复合时序预测数据,作为该叠加运行场景对应的训练样本,同时将该叠加运行场景的设备集合和启停时间配置集合作为训练样本的标签,从而得到训练样本集合
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人烟台东方威思顿电气有限公司,其通讯地址为:264003 山东省烟台市莱山区金都路6号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励