国网天津市电力公司信息通信公司;国网天津市电力公司;国家电网有限公司于海涛获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉国网天津市电力公司信息通信公司;国网天津市电力公司;国家电网有限公司申请的专利语音识别方法、装置、电子设备和计算机可读存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121393430B 。
龙图腾网通过国家知识产权局官网在2026-05-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511935953.1,技术领域涉及:G10L15/20;该发明授权语音识别方法、装置、电子设备和计算机可读存储介质是由于海涛;江黛茹;张旭;郑剑;杨一帆;刘雨晗;孙妍;孙轶凡;柳天祎;周晓曦;郭晓艳设计研发完成,并于2025-12-22向国家知识产权局提交的专利申请。
本语音识别方法、装置、电子设备和计算机可读存储介质在说明书摘要公布了:本申请提供了一种语音识别方法、装置、电子设备和计算机可读存储介质,可以应用于语音识别技术领域。该方法包括:响应于接收到来自电力施工现场的语音信号,通过对降噪后的语音信号进行能量分布特征与谱熵特征的联合分析,从降噪后的语音信号中提取目标语音信号。对目标语音信号的频域特征进行频域划分,得到第一频率特征和第二频率特征。通过动态调整第一频率特征和第二频率特征各自的权重,基于多头自注意力机制融合第一频率特征和第二频率特征,生成初始融合特征。基于交互注意力机制,将与初始融合特征相匹配的电力行业术语对初始融合特征进行表述修正,生成目标语义特征。对目标语义特征进行识别,生成目标任务类型和目标任务内容。
本发明授权语音识别方法、装置、电子设备和计算机可读存储介质在权利要求书中公布了:1.一种语音识别方法,其特征在于,包括: 响应于接收到来自部署在电力施工现场的终端设备的语音信号,通过对降噪后的语音信号进行能量分布特征与谱熵特征的联合分析,从所述降噪后的语音信号中提取目标语音信号;其中,所述目标语音信号为语义连续的音频序列; 对目标语音信号的时域特征进行傅里叶变换,生成目标语音信号的频域特征; 通过调用激活函数对目标语音信号的频域特征进行处理,生成频域掩码;其中,频域掩码包括:低频频域掩码和高频频域掩码; 利用频域掩码对目标语音信号的频域特征进行频域划分,得到第一频率特征和第二频率特征;第一频率特征和第二频率特征是两种互补的语音信号频率特征;第一频率特征表示所述目标语音信号中的低频分量和第二频率特征表示所述目标语音信号中的高频分量; 所述第一频率特征表征所述目标语音信号的全局语义;所述第二频率特征表征所述目标语音信号的关键词语义; 按照第一频率特征的频率维度,调用可学习的第一权重矩阵对所述第一频率特征进行加权聚合,得到第一聚合特征;其中,所述第一聚合特征聚焦所述目标语音信号中的能量包络、韵律轮廓以及随着时间变化的全局语义结构; 按照第二频率特征的频率维度,调用可学习的第二权重矩阵对所述第二频率特征进行加权聚合,得到第二聚合特征;其中,所述第二聚合特征聚焦所述目标语音信号中的发音单元和发音突变边界; 通过调用概率分布函数对所述第一聚合特征和所述第二聚合特征进行处理,生成所述第一频率特征和所述第二频率特征各自的权重;其中,在所述目标语音信号包含噪声的情况下所述第一频率特征的权重大于所述第二频率特征的权重;在所述目标语音信号包含关键词的情况下所述第一频率特征的权重小于所述第二频率特征的权重; 基于多头自注意力机制,按照所述第一频率特征和所述第二频率特征各自的权重,融合所述第一频率特征和所述第二频率特征,得到初始融合特征; 基于交互注意力机制,将与所述初始融合特征相匹配的电力行业术语对所述初始融合特征进行表述修正,生成目标语义特征;目标语义特征修正了所述初始融合特征中的口语化表述; 对所述目标语义特征进行识别,生成目标任务类型和目标任务内容。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人国网天津市电力公司信息通信公司;国网天津市电力公司;国家电网有限公司,其通讯地址为:300140 天津市河北区昆纬路153号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励