合肥中科类脑智能技术有限公司孙俊获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉合肥中科类脑智能技术有限公司申请的专利基于大语言模型的并行视觉检测方法、装置及电子设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121564448B 。
龙图腾网通过国家知识产权局官网在2026-05-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610094311.1,技术领域涉及:G06V10/764;该发明授权基于大语言模型的并行视觉检测方法、装置及电子设备是由孙俊;丁海松;贾伟;刘海峰设计研发完成,并于2026-01-23向国家知识产权局提交的专利申请。
本基于大语言模型的并行视觉检测方法、装置及电子设备在说明书摘要公布了:本发明公开了一种涉及图像检测技术领域的基于大语言模型的并行视觉检测方法、装置及电子设备,该方法包括:获得表示待检测图像的视觉特征序列;构造可学习的视觉查询向量;将视觉特征序列与视觉查询向量进行拼接,结合待检测目标的自然语言输入序列共同输入大语言模型,对视觉查询向量进行更新,并以自回归方式生成待检测目标的类别token和用于描述类别token的语义特征表示;基于检测头将每个视觉查询向量与语义特征表示进行融合,获得融合语义信息的目标特征;基于的预测分支对目标特征进行处理,并行输出多个检测结果。采用该方法能够以并行方式完成多个目标的类别识别与位置定位,提高整体检测效率与检测性能。
本发明授权基于大语言模型的并行视觉检测方法、装置及电子设备在权利要求书中公布了:1.一种基于大语言模型的并行视觉检测方法,其特征在于,包括: 对待检测图像进行视觉编码,获得表示所述待检测图像的视觉特征序列; 构造一组可学习的视觉查询向量,用于并行表征所述待检测图像中待检测目标的空间信息; 将所述视觉特征序列与所述视觉查询向量进行拼接,结合所述待检测目标的自然语言输入序列共同输入预先训练完成的大语言模型,对所述视觉查询向量进行更新,并以自回归方式生成所述待检测目标的类别token和用于描述所述类别token的语义特征表示;其中,生成用于描述所述类别token的语义特征表示,包括:在生成类别token后,引入预定义的占位token,并提取所述占位token在所述大语言模型中的隐层特征,作为用于描述所述类别token的语义特征表示;或,提取生成的所述类别token对应的类别词token在所述大语言模型中的隐层特征,并将所述隐层特征作为独立于类别token解码结果的语义特征表示; 基于所述大语言模型中的检测头将每个所述视觉查询向量与所述语义特征表示进行融合,获得融合语义信息的目标特征;所述语义特征表示作为键输入与值输入参与与所述视觉查询向量的特征交互,以基于所述语义特征表示对所述视觉查询向量引入类别的语义约束; 基于所述大语言模型中的预测分支对所述目标特征进行处理,并行输出多个检测结果;其中,每一检测结果至少包括所述待检测目标所属类别的概率信息以及目标边界框坐标;所述目标边界框坐标通过独立的回归分支进行连续值回归预测。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人合肥中科类脑智能技术有限公司,其通讯地址为:230000 安徽省合肥市高新区望江西路5089号中国科大先进技术研究院一号嵌入式研发楼3楼301室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励