
基本信息:
- 专利标题: 一种读数识别方法、读数识别装置以及计算机存储介质
- 申请号:CN202410471771.2 申请日:2024-04-18
- 公开(公告)号:CN118411717A 公开(公告)日:2024-07-30
- 发明人: 沙鑫宽 , 郭威 , 熊剑平 , 毛礼建
- 申请人: 浙江大华技术股份有限公司
- 申请人地址: 浙江省杭州市滨江区滨安路1187号
- 专利权人: 浙江大华技术股份有限公司
- 当前专利权人: 浙江大华技术股份有限公司
- 当前专利权人地址: 浙江省杭州市滨江区滨安路1187号
- 代理机构: 深圳市威世博知识产权代理事务所(普通合伙)
- 代理人: 严翠霞
- 主分类号: G06V20/62
- IPC分类号: G06V20/62 ; G06V10/44 ; G06V10/25 ; G06F40/20 ; G06N3/08
摘要:
本申请提出一种读数识别方法、读数识别装置以及计算机存储介质。所述读数识别方法包括:将待读数图像输入读数识别网络的图像特征提取器,提取所述待读数图像的图像特征;将类别文本输入所述读数识别网络的文本特征提取器,提取所述类别文本的文本特征;将所述图像特征和所述文本特征生成的复用特征输入所述读数识别网络的检测头,生成所述待读数图像的感兴趣区域图像;将所述感兴趣区域图像和预设提示词输入所述读数识别网络的生成头,获取所述待读数图像的最终读数结果。通过上述读数识别方法,实现读数识别网络的端到端部署,降低读数识别方案的耗时,通过图文多模态的读数识别,提高读数识别的准确性和效果。