
基本信息:
- 专利标题: 一种密集场景文本检测与识别方法
- 申请号:CN202311235672.6 申请日:2023-09-25
- 公开(公告)号:CN117218641B 公开(公告)日:2025-08-19
- 发明人: 周华兵 , 王浩 , 陈灯 , 王燕燕 , 樊晶晶 , 杨攀
- 申请人: 武汉逸锦科技有限公司 , 武汉工程大学
- 申请人地址: 湖北省武汉市东湖新技术开发区康魅路1号金地·碣石庄园二期21栋2单元11层01室
- 专利权人: 武汉逸锦科技有限公司,武汉工程大学
- 当前专利权人: 武汉逸锦科技有限公司,武汉工程大学
- 当前专利权人地址: 湖北省武汉市东湖新技术开发区康魅路1号金地·碣石庄园二期21栋2单元11层01室
- 代理机构: 武汉集源知识产权代理事务所(普通合伙)
- 代理人: 刘勇
- 主分类号: G06V20/62
- IPC分类号: G06V20/62 ; G06V10/26 ; G06V10/25 ; G06V10/40 ; G06V10/80 ; G06V10/764 ; G06V10/82 ; G06N3/0464 ; G06N3/0455 ; G06N3/09
摘要:
本发明公开了一种密集场景文本检测与识别方法,包括:获取公共数据集以及密集文本图像数据集;建立基于词长感知Transformer的深度学习网络模型,采用所述公共数据集对所述深度学习网络模型进行预训练,以生成初始识别模型;采用所述密集文本图像数据集对所述初始识别模型进行训练,以优化所述初始识别模型后,生成密集场景文本检测和识别协同模型;获取待识别密集场景文本图像,将所述待识别密集场景文本图像输入至所述密集场景文本检测和识别协同模型中,以得到识别结果。本发明解决了现有技术中密集场景文本检测与识别方法准确度低、容易出现漏检误检的技术问题。
公开/授权文献:
- CN117218641A 一种密集场景文本检测与识别方法 公开/授权日:2023-12-12