
基本信息:
- 专利标题: 一种街景文字识别方法、系统、设备和介质
- 申请号:CN202211024989.0 申请日:2022-08-25
- 公开(公告)号:CN115376118B 公开(公告)日:2025-05-30
- 发明人: 叶武剑 , 袁凯奕 , 劳俊明 , 刘怡俊
- 申请人: 广东工业大学
- 申请人地址: 广东省广州市越秀区东风东路729号大院
- 专利权人: 广东工业大学
- 当前专利权人: 广东工业大学
- 当前专利权人地址: 广东省广州市越秀区东风东路729号大院
- 代理机构: 北京集佳知识产权代理有限公司
- 代理人: 周伟
- 主分类号: G06V20/62
- IPC分类号: G06V20/62 ; G06V30/148 ; G06V30/19 ; G06V30/162 ; G06V30/18 ; G06V10/26 ; G06V10/80 ; G06V10/28 ; G06V10/44 ; G06V10/82 ; G06N3/045 ; G06N3/044 ; G06N3/0464
摘要:
本发明公开了一种街景文字识别方法、系统、设备和介质,当接收到街景图像时,通过预设的轻量级实例分割模型对街景图像进行检测识别,并分割街景图像,对分割出来的初始文本区域进行投影转换,得到中间文本区域。通过预设的场景文本检测模型对中间文本区域进行文本区域检测,确定场景文本特征所在的目标文本区域,接着通过预设的文本识别模型识别目标文本区域内的目标字符,确定街景图像对应的图像文字。通过轻量级实例分割模型将图片中的非文本区域剔除,通过对投影转换,将图片中的扭曲、畸变等干扰因素去除,再结合场景文本检测模型和文本识别模型进行识别,不仅识别效率快,且识别准确率高。
公开/授权文献:
- CN115376118A 一种街景文字识别方法、系统、设备和介质 公开/授权日:2022-11-22