![一种图像中目标文本智能识别方法及系统](/CN/2021/1/83/images/202110417894.jpg)
基本信息:
- 专利标题: 一种图像中目标文本智能识别方法及系统
- 申请号:CN202110417894.4 申请日:2021-04-19
- 公开(公告)号:CN112990220A 公开(公告)日:2021-06-18
- 发明人: 段东圣 , 王海洋 , 佟玲玲 , 时磊 , 井雅琪 , 段运强 , 任博雅 , 李真 , 张旋 , 宋吉锋 , 王丽萍
- 申请人: 烟台中科网络技术研究所 , 国家计算机网络与信息安全管理中心
- 申请人地址: 山东省烟台市高新区蓝海路1号;
- 专利权人: 烟台中科网络技术研究所,国家计算机网络与信息安全管理中心
- 当前专利权人: 烟台中科网络技术研究所,国家计算机网络与信息安全管理中心
- 当前专利权人地址: 山东省烟台市高新区蓝海路1号;
- 代理机构: 烟台上禾知识产权代理事务所
- 代理人: 张亚平
- 主分类号: G06K9/34
- IPC分类号: G06K9/34 ; G06K9/62 ; G06N3/04 ; G06N3/08
摘要:
本发明涉及人工智能技术领域,特别涉及一种图像中目标文本智能识别方法。该方法步骤如下:将目标文本由像素点坐标表示,输入目标文本像素点坐标值对像素坐标识别神经网络进行训练,获得文本自编码模型和目标文本的表述特征;根据区域的高度值计算背景区域数量,提取覆盖背景区域,剩余区域为前景区域;利用训练好的文本自编码模型在前景区域中获得待识别的文本的表述特征,将文本的表述特征与期望的目标文本的表述特征进行对比判断,若两者误差达到预设阈值,则识别文字为目标文本。本发明还提供一种图像中目标文本智能识别系统。本发明通过基于文本自编码模型来识别目标文本,能够精准定位目标文本在图像中的位置,计算复杂度低,识别准确率高。
公开/授权文献:
- CN112990220B 一种图像中目标文本智能识别方法及系统 公开/授权日:2022-08-05
IPC结构图谱:
G | 物理 |
--G06 | 计算;推算;计数 |
----G06K | 数据识别;数据表示;记录载体;记录载体的处理 |
------G06K9/00 | 用于阅读或识别印刷或书写字符或者用于识别图形,例如,指纹的方法或装置 |
--------G06K9/20 | .图像捕获 |
----------G06K9/34 | ..在图像分布图中,相接触的或相重叠的图形的分割 |