
基本信息:
- 专利标题: 一种扫描文档图文信息提取与鉴别的方法
- 申请号:CN201911326611.4 申请日:2019-12-20
- 公开(公告)号:CN111401372A 公开(公告)日:2020-07-10
- 发明人: 姚渭箐 , 李新德 , 戴俊峰 , 张成 , 黄杰 , 郭峰 , 张泉 , 肖进胜 , 熊闻心 , 杨天
- 申请人: 国家电网有限公司 , 国网湖北省电力有限公司信息通信公司
- 申请人地址: 北京市西城区西长安街86号
- 专利权人: 国家电网有限公司,国网湖北省电力有限公司信息通信公司
- 当前专利权人: 国家电网有限公司,国网湖北省电力有限公司信息通信公司
- 当前专利权人地址: 北京市西城区西长安街86号
- 代理机构: 湖北武汉永嘉专利代理有限公司
- 代理人: 张惠玲
- 主分类号: G06K9/34
- IPC分类号: G06K9/34 ; G06K9/32 ; G06K9/40 ; G06K9/44
摘要:
本发明涉及一种扫描文档图文信息提取与鉴别的方法,该方法包括以下步骤:1)将扫描的文档图像进行预处理,并将预处理后图像进行版面分割,选出包括但不限于签名、印章;2)将1)提取的签名经过预处理,采用OTSU算法去除背景后,输入到Writer-Dependent网络中提取其特征值,再输入至使用真实签名训练得到的SVM分类器中,得到该签名的真伪性;3)将1)提取的印章经过预处理后进行极坐标转化,使得印章内部的环形文字展开为横向排列文字,将展开后的文字输入到CPTN+CRNN网络中依次进行提取和识别,输出印章的文字内容;4)判断该文档的有效性。本发明能够代替人工对文档进行分析与判断。
公开/授权文献:
- CN111401372B 一种扫描文档图文信息提取与鉴别的方法 公开/授权日:2024-04-16
IPC结构图谱:
G | 物理 |
--G06 | 计算;推算;计数 |
----G06K | 数据识别;数据表示;记录载体;记录载体的处理 |
------G06K9/00 | 用于阅读或识别印刷或书写字符或者用于识别图形,例如,指纹的方法或装置 |
--------G06K9/20 | .图像捕获 |
----------G06K9/34 | ..在图像分布图中,相接触的或相重叠的图形的分割 |