专利号CN202210616786.4 | 基于深度学习的数据智能识别提取系统、方法及介质

专利标题：基于深度学习的数据智能识别提取系统、方法及介质
申请号：CN202210616786.4 申请日：2022-06-01
公开(公告)号：CN115147841A 公开(公告)日：2022-10-04
发明人：陈锋 , 郑艳芳 , 孟宇跃 , 阮荣荣 , 孙宁
申请人：兴业银行股份有限公司杭州分行 , 陈锋 , 孙宁
申请人地址：浙江省杭州市上城区庆春路40号; ;
专利权人：兴业银行股份有限公司杭州分行,陈锋,孙宁
当前专利权人：兴业银行股份有限公司杭州分行,陈锋,孙宁
当前专利权人地址：浙江省杭州市上城区庆春路40号; ;
代理机构：上海段和段律师事务所
代理人：王丹东
主分类号： G06V30/14
IPC分类号： G06V30/14 ; G06V30/146 ; G06V30/19 ; G06V10/82 ; G06N3/04 ; G06N3/08

摘要：

本发明提供了一种基于深度学习的数据智能识别提取系统、方法及介质，包括后台服务端包含图片文字识别、表格识别和文字布局智能识别还原功能，内置负载均衡；网页端包含文字识别、表格识别、PDF识别和扫描PDF的文字对比功能；Windows 10客户端通过调用后台服务端进行图片文字识别、截图识别和PDF文档识别，所有识别功能均包含智能文字布局还原能力。本发明根据文本框在图片中的相对位置，将文本框根据相对位置转成成图论中的无向图模型，采用矩形排序与相对位置判断算法智能还原其原始文本布局；本发明对系统硬件要求较低，无需通常OCR服务所需的GPU，直接在普通个人PC上即可达到接近GPU的识别性能。

中国专利公布公告审查信息 Global Dossier Espacenet

G	物理
--G06	计算；推算；计数
----G06V	图像或视频识别或理解笔记 1.本子类涵盖：特别适用于图像或视频的模式识别或机器学习的方法或安排。 2.在本小类中，下列术语或表述的使用具有指明的含义： “模式识别”是指通过获取、预处理或提取显着特征并对这些特征或其表示进行匹配、聚类或分类，对模式进行检测、分类、认证和识别，以用于解释目的或在图像或视频中推导出某种含义； “特征提取”是指从图像或视频中得出描述性或定量的度量； “聚类”是指根据模式的（不同）相似性或接近程度对模式进行分组或分离； “分类”是指通过分配标签将对象/特征识别为属于一类对象/特征。 3.在本小类中，归入G06V20/00-G06V40/00组的主题，如果识别依赖于获取或预处理阶段的特定处理，则也分别归入G06V10/10或G06V10/20组。
------G06V30/00	字符识别；数字墨迹识别；面向文档的基于图像的模式识别
--------G06V30/10	.字符识别
----------G06V30/14	..图像采集

发明公开 CN115147841A 基于深度学习的数据智能识别提取系统、方法及介质 审中-实审

基本信息:

信息查询:

IPC结构图谱:

IPRDB

热门服务

关于我们

友情链接

联系方式