
基本信息:
- 专利标题: 基于深度学习的数据智能识别提取系统、方法及介质
- 申请号:CN202210616786.4 申请日:2022-06-01
- 公开(公告)号:CN115147841A 公开(公告)日:2022-10-04
- 发明人: 陈锋 , 郑艳芳 , 孟宇跃 , 阮荣荣 , 孙宁
- 申请人: 兴业银行股份有限公司杭州分行 , 陈锋 , 孙宁
- 申请人地址: 浙江省杭州市上城区庆春路40号; ;
- 专利权人: 兴业银行股份有限公司杭州分行,陈锋,孙宁
- 当前专利权人: 兴业银行股份有限公司杭州分行,陈锋,孙宁
- 当前专利权人地址: 浙江省杭州市上城区庆春路40号; ;
- 代理机构: 上海段和段律师事务所
- 代理人: 王丹东
- 主分类号: G06V30/14
- IPC分类号: G06V30/14 ; G06V30/146 ; G06V30/19 ; G06V10/82 ; G06N3/04 ; G06N3/08
摘要:
本发明提供了一种基于深度学习的数据智能识别提取系统、方法及介质,包括后台服务端包含图片文字识别、表格识别和文字布局智能识别还原功能,内置负载均衡;网页端包含文字识别、表格识别、PDF识别和扫描PDF的文字对比功能;Windows 10客户端通过调用后台服务端进行图片文字识别、截图识别和PDF文档识别,所有识别功能均包含智能文字布局还原能力。本发明根据文本框在图片中的相对位置,将文本框根据相对位置转成成图论中的无向图模型,采用矩形排序与相对位置判断算法智能还原其原始文本布局;本发明对系统硬件要求较低,无需通常OCR服务所需的GPU,直接在普通个人PC上即可达到接近GPU的识别性能。