专利号CN202311545939.1 | 可微分二值化文本检测模型的训练方法及装置

专利标题：可微分二值化文本检测模型的训练方法及装置
申请号：CN202311545939.1 申请日：2023-11-17
公开(公告)号：CN117523582A 公开(公告)日：2024-02-06
发明人：朱建宝 , 俞鑫春 , 邓伟超 , 钱晓亮 , 赵家琨 , 马青山 , 陈宇 , 张才智 , 叶超 , 孙根森 , 陈鹏 , 曹雯佳 , 葛春燕 , 孙建军 , 施烨
申请人：国网江苏省电力有限公司南通供电分公司
申请人地址：江苏省南通市青年中路52号
专利权人：国网江苏省电力有限公司南通供电分公司
当前专利权人：国网江苏省电力有限公司南通供电分公司
当前专利权人地址：江苏省南通市青年中路52号
代理机构：镇江至睿专利代理事务所
代理人：王恒静
主分类号： G06V30/19
IPC分类号： G06V30/19 ; G06V30/162 ; G06V30/18 ; G06V10/82 ; G06N3/0464 ; G06N3/09

摘要：

本发明公开了一种可微分二值化文本检测模型的训练方法及装置、可微分二值化文本检测模型、文本检测方法、设备及介质，训练方法包括：将文本图像训练数据输入待训练模型获取基本特征图并进行预测，获取概率图和阈值图并进行可微分二值化处理获取初始近似二值图；将初始近似二值图进行Full卷积处理获取近似二值图；基于近似二值图获得预测结果；根据预测结果与文本图像训练数据计算待训练模型的损失函数；根据损失函数调整待训练模型，获得可微分二值化文本检测模型；其中，损失函数对应的监督信号根据文本图像训练数据确定。本发明采用人工标注后的文本区域作为监督训练数据，能够获得更好的文本检测模型，从而提升文本检测精度。

中国专利公布公告审查信息 Global Dossier Espacenet

G	物理
--G06	计算；推算；计数
----G06V	图像或视频识别或理解笔记 1.本子类涵盖：特别适用于图像或视频的模式识别或机器学习的方法或安排。 2.在本小类中，下列术语或表述的使用具有指明的含义： “模式识别”是指通过获取、预处理或提取显着特征并对这些特征或其表示进行匹配、聚类或分类，对模式进行检测、分类、认证和识别，以用于解释目的或在图像或视频中推导出某种含义； “特征提取”是指从图像或视频中得出描述性或定量的度量； “聚类”是指根据模式的（不同）相似性或接近程度对模式进行分组或分离； “分类”是指通过分配标签将对象/特征识别为属于一类对象/特征。 3.在本小类中，归入G06V20/00-G06V40/00组的主题，如果识别依赖于获取或预处理阶段的特定处理，则也分别归入G06V10/10或G06V10/20组。
------G06V30/00	字符识别；数字墨迹识别；面向文档的基于图像的模式识别
--------G06V30/10	.字符识别
----------G06V30/19	..使用电子方式识别

发明公开 CN117523582A 可微分二值化文本检测模型的训练方法及装置 审中-实审

基本信息:

信息查询:

IPC结构图谱:

IPRDB

热门服务

关于我们

友情链接

联系方式