
基本信息:
- 专利标题: 可微分二值化文本检测模型的训练方法及装置
- 申请号:CN202311545939.1 申请日:2023-11-17
- 公开(公告)号:CN117523582A 公开(公告)日:2024-02-06
- 发明人: 朱建宝 , 俞鑫春 , 邓伟超 , 钱晓亮 , 赵家琨 , 马青山 , 陈宇 , 张才智 , 叶超 , 孙根森 , 陈鹏 , 曹雯佳 , 葛春燕 , 孙建军 , 施烨
- 申请人: 国网江苏省电力有限公司南通供电分公司
- 申请人地址: 江苏省南通市青年中路52号
- 专利权人: 国网江苏省电力有限公司南通供电分公司
- 当前专利权人: 国网江苏省电力有限公司南通供电分公司
- 当前专利权人地址: 江苏省南通市青年中路52号
- 代理机构: 镇江至睿专利代理事务所
- 代理人: 王恒静
- 主分类号: G06V30/19
- IPC分类号: G06V30/19 ; G06V30/162 ; G06V30/18 ; G06V10/82 ; G06N3/0464 ; G06N3/09
摘要:
本发明公开了一种可微分二值化文本检测模型的训练方法及装置、可微分二值化文本检测模型、文本检测方法、设备及介质,训练方法包括:将文本图像训练数据输入待训练模型获取基本特征图并进行预测,获取概率图和阈值图并进行可微分二值化处理获取初始近似二值图;将初始近似二值图进行Full卷积处理获取近似二值图;基于近似二值图获得预测结果;根据预测结果与文本图像训练数据计算待训练模型的损失函数;根据损失函数调整待训练模型,获得可微分二值化文本检测模型;其中,损失函数对应的监督信号根据文本图像训练数据确定。本发明采用人工标注后的文本区域作为监督训练数据,能够获得更好的文本检测模型,从而提升文本检测精度。