
基本信息:
- 专利标题: 一种建立财税优惠政策的信息抽取模型的方法和系统
- 申请号:CN202111639139.7 申请日:2021-12-29
- 公开(公告)号:CN114444483B 公开(公告)日:2025-07-25
- 发明人: 王亚平 , 林文辉 , 王志刚 , 刘振宇 , 杨硕 , 马兰 , 李瑞祥
- 申请人: 航天信息股份有限公司
- 申请人地址: 北京市海淀区杏石口路甲18号
- 专利权人: 航天信息股份有限公司
- 当前专利权人: 航天信息股份有限公司
- 当前专利权人地址: 北京市海淀区杏石口路甲18号
- 代理机构: 北京工信联合知识产权代理有限公司
- 代理人: 刘海蓉
- 主分类号: G06F40/279
- IPC分类号: G06F40/279 ; G06N3/045 ; G06N3/08 ; G06N3/0464 ; G06Q40/12
摘要:
本发明实施例公开了一种建立财税优惠政策的信息抽取模型的方法和系统,所述方法包括:获取第一标注数据集,根据第一标注数据集生成最优第一层级信息抽取模型;获取第二标注数据集,根据第二标注数据集生成最优第二层级信息抽取模型,以及将最优第一层级信息抽取模型和最优第二层级信息抽取模型的组合作为财税优惠政策的信息抽取模型,其中,最优第一层级信息抽取模型和最优第二层级信息抽取模型都是经过微调的Bert base后接CRF层。所述方法和系统通过为财税优惠政策信息的抽取设计一种双层级的Bert+CRF模型,有效解决了对信息进行识别时,由于自定义的种类多,且标注数据少带来的数据稀疏问题,有效提升了信息抽取的效率。
公开/授权文献:
- CN114444483A 一种建立财税优惠政策的信息抽取模型的方法和系统 公开/授权日:2022-05-06
IPC结构图谱:
G06F40/279 | 文字实体的识别 |