![基于主动学习的文本关系抽取方法、电子设备及存储介质](/CN/2023/1/138/images/202310692938.jpg)
基本信息:
- 专利标题: 基于主动学习的文本关系抽取方法、电子设备及存储介质
- 申请号:CN202310692938.3 申请日:2023-06-13
- 公开(公告)号:CN116431757B 公开(公告)日:2023-08-25
- 发明人: 袁得嵛 , 叶乃夫 , 李欣 , 孙海春 , 罗婷 , 倪培峰 , 张炜琛 , 于伟
- 申请人: 中国人民公安大学
- 申请人地址: 北京市西城区木樨地南里1号
- 专利权人: 中国人民公安大学
- 当前专利权人: 中国人民公安大学
- 当前专利权人地址: 北京市西城区木樨地南里1号
- 代理机构: 北京锺维联合知识产权代理有限公司
- 代理人: 黄利萍
- 主分类号: G06F16/31
- IPC分类号: G06F16/31 ; G06F40/216 ; G06F40/295 ; G06F40/30 ; G06N3/045 ; G06N3/0455 ; G06N3/0442 ; G06N3/0464 ; G06N3/047 ; G06N3/048 ; G06N3/091
摘要:
本发明提供了一种基于主动学习的文本关系抽取方法、电子设备和存储介质,方法包括:获取任一训练样本d中的初始实体集S0d;获取S0di的关系类别概率集P0di;获取S0di对应的分类价值V0di=ln(P01di/(P02di+σ0di)),如果V0di>0,则赋予S0di第一标签,如果V0di<0,则赋予S0di第二标签;对具有标签的训练样本d中的冗余实体进行过滤处理,得到过滤处理后的训练样本d;基于过滤处理后的H个训练样本,对初始文本关系抽取模型进行训练,得到目标文本关系抽取模型;利用所述目标文本关系抽取模型对需要抽取实体关系的文本中的实体关系进行抽取。本发明能够提高文本关系抽取的效果。
公开/授权文献:
- CN116431757A 基于主动学习的文本关系抽取方法、电子设备及存储介质 公开/授权日:2023-07-14
IPC结构图谱:
G | 物理 |
--G06 | 计算;推算;计数 |
----G06F | 电数字数据处理 |
------G06F16/00 | 信息检索;数据库结构;文件系统结构 |
--------G06F16/10 | .文件系统;文件服务器 |
----------G06F16/31 | ..索引;其数据结构;存储结构 |