![一种基于半监督学习的电网领域实体关系抽取](/CN/2023/1/52/images/202310263248.jpg)
基本信息:
- 专利标题: 一种基于半监督学习的电网领域实体关系抽取
- 申请号:CN202310263248.6 申请日:2023-03-17
- 公开(公告)号:CN116861894A 公开(公告)日:2023-10-10
- 发明人: 刘剑青 , 赵刚 , 王凯 , 宋磊 , 李思 , 张锐 , 王明轩 , 翟丙旭 , 孙巍 , 张沛瑄 , 高欣 , 康伟
- 申请人: 国网冀北电力有限公司 , 国家电网有限公司 , 北京邮电大学
- 申请人地址: 北京市西城区枣林前街32号; ;
- 专利权人: 国网冀北电力有限公司,国家电网有限公司,北京邮电大学
- 当前专利权人: 国网冀北电力有限公司,国家电网有限公司,北京邮电大学
- 当前专利权人地址: 北京市西城区枣林前街32号; ;
- 主分类号: G06F40/279
- IPC分类号: G06F40/279 ; G06F40/30 ; G06F40/211 ; G06F18/214 ; G06F18/241 ; G06F16/35 ; G06N3/0464 ; G06N3/048 ; G06N3/084 ; G06N3/0895 ; G06N3/09
摘要:
本发明提供了一种基于半监督学习的电网领域实体关系抽取,在用于基于Seq2seq的实体关系抽取的基础上,通过对传统的用注意力机制的方法进行关系抽取做改进,加入了半监督学习,能够充分挖掘大规模无标注电力文本中蕴含的实体知识,实现更高效的领域迁移,减少人工语料的标注,缓解自然语言处理NLP研究时由于标注语料工作带来的人工和时间的压力,降低了数据标注工作耗费的人力时间成本;同时我们引入了多粒度掩码预训练语言模型ERNIE应用在实体关系抽取任务上,用于捕获实体级别的语义信息,更有效的挖掘无标注数据中的实体识别知识,提升电力实体识别性能,从而更好完成电网领域实体关系抽取任务。
IPC结构图谱:
G06F40/279 | 文字实体的识别 |