![一种实体识别方法及相关装置](/CN/2023/1/290/images/202311454391.jpg)
基本信息:
- 专利标题: 一种实体识别方法及相关装置
- 申请号:CN202311454391.X 申请日:2023-11-01
- 公开(公告)号:CN117592475A 公开(公告)日:2024-02-23
- 发明人: 何东 , 陈华智 , 王红凯 , 黄宇腾 , 徐海青 , 毛冬 , 张辰 , 饶涵宇 , 陈是同 , 梁翀 , 浦正国 , 余江斌
- 申请人: 国网浙江省电力有限公司信息通信分公司 , 国网浙江省电力有限公司 , 安徽继远软件有限公司 , 国网信息通信产业集团有限公司
- 申请人地址: 浙江省杭州市黄龙路8号641室
- 专利权人: 国网浙江省电力有限公司信息通信分公司,国网浙江省电力有限公司,安徽继远软件有限公司,国网信息通信产业集团有限公司
- 当前专利权人: 国网浙江省电力有限公司信息通信分公司,国网浙江省电力有限公司,安徽继远软件有限公司,国网信息通信产业集团有限公司
- 当前专利权人地址: 浙江省杭州市黄龙路8号641室
- 代理机构: 北京集佳知识产权代理有限公司
- 代理人: 李慧引
- 主分类号: G06F40/295
- IPC分类号: G06F40/295 ; G06N3/0442 ; G06N3/08
摘要:
本发明公开了一种实体识别方法及相关装置,所述方法包括:获取待识别文本序列;基于第一编码器和第二编码器对所述待识别文本序列进行编码,得到初始向量,其中,所述第二编码器基于提取器和预设的编码规则进行编码;将所述初始向量传递给解码器进行解码,得到目标向量;将所述目标向量作为所述待识别文本序列的预测序列。上述过程中,采用第二编码器中提取器和预设编码进行编码,不再基于词典与知识库进行编码,避免了而现有的词典覆盖有限,很多语料存在缺乏对应领域的词典的情况,实体归一化后得到的文本实体的准确性低的问题。
IPC结构图谱:
G06F40/295 | 命名实体识别 |