
基本信息:
- 专利标题: 一种医疗文本命名实体识别方法及系统
- 申请号:CN202111327160.3 申请日:2021-11-10
- 公开(公告)号:CN114036950B 公开(公告)日:2024-05-10
- 发明人: 薛付忠 , 胡锡峰 , 季晓康 , 陈耀祖 , 张琪 , 王永超 , 仉率杰 , 潘威 , 张健
- 申请人: 山东大学 , 济南兴腾信息科技有限公司
- 申请人地址: 山东省济南市市中区二环东路12550号;
- 专利权人: 山东大学,济南兴腾信息科技有限公司
- 当前专利权人: 山东大学,济南兴腾信息科技有限公司
- 当前专利权人地址: 山东省济南市市中区二环东路12550号;
- 代理机构: 济南圣达知识产权代理有限公司
- 代理人: 闫伟姣
- 主分类号: G06F40/295
- IPC分类号: G06F40/295 ; G06N3/0455 ; G06N3/08
摘要:
本发明公开了一种医疗文本命名实体识别方法及系统,所述方法包括以下步骤:获取待识别医疗文本;基于预训练的命名实体识别模型,对所述待识别医疗文本进行命名实体识别;其中,所述命名实体识别模型训练方法包括:获取已进行实体标注的医疗文本训练数据集,对每个训练数据均进行字符级编码、实体位置编码和实体类别编码;根据选定中文预训练模型,根据所述字符级编码及相应的实体位置编码和实体类别编码,训练得到所述命名实体识别模型。本发明通过改进实体位置编码和实体类别编码方法,能够快速高效的进行命名实体预测。
公开/授权文献:
- CN114036950A 一种医疗文本命名实体识别方法及系统 公开/授权日:2022-02-11
IPC结构图谱:
G06F40/295 | 命名实体识别 |