
基本信息:
- 专利标题: 基于医保数据的单病种诊断信息快速结构化方法
- 申请号:CN201811045058.2 申请日:2018-09-07
- 公开(公告)号:CN109344250A 公开(公告)日:2019-02-15
- 发明人: 王胜锋 , 詹思延 , 许璐 , 冯菁楠 , 刘国臻 , 高培 , 王金喜 , 尉晨
- 申请人: 北京大学
- 申请人地址: 北京市海淀区颐和园路5号
- 专利权人: 北京大学
- 当前专利权人: 北京大学
- 当前专利权人地址: 北京市海淀区颐和园路5号
- 代理机构: 北京万象新悦知识产权代理有限公司
- 代理人: 黄凤茹
- 主分类号: G06F16/35
- IPC分类号: G06F16/35 ; G06F17/27 ; G16H70/00
摘要:
本发明公布了一种基于医保数据的单病种诊断信息快速结构化的方法,针对医疗大数据中的诊断信息进行结构化,构建单病种词库;包括:从医保数据库中提取诊断信息;将非结构化文本分割成多个词汇文本;将词汇文本的词性进行标注;训练词向量;正序排序,切分成相应的词集合;使用余弦距离求词之间的关联性;得到与疾病的标准表述最为相似的词表,作为标准词列表;专业人员进行计算机辅助的人工核查并多次重复。本发明方法可用来实现单病种诊断文本数据个性化的快速结构化,为充分地、高效地利用医保数据中诊断信息提供技术支持,能够极大提升数据处理与利用的效率,加快医疗大数据转化的推广应用。
公开/授权文献:
- CN109344250B 基于医保数据的单病种诊断信息快速结构化方法 公开/授权日:2021-11-19