![搜索信息的同义词扩展方法及装置](/CN/2017/1/166/images/201710833554.jpg)
基本信息:
- 专利标题: 搜索信息的同义词扩展方法及装置
- 申请号:CN201710833554.3 申请日:2017-09-15
- 公开(公告)号:CN108509474A 公开(公告)日:2018-09-07
- 发明人: 谢润泉 , 连凤宗
- 申请人: 腾讯科技(深圳)有限公司
- 申请人地址: 广东省深圳市南山区高新区科技中一路腾讯大厦35层
- 专利权人: 腾讯科技(深圳)有限公司
- 当前专利权人: 腾讯科技(深圳)有限公司
- 当前专利权人地址: 广东省深圳市南山区高新区科技中一路腾讯大厦35层
- 代理机构: 北京派特恩知识产权代理有限公司
- 代理人: 蒋雅洁; 张颖玲
- 主分类号: G06F17/30
- IPC分类号: G06F17/30 ; G06F17/27
摘要:
本发明提出一种搜索信息的同义词扩展方法及装置,其中,方法包括:对搜索信息进行切词处理,得到所述搜索信息的至少一个分词;获取分词的候选同义词集合;其中,候选同义词集合中包括分词的至少一个同义词;针对每个同义词,形成包括分词和同义词的同义词对;对同义词对进行特征提取,得到同义词对特征集合;根据特征集合对同义词对进行预测,得到同义词对预测为合理替换的目标概率;如果目标概率超出预设的阈值,则以分词和同义词形成同义词扩展项,并基于同义词扩展项搜索得到搜索结果。通过该方法,能够提高同义词替换的合理性和准确性,提高搜索结果的召回率和精度,解决现有技术中同义词替换不准确、搜索结果召回率差的技术问题。
公开/授权文献:
- CN108509474B 搜索信息的同义词扩展方法及装置 公开/授权日:2022-01-07
IPC结构图谱:
G | 物理 |
--G06 | 计算;推算;计数 |
----G06F | 电数字数据处理 |
------G06F17/00 | 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法 |
--------G06F17/30 | .信息检索;及其数据库结构 |