
基本信息:
- 专利标题: 一种热词提取方法及装置
- 申请号:CN202111235555.0 申请日:2021-10-22
- 公开(公告)号:CN113988053A 公开(公告)日:2022-01-28
- 发明人: 宗国浩 , 冯伟华 , 王锐 , 王永胜 , 王迪 , 刘亚丽 , 胡斌 , 郑新章
- 申请人: 中国烟草总公司郑州烟草研究院
- 申请人地址: 河南省郑州市高新区枫杨街2号
- 专利权人: 中国烟草总公司郑州烟草研究院
- 当前专利权人: 中国烟草总公司郑州烟草研究院
- 当前专利权人地址: 河南省郑州市高新区枫杨街2号
- 代理机构: 郑州睿信知识产权代理有限公司
- 代理人: 史萌杨
- 主分类号: G06F40/216
- IPC分类号: G06F40/216 ; G06F40/242 ; G06F40/284 ; G06F40/289 ; G06Q50/00
摘要:
本发明属于软科学技术领域,具体涉及一种热词提取方法及装置。该方法首先获取所有候选词,统计各个候选词在不同时间段内出现的频率数据;对于每个候选词,按照时间顺序对频率数据进行排序得到原始序列,按照频率大小关系对频率数据进行排序得到排序序列;进而计算每个候选词的增长量能和重排损失,以计算得到每个候选词的热度,从中挑选出热度高的候选词作为热词。该方法热词提取精准度较高;而且,该方法基于排序序列进行分析,排除了噪声性波动的干扰,进一步提升了热词提取的准确性;另外,该方法不依赖任何数据集,对参数不敏感,普适性较高。
公开/授权文献:
- CN113988053B 一种热词提取方法及装置 公开/授权日:2025-02-18
IPC结构图谱:
G06F40/216 | 使用统计方法 |