
基本信息:
- 专利标题: 文本数据的多粒度树表示方法
- 申请号:CN202211703634.4 申请日:2022-12-29
- 公开(公告)号:CN116049255A 公开(公告)日:2023-05-02
- 发明人: 钱基德 , 钱基业 , 杜冬 , 孙宏 , 周超 , 徐海文 , 秦小林 , 钮益峰 , 梁琰
- 申请人: 中国民用航空飞行学院 , 国网重庆市电力公司电力科学研究院
- 申请人地址: 四川省德阳市广汉市南昌路四段46号;
- 专利权人: 中国民用航空飞行学院,国网重庆市电力公司电力科学研究院
- 当前专利权人: 中国民用航空飞行学院,国网重庆市电力公司电力科学研究院
- 当前专利权人地址: 四川省德阳市广汉市南昌路四段46号;
- 代理机构: 成都九鼎天元知识产权代理有限公司
- 代理人: 王会改
- 主分类号: G06F16/2458
- IPC分类号: G06F16/2458 ; G06F16/26 ; G06F16/28
摘要:
本发明公开了一种文本数据的多粒度树表示方法,涉及文本数据挖掘技术领域。该方法包括:获取文本数据,从文本数据中抽取候选关键词,并根据候选关键词,构建表示文本数据的多粒度树,所述多粒度树在第i层包括Ni个关键词以及Ni个关键词对应的权值,所述多粒度树的每一层包括的关键词数量的关系满足N1≥N2≥···≥NM‑2≥NM‑1≥NM,从而实现文本数据的多粒度树表示,该多粒度树可以从不同层次表示文本数据关键信息,有助于提高文本数据的利用价值。
IPC结构图谱:
G | 物理 |
--G06 | 计算;推算;计数 |
----G06F | 电数字数据处理 |
------G06F16/00 | 信息检索;数据库结构;文件系统结构 |
--------G06F16/10 | .文件系统;文件服务器 |
----------G06F16/24 | ..查询 |
------------G06F16/245 | ...查询过程 |
--------------G06F16/2458 | ....特殊类型的查询,例如统计查询、模糊查询或分布式查询 |