
基本信息:
- 专利标题: 一种面向大规模数据的自适应最近邻查询方法
- 申请号:CN201811298577.X 申请日:2018-11-02
- 公开(公告)号:CN109634952B 公开(公告)日:2021-08-17
- 发明人: 任艳多 , 钱江波 , 孙瑶 , 胡伟
- 申请人: 宁波大学
- 申请人地址: 浙江省宁波市江北区风华路818号
- 专利权人: 宁波大学
- 当前专利权人: 本溪钢铁(集团)信息自动化有限责任公司
- 当前专利权人地址: 117000 辽宁省本溪市平山区广裕路130号
- 代理机构: 宁波奥圣专利代理有限公司
- 代理人: 程天鹏
- 主分类号: G06F16/22
- IPC分类号: G06F16/22 ; G06F16/2458
摘要:
本发明公开了一种面向大规模数据的自适应最近邻查询方法,特点是首先获取包含多个原始大规模数据的数据集并给定查询点,通过包含k次AND操作和L次OR操作的局部敏感哈希方法将原始数据集构造成若干个子数据集,然后学习得到与每个子数据集对应的哈希编码,然后将所有哈希编码按序排列得到所有子数据集的编码索引,再获取查询点在每个子数据集下的查找表,接下来获取查询点在对应的子数据集下的候选集并融合,得到对给定的查询点的最近邻查询结果;这种子数据集的构造方式能更好地挖掘数据集分布的信息,最大限度地降低了编码的冗余,提升了对给定的查询点的最近邻查询过程的查询精度和查询效率。
公开/授权文献:
- CN109634952A 一种面向大规模数据的自适应最近邻查询方法 公开/授权日:2019-04-16
IPC结构图谱:
G | 物理 |
--G06 | 计算;推算;计数 |
----G06F | 电数字数据处理 |
------G06F16/00 | 信息检索;数据库结构;文件系统结构 |
--------G06F16/10 | .文件系统;文件服务器 |
----------G06F16/22 | ..索引;数据结构;存储结构 |