![数据排重方法、装置、设备及介质](/CN/2023/1/187/images/202310937656.jpg)
基本信息:
- 专利标题: 数据排重方法、装置、设备及介质
- 申请号:CN202310937656.5 申请日:2023-07-27
- 公开(公告)号:CN117033358A 公开(公告)日:2023-11-10
- 发明人: 杜江涛 , 方省 , 曹家 , 罗引 , 王磊
- 申请人: 北京中科闻歌科技股份有限公司
- 申请人地址: 北京市海淀区北四环西路9号楼银谷大厦7层0715室
- 专利权人: 北京中科闻歌科技股份有限公司
- 当前专利权人: 北京中科闻歌科技股份有限公司
- 当前专利权人地址: 北京市海淀区北四环西路9号楼银谷大厦7层0715室
- 代理机构: 北京开阳星知识产权代理有限公司
- 代理人: 张子青
- 主分类号: G06F16/215
- IPC分类号: G06F16/215
摘要:
本公开涉及一种数据排重方法、装置、设备及介质。其中,数据排重方法包括:获取待排重数据以及待排重数据对应的标识信息,标识信息包括待排重数据对应的第一指纹键;基于标识信息确定待排重数据对应的目标存储区域,目标存储区域对应有预设实例,预设实例用于对目标存储区域执行数据写入操作和/或数据读取操作;基于预设实例执行数据读取操作,得到目标存储区域中的目标存储数据,基于目标存储数据确定待排重数据是否存在,根据本公开实施例,能够提高数据排重的效率和准确率。
IPC结构图谱:
G | 物理 |
--G06 | 计算;推算;计数 |
----G06F | 电数字数据处理 |
------G06F16/00 | 信息检索;数据库结构;文件系统结构 |
--------G06F16/10 | .文件系统;文件服务器 |
----------G06F16/21 | ..数据库设计、管理或维护 |
------------G06F16/215 | ...提高数据质量;数据清理,例如重复数据消除、删除无效条目或更正排版错误 |