
基本信息:
- 专利标题: 一种多源数据接入下电力数据标准化清洗方法和装置
- 申请号:CN202110094083.5 申请日:2021-01-22
- 公开(公告)号:CN112783883A 公开(公告)日:2021-05-11
- 发明人: 周立德 , 黎鸣 , 陈凤超 , 梅傲琪 , 胡润锋 , 钟志明 , 邱泽坚 , 何毅鹏 , 黄达区 , 饶欢 , 张锐 , 刘沛林 , 徐睿烽 , 鲁承波
- 申请人: 广东电网有限责任公司东莞供电局
- 申请人地址: 广东省东莞市东城区东城路239号
- 专利权人: 广东电网有限责任公司东莞供电局
- 当前专利权人: 广东电网有限责任公司东莞供电局
- 当前专利权人地址: 广东省东莞市东城区东城路239号
- 代理机构: 广州越华专利代理事务所
- 代理人: 陈岑
- 主分类号: G06F16/215
- IPC分类号: G06F16/215 ; G06F16/28 ; G06K9/62
摘要:
本发明涉及一种多源数据接入下电力数据标准化清洗方法,包括:S10、数据初步聚类处理,使用K均值算法对采集到的数据进行读取,根据数据的属性值特征对采集到的数据进行分类,S20、多源数据清洗采用聚类处理后的数据作为数据清洗的数据来源,将处理后的数据设定为数据库形式,并采用现有的数据清洗工具完成多源数据清洗工作。本发明的有益效果是:根据数据的属性值特征对采集到的数据进行分类,采用聚类处理后的数据作为数据清洗的数据来源,将处理后的数据设定为数据库形式,采用现有的数据清洗工具完成多源数据清洗工作,提高数据库数据处理结果的精确度,进而提高清洗数据的准确率。
公开/授权文献:
- CN112783883B 一种多源数据接入下数据标准化清洗方法和装置 公开/授权日:2024-09-06
IPC结构图谱:
G | 物理 |
--G06 | 计算;推算;计数 |
----G06F | 电数字数据处理 |
------G06F16/00 | 信息检索;数据库结构;文件系统结构 |
--------G06F16/10 | .文件系统;文件服务器 |
----------G06F16/21 | ..数据库设计、管理或维护 |
------------G06F16/215 | ...提高数据质量;数据清理,例如重复数据消除、删除无效条目或更正排版错误 |