
基本信息:
- 专利标题: 一种基于深度强化学习模型的数据清洗方法及装置
- 申请号:CN202010128327.2 申请日:2020-02-28
- 公开(公告)号:CN113326689A 公开(公告)日:2021-08-31
- 发明人: 张学君 , 林格平 , 万辛 , 沈亮 , 宁珊 , 颜永红
- 申请人: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
- 申请人地址: 北京市海淀区北四环西路21号;
- 专利权人: 中国科学院声学研究所,国家计算机网络与信息安全管理中心
- 当前专利权人: 中国科学院声学研究所,国家计算机网络与信息安全管理中心
- 当前专利权人地址: 北京市海淀区北四环西路21号;
- 代理机构: 北京方安思达知识产权代理有限公司
- 代理人: 陈琳琳; 杨青
- 主分类号: G06F40/205
- IPC分类号: G06F40/205 ; G06F40/211 ; G06N20/00 ; G06K9/62
摘要:
本发明属于数据通信和数据处理技术领域,具体涉及一种基于深度强化学习模型的数据清洗方法,该方法包括:获取待清洗的带标签的数据集;采用预筛选算法,删除待清洗的带标签的数据集中的无内容数据、不在标签集内的标签数据和标签矛盾的数据,获得待分类的数据集;将待分类的数据集输入至预先训练的深度强化学习模型中,获得不同类别的延迟奖励;再根据获得的不同类别的延迟奖励,依据预先训练的深度强化学习模型中的动作集合,丢弃掉有偏数据,保留有效数据,并更新状态列表S,最大化每一类别的延迟奖励值,将每一类别的最大延迟奖励值对应的带标签的训练数据集作为清洗干净的带标签的训练数据集,从而完成数据清洗。
公开/授权文献:
- CN113326689B 一种基于深度强化学习模型的数据清洗方法及装置 公开/授权日:2023-08-18
IPC结构图谱:
G06F40/205 | 解析 |