
基本信息:
- 专利标题: 基于条件互信息的特征选择方法、装置、设备和存储介质
- 申请号:CN202111021982.9 申请日:2021-09-01
- 公开(公告)号:CN113761026A 公开(公告)日:2021-12-07
- 发明人: 马晓忱 , 孙博 , 吕闫 , 李理 , 石上丘 , 罗雅迪 , 程文帅 , 郑乐 , 冷喜武 , 常乃超 , 吴迪 , 章昊 , 王吉文 , 李端超 , 叶海峰 , 刘辉 , 马金辉 , 胡海琴 , 陈伟 , 李智 , 李顺 , 朱刚刚 , 王维坤 , 樊锐轶 , 高志 , 张秀丽 , 刘志良 , 刘国瑞 , 杨旋 , 余志国 , 李英 , 孙珂 , 周明 , 李杨月 , 汪春燕
- 申请人: 中国电力科学研究院有限公司 , 国家电网有限公司 , 国网安徽省电力有限公司 , 国网河北省电力有限公司 , 国网山西省电力公司 , 国网湖北省电力有限公司
- 申请人地址: 北京市海淀区清河小营东路15号; ; ; ; ;
- 专利权人: 中国电力科学研究院有限公司,国家电网有限公司,国网安徽省电力有限公司,国网河北省电力有限公司,国网山西省电力公司,国网湖北省电力有限公司
- 当前专利权人: 中国电力科学研究院有限公司,国家电网有限公司,国网安徽省电力有限公司,国网河北省电力有限公司,国网山西省电力公司,国网湖北省电力有限公司
- 当前专利权人地址: 北京市海淀区清河小营东路15号; ; ; ; ;
- 代理机构: 北京中巡通大知识产权代理有限公司
- 代理人: 李宏德
- 主分类号: G06F16/2458
- IPC分类号: G06F16/2458 ; G06F16/28 ; G06F16/2453 ; G06K9/62
摘要:
本发明属于数据挖掘技术领域,公开一种基于条件互信息的特征选择方法、装置、设备和存储介质,所述方法包括:获取数据集合形成候选特征集F;计算候选特征集F中每个候选特征与类别属性C的互信息,将选择的特征放入特征集合S;设定阈值,进入循环,直到满足阈值;将选出的特征集合S通过分类器训练模型,并用训练好的模型预测类别,计算预测准确率;更改权重系数,重复筛选特征集合S并计算预测准确率,选出准确率最高的特征集合S作为最终的输出特征集。本发明能够更高效,更快速的进行特征选择,提高数据挖掘的精度和效率。
IPC结构图谱:
G | 物理 |
--G06 | 计算;推算;计数 |
----G06F | 电数字数据处理 |
------G06F16/00 | 信息检索;数据库结构;文件系统结构 |
--------G06F16/10 | .文件系统;文件服务器 |
----------G06F16/24 | ..查询 |
------------G06F16/245 | ...查询过程 |
--------------G06F16/2458 | ....特殊类型的查询,例如统计查询、模糊查询或分布式查询 |