![基于信息熵的数据筛选方法、装置和计算机可读介质](/CN/2023/1/53/images/202310267838.jpg)
基本信息:
- 专利标题: 基于信息熵的数据筛选方法、装置和计算机可读介质
- 申请号:CN202310267838.6 申请日:2023-03-13
- 公开(公告)号:CN116168363A 公开(公告)日:2023-05-26
- 发明人: 彭伟 , 赵天坤 , 刘洋 , 唐佳
- 申请人: 合众新能源汽车股份有限公司
- 申请人地址: 浙江省嘉兴市桐乡市梧桐街道同仁路988号
- 专利权人: 合众新能源汽车股份有限公司
- 当前专利权人: 合众新能源汽车股份有限公司
- 当前专利权人地址: 浙江省嘉兴市桐乡市梧桐街道同仁路988号
- 代理机构: 上海专利商标事务所有限公司
- 代理人: 杜娟
- 主分类号: G06V20/56
- IPC分类号: G06V20/56 ; G06V10/764 ; G06F18/241
摘要:
本发明涉及一种基于信息熵的数据筛选方法、装置和计算机可读介质。该方法包括:获取数据集,所述数据集中包括多个数据;根据所述多个数据的采集特征对所述多个数据进行分类;统计每个分类的概率分布,并根据每种分类的概率分布计算所述数据集的信息熵;以及当所述数据集的信息熵小于第一阈值时,调整所述数据集中的多个数据,使所述数据集的信息熵增大。本申请通过对数据进行筛选,可以增大整个数据集的信息熵,使数据集中多个分类的多个状态的分布都趋于平均,使筛选后的数据更加适于作为算法模型的训练数据,减少数据的标注成本。