
基本信息:
- 专利标题: 一种基于标签分布学习的敏感数据智能识别方法
- 申请号:CN202111223201.4 申请日:2021-10-20
- 公开(公告)号:CN113962302A 公开(公告)日:2022-01-21
- 发明人: 张涛 , 石聪聪 , 于鹏飞
- 申请人: 全球能源互联网研究院有限公司 , 国家电网有限公司 , 国网辽宁省电力有限公司 , 国网辽宁省电力有限公司信息通信分公司
- 申请人地址: 北京市昌平区未来科技城滨河大道18号; ; ;
- 专利权人: 全球能源互联网研究院有限公司,国家电网有限公司,国网辽宁省电力有限公司,国网辽宁省电力有限公司信息通信分公司
- 当前专利权人: 全球能源互联网研究院有限公司,国家电网有限公司,国网辽宁省电力有限公司,国网辽宁省电力有限公司信息通信分公司
- 当前专利权人地址: 北京市昌平区未来科技城滨河大道18号; ; ;
- 代理机构: 北京三聚阳光知识产权代理有限公司
- 代理人: 李静玉
- 主分类号: G06K9/62
- IPC分类号: G06K9/62 ; G06N3/08
摘要:
本发明公开了一种基于标签分布学习的敏感数据智能识别方法,该方法包括:获取多个已知结果的训练样本;根据标签分布学习算法以及所述训练样本生成训练样本的标签分布集合;根据所述标签分布集合确定预设神经网络的参数,得到神经网络模型;根据多个已知结果的训练样本对所述神经网络模型进行迭代训练,得到敏感数据识别模型。本发明实施例提供的训练基于标签分布学习的敏感数据识别模型的方法,通过标签分布算法以及预设参数,建立神经网络模型,能够使用多个标签对被检测数据概率化描述。通过利用训练样本对神经网络模型进行训练,能够将被检测数据文档与多个敏感数据相关的标签相对应,将文档数据转化为了数学模型,便于机器识别。
IPC结构图谱:
G | 物理 |
--G06 | 计算;推算;计数 |
----G06K | 数据识别;数据表示;记录载体;记录载体的处理 |
------G06K9/00 | 用于阅读或识别印刷或书写字符或者用于识别图形,例如,指纹的方法或装置 |
--------G06K9/62 | .应用电子设备进行识别的方法或装置 |