
基本信息:
- 专利标题: 深度神经网络模型压缩方法及装置、电子设备、存储介质
- 申请号:CN202110277868.6 申请日:2021-03-15
- 公开(公告)号:CN112861996A 公开(公告)日:2021-05-28
- 发明人: 李晶 , 郑哲 , 刘瑞 , 崔文朋 , 聂玉虎 , 池颖英 , 徐鲲鹏 , 李腾浩 , 杨玎 , 黄桂林 , 胡戈飚 , 习雨同 , 曹波
- 申请人: 北京智芯微电子科技有限公司 , 国网信息通信产业集团有限公司 , 国网江西省电力有限公司 , 国家电网有限公司
- 申请人地址: 北京市海淀区西小口路66号中关村东升科技园A区3号楼; ; ;
- 专利权人: 北京智芯微电子科技有限公司,国网信息通信产业集团有限公司,国网江西省电力有限公司,国家电网有限公司
- 当前专利权人: 北京智芯微电子科技有限公司,国网信息通信产业集团有限公司,国网江西省电力有限公司,国家电网有限公司
- 当前专利权人地址: 北京市海淀区西小口路66号中关村东升科技园A区3号楼; ; ;
- 代理机构: 北京润平知识产权代理有限公司
- 代理人: 肖冰滨; 王晓晓
- 主分类号: G06K9/62
- IPC分类号: G06K9/62 ; G06N3/08
摘要:
本发明涉及人工智能领域,提供一种深度神经网络模型压缩方法及装置。所述方法包括:针对选定的深度神经网络模型提供随机初始化参数;基于所述随机初始化参数对所述深度神经网络模型的通道进行选择;对通道选择后的深度神经网络模型进行剪枝得到裁剪后的网络模型;利用量化参数对裁剪后的网络模型进行量化得到压缩的网络模型。本发明利用随机初始化参数对网络模型结构进行剪枝,无需预训练模型,节省了预训练模型的时间成本,增加了网络模型结构的剪枝空间,保证模型精度,提升模型剪枝效率,能够快速压缩模型。
IPC结构图谱:
G | 物理 |
--G06 | 计算;推算;计数 |
----G06K | 数据识别;数据表示;记录载体;记录载体的处理 |
------G06K9/00 | 用于阅读或识别印刷或书写字符或者用于识别图形,例如,指纹的方法或装置 |
--------G06K9/62 | .应用电子设备进行识别的方法或装置 |