您现在的位置是：首页 > 唯美句子

AI学习_模型优化：剪枝、蒸馏、量化

作者：纳雷武时间：2024-04-17 14:18:25分类：唯美句子

简介　　文章浏览阅读2k次，点赞2次，收藏18次。模型优化：剪枝、蒸馏、量化_剪枝蒸馏

点击全文阅读

量化、剪支、蒸馏
注意：这三种方法是三选一！不能同时用
Q：为什么不能同时用？
A：技术上可以同时用，但没有必要
每一种优化（压缩）方式都会对模型精度有一定的影响，同时用更会叠加这种影响。如果精度损失过大，就得不偿失了

优化方式：剪枝

面试会问！dropout和剪枝的区别
dropout：以批次为单位，每批次随意抑制神经元（下一批次可能就不抑制了）
剪枝：完全减去参数

正则化的介绍：
https://baijiahao.baidu.com/s?id=1653085297096293714

L1正则化基础：在损失函数中增加——取参数的绝对值，让参数尽可能为0，减少网络规模
L2：在L1基础上，只使参数尽可能“变小”

剪枝分为两种：结构化剪枝/ 非结构化剪枝：
结构化剪枝:剪去的是网络层，会改变模型的结构，（对模型影响比较大）
非结构化剪枝:剪的是神经元不会改变模型的结构
【注意！有的硬件是不支持非结构化剪枝的！】

全局剪枝：只支持非L1结构化剪枝
由于是“删去加起来的总共20%权重”，所以会着重减中间的+不可控，所以不推荐
全局剪枝删权重的思路
不同剪枝的差异：
剪枝方式间的图片差异
剪枝的步骤（及其根本问题）：
每次剪枝后都要重新训练，效率极低
用的最多的是量化
剪枝步骤
查看参数变化的方法：
list( module.named_parameters() )
这个方法可以打印模型参数，也会保留原版参数