Introduction to Deep Compression

ディープラーニングの最新動向
圧縮技術編①　Deep Compression
2017/1/5
株式会社ウェブファーマー
大政　孝充

今回取り上げるのはこれ
[1] S. Han, et al.”Deep Compression: Compressing Deep
Neural Networks with Pruning, Trained Quantization and
Huffman Coding.”ICLR 2016 - Best Paper Award.
Deep Neural Networkのパラメータ容量を３段階の圧縮技術
を用いて大幅に縮減した！

解説のポイント
①取り組んだ課題とは
②手法の説明
　１）Pruning
　２）Quantization
　３）Haffman Encoding
③結果どうなった？

Deep Learningはパラメータ容量が巨大なので
こんなに不便
●問題１：巨大過ぎてAppStoreなどで扱えない
コンピュータ
で学習
数百MB

Deep Learningはパラメータ容量が巨大なので
こんなに不便
●問題２：モバイルのバッテリーを大量消費する
すぐに電池がなくなる
数百MB
そもそもメモリ上に
展開できない

よってモバイル向けに容量を減らしたい！
コンピュータ
で学習
数百MB
数十MB？
数MB？

手法全体の流れ
第１段階
Pruning
第２段階
Quantization
第３段階
Huffman Encoding

圧縮第１段階：Pruning（切り詰める）
普通に学習した後、閾値を超えないような小さな値の
重みを削減する。
・
・
・
・
・
・
・
・
・
・
・
・
0.0008
0.007
・
・
・
・
・
・
・
・
・
・
・
・
0.001
これで１０分の１とかにする

圧縮第２段階：Quantization（量子化）
まず、似た重み同士でまとめる
この例の場合、１６個の重みを４種類にまとめる

まとめ方は、k-means法を用いる argmin
C
w −Ci
2
w∈Ci
∑
i=1
k
∑
４種類のクラスタにまとまった。

求まった重みを初期値としてFine-Tuningする
back propagationはクラスタごとの勾配を求める
∂L
∂Ck
=
∂L
∂Wij
∂Wij
∂Cki, j
∑ =
∂L
∂Wij
Ι Iij = k( )
i, j
∑ ：indicator function Ι ⋅( )

第２段階全体図

圧縮第３段階：Haffman Encoding（ハフマン符号化）
Haffman Encodingを用いてさらに容量を減らす
重みの値１
1.0
00
重みの値２
2.0
01
重みの値３
3.0
10
例）
1.0
00
1.0
00
3.0
10
2.0
01
2.0
01
2.0
01
2.0
01
14 bits
よく出現する数字には短い bit をあて、
余り出現しない数字には長い bit をあてる
1.0
10
1.0
10
3.0
110
2.0
0
2.0
0
2.0
0
2.0
0
11 bits

いろいろなモデルの圧縮率
LeNetで４０分の１、AlexNetで３５分の１、VGGNetで
はなんと、49分の１！

いろいろなモデルのスピード増加率
どのモデルにおいても、のきなみ早くなっている

いろいろなモデルの電力消費削減率
どのモデルにおいても、のきなみ電力が削減されてい
る

結論
l  LeNet、AlexNet、VGGNetいずれにおいてもパラ
メータの容量を大幅に削減できた
l  結果、速度の大幅な上昇、および電力消費の大幅
な削減が達成できた
l  このしくみにより、Deep Learningがモバイルでも使
用できそうだ！

Introduction to Deep Compression

More Related Content

What's hot

Viewers also liked

More from WEBFARMER. ltd.

Recently uploaded

Introduction to Deep Compression