深度別分離畳み込み(Depthwise Separable Convolution)
解説:仕事を2人に分担して「時短」する
Depthwise Separable Convolutionは、通常の畳み込み処理を「2つの単純な工程」に分解することで、計算量を劇的に減らす手法です。
通常の畳み込みは、「画像の特徴(形)を捉える」ことと、「チャンネル(色など)を混ぜ合わせる」ことを一度にまとめて行います。これは高機能ですが、計算が大変です。
そこで、この作業を以下の2段階に分けました。
分割された2つのステップ
- Depthwise Convolution(深さごとの畳み込み):
チャンネル(RGBなど)ごとに別々にフィルターをかけます。「形」だけを見ます。
(チャンネル間の混合は一切しません) - Pointwise Convolution(点ごとの畳み込み):
1×1 の畳み込みを使って、全チャンネルの情報をガチャンと結合します。「色(チャンネル)」の関係性だけを見ます。

どれくらい軽くなる?
この「分業」を行うことで、計算量は通常の畳み込みの 約 1/8 〜 1/9 にまで削減されます。
そのため、計算パワーの弱いスマートフォンやエッジデバイス向けの軽量モデル(MobileNetなど)で標準的に採用されています。
| 手法 | イメージ | 特徴 |
|---|---|---|
| 通常の畳み込み | 全員で全部やる | 精度は高いが、計算コストが重い。 |
| Depthwise Separable | 分業して効率化 | 計算量が激減する。 ※ただし、情報はわずかに欠落するため、精度は少し下がる傾向がある。 |
G検定対策
出題ポイント
- 構成:「Depthwise(空間方向)」+「Pointwise(チャンネル方向)」の2段構成であること。
- Pointwiseの正体:実体は「1×1 Convolution」であること。
- 代表モデル:Googleが開発した軽量モデル「MobileNet」で採用されている技術であること。
ひっかけ対策
- × 精度を上げるための技術である
(解説)主目的は「計算量とパラメータの削減(軽量化)」です。精度は通常の畳み込みの方が高い場合が多いです。 - × 計算量が半分になる
(解説)半分どころではなく、条件によりますが数分の一(1/8〜1/9程度)まで劇的に減ります。
