Web教科書

データ拡張

データ拡張(Data Augmentation)とは?

一言で言うと、「手持ちのデータを加工して、擬似的にデータを水増しする技術」です。

AI(ディープラーニング)は、学習データが少ないと、教科書を丸暗記するように答えだけを覚えてしまう過学習を起こしやすくなります。そこで、元の画像やデータに少し変化を加えることで、「似ているけどちょっと違うデータ」を大量に作り出し、AIに多様なパターンを学習させて賢くします。

代表的な手法(画像の例)

初心者がイメージしやすい、代表的な5つのテクニックを紹介します。

1. 反転(Flip)

画像を左右(または上下)にひっくり返します。
例:右向きの猫を、左向きの猫にする。

2. 回転(Rotation)

画像を少し傾けます。
例:真正面の犬の写真を、少し首を傾げた角度にする。

3. 拡大・縮小・トリミング(Scaling / Crop)

被写体をズームしたり、一部だけ切り取ったりします。
例:全身写っている写真から、顔の部分だけを切り出す。

4. 色調変換(Color Jitter)

明るさ、コントラスト、色相を変えます。
例:晴れの日の写真を、夕方っぽく少し暗くする。

5. ノイズ付加(Noise Injection)

画像にザラザラしたノイズ(雑音)を混ぜます。
例:画質の悪いカメラで撮ったように加工する。

G検定対策

データ拡張のメリットと注意点

  • メリット:データ集めの大変さを減らしつつ、AIの汎化性能(未知のデータに対する強さ)を高めることができます。
  • 注意点:「数字の6を回転させて9にする」ような、データの意味が変わってしまう加工はNGです。
タイトルとURLをコピーしました