データ拡張(Data Augmentation)とは?
一言で言うと、「手持ちのデータを加工して、擬似的にデータを水増しする技術」です。
AI(ディープラーニング)は、学習データが少ないと、教科書を丸暗記するように答えだけを覚えてしまう「過学習」を起こしやすくなります。そこで、元の画像やデータに少し変化を加えることで、「似ているけどちょっと違うデータ」を大量に作り出し、AIに多様なパターンを学習させて賢くします。
代表的な手法(画像の例)
初心者がイメージしやすい、代表的な5つのテクニックを紹介します。
1. 反転(Flip)
画像を左右(または上下)にひっくり返します。
例:右向きの猫を、左向きの猫にする。
2. 回転(Rotation)
画像を少し傾けます。
例:真正面の犬の写真を、少し首を傾げた角度にする。
3. 拡大・縮小・トリミング(Scaling / Crop)
被写体をズームしたり、一部だけ切り取ったりします。
例:全身写っている写真から、顔の部分だけを切り出す。
4. 色調変換(Color Jitter)
明るさ、コントラスト、色相を変えます。
例:晴れの日の写真を、夕方っぽく少し暗くする。
5. ノイズ付加(Noise Injection)
画像にザラザラしたノイズ(雑音)を混ぜます。
例:画質の悪いカメラで撮ったように加工する。

G検定対策
データ拡張のメリットと注意点
- メリット:データ集めの大変さを減らしつつ、AIの汎化性能(未知のデータに対する強さ)を高めることができます。
- 注意点:「数字の6を回転させて9にする」ような、データの意味が変わってしまう加工はNGです。
