協調フィルタリング (Collaborative Filtering)
解説
協調フィルタリングとは、多くのユーザーの行動履歴(購入、評価、閲覧など)を蓄積・分析し、「好みが似ているユーザーは、他の商品に対する評価も似ているだろう」という前提に基づいておすすめ商品を提示するレコメンデーションエンジンの手法です。
「みんなの意見」を参考にする
例えば、AさんとBさんが過去に同じ映画(『スター・ウォーズ』と『ハリー・ポッター』)を高評価していたとします。
もしAさんが『マトリックス』も高評価していれば、まだ見ていないBさんにも「あなたと好みが似ているAさんが高評価しているから、きっと『マトリックス』も好きなはずだ」と推薦します。

2つのアプローチ
- ユーザーベース:「似ているユーザー」を探して、その人が好きなものを勧める(上記例)。
- アイテムベース:「一緒に買われることが多い商品」を探して、そのセットを勧める(例:「この商品を買った人はこんな商品も買っています」)。Amazonはこちらが主流です。
弱点:コールドスタート問題
協調フィルタリングの最大の弱点は、「データがないと何もできない」ことです。
新規ユーザーや、発売直後の新商品は、誰も評価していないため、「誰と似ているか」が計算できず、おすすめに表示されません。これを「コールドスタート問題」と呼びます。
G検定対策
出題ポイント
- 仕組み:ユーザーの「行動履歴(購買・評価)」のみを利用する。(商品の内容自体は見ていない)。
- 長所:意外な商品(セレンディピティ)が見つかる可能性がある。
- 短所:
- コールドスタート問題:新規ユーザー・新規アイテムに対応できない。
- スパーシティ(疎性)問題:データがスカスカだと精度が出ない。
よくあるひっかけ問題
- × 協調フィルタリングは、商品の属性(ジャンルや監督名など)を分析して推薦する
(解説)それは「コンテンツベースフィルタリング」の説明です。協調フィルタリングは「誰が何を買ったか」という履歴データだけを見ます。 - × 新規ユーザーに対しても、登録直後から高精度な推薦ができる
(解説)履歴がないため無理です(コールドスタート問題)。これに対応するには、初回アンケートや、人気ランキングなどを併用する必要があります。
