Web教科書

協調フィルタリング

協調フィルタリング (Collaborative Filtering)

解説

協調フィルタリングとは、多くのユーザーの行動履歴(購入、評価、閲覧など)を蓄積・分析し、「好みが似ているユーザーは、他の商品に対する評価も似ているだろう」という前提に基づいておすすめ商品を提示するレコメンデーションエンジンの手法です。

「みんなの意見」を参考にする

例えば、AさんとBさんが過去に同じ映画(『スター・ウォーズ』と『ハリー・ポッター』)を高評価していたとします。
もしAさんが『マトリックス』も高評価していれば、まだ見ていないBさんにも「あなたと好みが似ているAさんが高評価しているから、きっと『マトリックス』も好きなはずだ」と推薦します。

2つのアプローチ

  • ユーザーベース:「似ているユーザー」を探して、その人が好きなものを勧める(上記例)。
  • アイテムベース:「一緒に買われることが多い商品」を探して、そのセットを勧める(例:「この商品を買った人はこんな商品も買っています」)。Amazonはこちらが主流です。

弱点:コールドスタート問題

協調フィルタリングの最大の弱点は、「データがないと何もできない」ことです。
新規ユーザーや、発売直後の新商品は、誰も評価していないため、「誰と似ているか」が計算できず、おすすめに表示されません。これをコールドスタート問題と呼びます。


G検定対策

出題ポイント

  • 仕組み:ユーザーの「行動履歴(購買・評価)」のみを利用する。(商品の内容自体は見ていない)。
  • 長所:意外な商品(セレンディピティ)が見つかる可能性がある。
  • 短所:
    • コールドスタート問題:新規ユーザー・新規アイテムに対応できない。
    • スパーシティ(疎性)問題:データがスカスカだと精度が出ない。

よくあるひっかけ問題

  • × 協調フィルタリングは、商品の属性(ジャンルや監督名など)を分析して推薦する
    (解説)それはコンテンツベースフィルタリングの説明です。協調フィルタリングは「誰が何を買ったか」という履歴データだけを見ます。
  • × 新規ユーザーに対しても、登録直後から高精度な推薦ができる
    (解説)履歴がないため無理です(コールドスタート問題)。これに対応するには、初回アンケートや、人気ランキングなどを併用する必要があります。
タイトルとURLをコピーしました