Web教科書

コンテンツベースフィルタリング

コンテンツベースフィルタリング (Content-Based Filtering)

解説

コンテンツベースフィルタリング(内容ベースフィルタリング)とは、商品やコンテンツそのものが持つ「属性(特徴)」を分析し、ユーザーが過去に好んだものと似た属性を持つものを推薦する手法です。

「中身」を見ておすすめする

例えば、映画のレコメンドで考えてみましょう。

  • 協調フィルタリング「Aさんが見た映画をBさんも見ているから…」と、他人の行動を参考にする。
  • コンテンツベース:「あなたが『スター・ウォーズ』(SF・アクション・ハリソンフォード出演)を高評価したから、同じ『SFジャンル』や『ハリソン・フォード出演作』をおすすめします」と、映画の中身(コンテンツ)を分析する。

このように、アイテムの特徴(テキスト、画像、メタデータなど)と、ユーザーの好み(プロファイル)を照らし合わせるのが特徴です。

メリットとデメリット

  • メリット:
    • アイテムのコールドスタートに強い:新商品が出ても、その商品の「属性」さえ登録されていればすぐにおすすめできる(誰かが買うのを待つ必要がない)。
    • 他人のデータが不要なため、マイナーな商品でも推薦できる。
  • デメリット:
    • セレンディピティ(意外性)が低い:「アクション映画ばかり見る人には、永遠にアクション映画しか勧められない」というように、似たようなものばかりが表示され、新しい発見(セレンディピティ)が起きにくい(過度な専門化)。

G検定対策

出題ポイント

  • 仕組み:アイテムの「特徴量(属性・タグ・テキスト情報)」を利用して類似度を計算する。
  • 強み:「新規アイテム(誰も評価していない商品)」でも推薦可能。
  • 弱み:「意外な出会い(セレンディピティ)」が提供しにくい。

よくあるひっかけ問題

  • × コンテンツベースフィルタリングは、購買履歴の似ている他人のデータを参考にする
    (解説)それは「協調フィルタリング」です。コンテンツベースは「アイテム自体の特徴」を見ます。
  • × コンテンツベースフィルタリングは、全くの新規ユーザー(履歴なし)にも高精度な推薦ができる
    (解説)できません。ユーザーが「何を好むか」というデータ(プロファイル)がないと、照らし合わせようがないため、「ユーザーのコールドスタート問題」は依然として残ります。(※「アイテムのコールドスタート」には強いです)。
タイトルとURLをコピーしました