コンテンツベースフィルタリング (Content-Based Filtering)
解説
コンテンツベースフィルタリング(内容ベースフィルタリング)とは、商品やコンテンツそのものが持つ「属性(特徴)」を分析し、ユーザーが過去に好んだものと似た属性を持つものを推薦する手法です。

「中身」を見ておすすめする
例えば、映画のレコメンドで考えてみましょう。
- 協調フィルタリング:「Aさんが見た映画をBさんも見ているから…」と、他人の行動を参考にする。
- コンテンツベース:「あなたが『スター・ウォーズ』(SF・アクション・ハリソンフォード出演)を高評価したから、同じ『SFジャンル』や『ハリソン・フォード出演作』をおすすめします」と、映画の中身(コンテンツ)を分析する。
このように、アイテムの特徴(テキスト、画像、メタデータなど)と、ユーザーの好み(プロファイル)を照らし合わせるのが特徴です。
メリットとデメリット
- メリット:
- アイテムのコールドスタートに強い:新商品が出ても、その商品の「属性」さえ登録されていればすぐにおすすめできる(誰かが買うのを待つ必要がない)。
- 他人のデータが不要なため、マイナーな商品でも推薦できる。
- デメリット:
- セレンディピティ(意外性)が低い:「アクション映画ばかり見る人には、永遠にアクション映画しか勧められない」というように、似たようなものばかりが表示され、新しい発見(セレンディピティ)が起きにくい(過度な専門化)。
G検定対策
出題ポイント
- 仕組み:アイテムの「特徴量(属性・タグ・テキスト情報)」を利用して類似度を計算する。
- 強み:「新規アイテム(誰も評価していない商品)」でも推薦可能。
- 弱み:「意外な出会い(セレンディピティ)」が提供しにくい。
よくあるひっかけ問題
- × コンテンツベースフィルタリングは、購買履歴の似ている他人のデータを参考にする
(解説)それは「協調フィルタリング」です。コンテンツベースは「アイテム自体の特徴」を見ます。 - × コンテンツベースフィルタリングは、全くの新規ユーザー(履歴なし)にも高精度な推薦ができる
(解説)できません。ユーザーが「何を好むか」というデータ(プロファイル)がないと、照らし合わせようがないため、「ユーザーのコールドスタート問題」は依然として残ります。(※「アイテムのコールドスタート」には強いです)。
