レコメンデーションエンジン
解説
レコメンデーションエンジンとは、ユーザーの購買履歴や行動ログ、商品の属性データなどを分析し、そのユーザーが興味を持ちそうな商品やコンテンツを予測して提示するシステムのことです。ECサイトの「おすすめ商品」や動画配信サービスの「次に見る動画」など、現代のWebサービスには欠かせない技術です。
主に以下の3つの手法が用いられます。
1. 協調フィルタリング (Collaborative Filtering)
「あなたと行動パターンが似ているAさんは、これも買っています」というアプローチです。
ユーザーの行動履歴(購入、閲覧、評価など)の蓄積データを利用します。
- メリット:ユーザー自身も気づいていない潜在的な好み(セレンディピティ:偶然の幸運な発見)を提示できる可能性があります。
- デメリット:「コールドスタート問題」が発生します。新規ユーザーや新商品は、行動履歴(データ)がないため、適切なおすすめができません。
2. コンテンツベースフィルタリング (Content-Based Filtering)
「あなたが過去に選んだ商品と、特徴が似ている商品はこれです」というアプローチです。
商品そのものの属性(ジャンル、監督、色、テキスト内容など)を分析して推薦します。
- メリット:ユーザーの行動履歴が少なくても、好みの傾向さえ分かれば推薦できます(コールドスタート問題に比較的強い)。
- デメリット:似たような商品ばかりが推薦され、意外性(セレンディピティ)のある出会いが少なくなります。
3. ハイブリッド型 (Hybrid)
上記2つの手法を組み合わせ、互いの弱点を補完する手法です。現在の主要な動画配信サービス(Netflixなど)やECサイトの多くは、このハイブリッド型を採用しています。
G検定対策
出題ポイント
- 手法の違い:「行動履歴」を使うのが協調フィルタリング、「商品属性」を使うのがコンテンツベース。
- 重要ワード:
- コールドスタート問題:データがない初期段階では協調フィルタリングが機能しない問題。
- セレンディピティ:偶然の素晴らしい発見。協調フィルタリングの方が高い傾向にある。
- 行列分解(Matrix Factorization):協調フィルタリングの実装によく使われる計算手法。
よくあるひっかけ問題
- × 協調フィルタリングは、商品の内容(ジャンルなど)を分析して推薦する
(解説)それは「コンテンツベース」の説明です。協調フィルタリングは「ユーザーの行動」を見ます。 - × コンテンツベースフィルタリングは、コールドスタート問題の影響を全く受けない
(解説)「全く」ではありませんが、協調フィルタリングに比べれば影響は小さいです。
