g-kentei-kei

Web教科書

潜在的ディリクレ配分法(LDA)

潜在的ディリクレ配分法 (LDA: Latent Dirichlet Allocation) 解説 潜在的ディリクレ配分法(LDA)とは、トピックモデル(文書の話題分析)における最も代表的な手法です。2003年にDavid Bleiらによっ...
Web教科書

主成分分析(PCA)

主成分分析 (PCA: Principal Component Analysis) 解説 主成分分析(PCA)とは、たくさんの変数(次元)を持つデータを、情報の損失をできるだけ抑えつつ、少ない変数(次元)に要約する「次元削減」の手法です。 ...
Web教科書

次元削減

次元削減(Dimensionality Reduction) 解説 次元削減とは、データが持っている情報の損失をできるだけ抑えながら、変数(特徴量)の数を減らしてデータを要約する手法です。 例えば、「身長」「体重」「座高」「足のサイズ」……...
Web教科書

コンテンツベースフィルタリング

コンテンツベースフィルタリング (Content-Based Filtering) 解説 コンテンツベースフィルタリング(内容ベースフィルタリング)とは、商品やコンテンツそのものが持つ「属性(特徴)」を分析し、ユーザーが過去に好んだものと似...
Web教科書

コールドスタート問題

コールドスタート問題 (Cold Start Problem) 解説 コールドスタート問題とは、レコメンドシステムにおいて、新規ユーザーや新規アイテムの情報(履歴データ)が不足しているために、適切な推薦ができなくなる問題のことです。 「初対...
Web教科書

クラスタリング

クラスタリング(Clustering) 1. 解説 クラスタリング(クラスター分析)とは、データの中から「似ているもの同士」を自動的に集めてグループ分け(クラスター化)する手法です。 最大の特徴は、正解データ(「これはAです」というラベル)...
Web教科書

協調フィルタリング

協調フィルタリング (Collaborative Filtering) 解説 協調フィルタリングとは、多くのユーザーの行動履歴(購入、評価、閲覧など)を蓄積・分析し、「好みが似ているユーザーは、他の商品に対する評価も似ているだろう」という前...
Web教科書

ウォード法

ウォード法(Ward’s Method) 解説 ウォード法は、「階層的クラスタリング」の中で最も一般的で、精度が良いとされる手法です。 k-means法のように最初からグループを決めるのとは異なり、最初は「バラバラのデータ」からスタートし、...
Web教科書

t-SNE

t-SNE (t-Distributed Stochastic Neighbor Embedding) 解説 t-SNE(ティー・スニー)とは、高次元データを2次元や3次元に圧縮し、人間が目で見て分かるように可視化するための「非線形」な次元...
Web教科書

k-means 法

k-means 法(k-means clustering) 1. 解説 k-means 法(k平均法)は、教師なし学習における「非階層的クラスタリング」の代表的なアルゴリズムです。 データを「あらかじめ決めた k 個のグループ(クラスター)...