Web教科書

Web教科書

ブートストラップサンプリング

ブートストラップサンプリング (Bootstrap Sampling) 解説 ブートストラップサンプリングとは、統計学や機械学習において、元のデータセット(サイズN)から、「重複を許して(復元抽出)」ランダムにN個のデータを抽出して新しいデ...
Web教科書

ランダムフォレスト

ランダムフォレスト (Random Forest) 解説 ランダムフォレストは、複数の「決定木」を組み合わせる(アンサンブル学習)ことで、単体の決定木よりも高い精度と汎化性能を実現する機械学習アルゴリズムです。 最強のバギング手法 ランダム...
Web教科書

ブースティング

ブースティング (Boosting) 解説 ブースティングとは、アンサンブル学習(複数のモデルを組み合わせる手法)の一つで、複数の「弱学習器(Weak Learner)」を「逐次的(直列)」に学習させ、前のモデルの失敗を次のモデルが修正して...
Web教科書

AdaBoost

AdaBoost (Adaptive Boosting) 解説 AdaBoost(エイダブースト)は、1995年にYoav FreundとRobert Schapireによって提案された、ブースティング(アンサンブル学習)の代表的なアルゴリ...
Web教科書

自己回帰モデル(AR)

自己回帰モデル (AR: Autoregressive model) 解説 自己回帰モデル(ARモデル)とは、時系列データにおいて「現在の値は、過去の自分自身の値(ラグ)によって決まる」と仮定して予測を行うモデルです。 「昨日のことは、今日...
Web教科書

VARモデル

VARモデル (Vector AutoRegression: ベクトル自己回帰モデル) 解説 VARモデル(ベクトル自己回帰モデル)とは、1つの変数だけでなく、複数の時系列変数を同時に扱い、お互いの影響関係(相互依存)を分析するモデルです。...
Web教科書

ロジスティック回帰

ロジスティック回帰(Logistic Regression) 1. 解説 ロジスティック回帰は、名前に「回帰」とついていますが、実際には「分類問題」(特に二値分類)に使われる代表的なアルゴリズムです。ここがG検定で最も狙われやすいポイントで...
Web教科書

k-means 法

k-means 法(k-means clustering) 1. 解説 k-means 法(k平均法)は、教師なし学習における「非階層的クラスタリング」の代表的なアルゴリズムです。 データを「あらかじめ決めた k 個のグループ(クラスター)...
Web教科書

t-SNE

t-SNE (t-Distributed Stochastic Neighbor Embedding) 解説 t-SNE(ティー・スニー)とは、高次元データを2次元や3次元に圧縮し、人間が目で見て分かるように可視化するための「非線形」な次元...
Web教科書

ウォード法

ウォード法(Ward’s Method) 解説 ウォード法は、「階層的クラスタリング」の中で最も一般的で、精度が良いとされる手法です。 k-means法のように最初からグループを決めるのとは異なり、最初は「バラバラのデータ」からスタートし、...