LogisticRegression - ロジスティック回帰

LogisticRegression(ロジスティック回帰)は、線形回帰の出力をシグモイド関数で 0〜1 の確率に押し込めることで二値分類を可能にしたモデルである。線形回帰の枠組みをほぼそのまま使いつつ、「実数の予測値」を「クラスに属する確率」に変換する点だけが異なる。名前に「回帰」と付いているが、実用上は二値分類の代表的なベースラインモデルとして使われる。 ...

2026年5月24日 · 7 min · nchika

kNN - k近傍法(k-Nearest Neighbors)

kNN(k近傍法、k-Nearest Neighbors)は、新しい点を予測するとき、訓練データの中で「その点に最も近い k 個のサンプル」を見て、多数決(分類)または平均(回帰)で答えを決める手法である。 モデルを学習で作るのではなく、訓練データをそのまま記憶しておくのが特徴。「怠惰な学習(lazy learning)」とも呼ばれる。 ...

2026年5月24日 · 3 min · nchika

RandomForest - ランダムフォレスト

RandomForest は、複数の決定木を組み合わせて予測するアンサンブル手法(Bagging)。 アンサンブル手法は、複数のモデルの出力をまとめて、単体より安定・高精度を狙う方法。 Bagging(Bootstrap Aggregating)は、ブートストラップで作った複数の学習セットで別々のモデルを学習し、予測を平均/多数決で集約する考え方。 それぞれの木は「ブートストラップサンプル」と「特徴量のランダム選択」で多様性を持たせ、分類は多数決、回帰は平均でまとめる。 ...

2026年5月24日 · 6 min · nchika

GradientBoosting - 勾配ブースティング

GradientBoosting(勾配ブースティング)は、浅い決定木のような弱い学習器を 1 本ずつ順番に足していき、前のモデルが取りこぼした「誤差(残差)」を次の木で説明させることで予測精度を高める教師あり学習の手法である。最終的な予測は、これまで足したすべての木の出力を足し合わせた加法モデル F(x) = f_1(x) + f_2(x) + ... + f_M(x) として表される。 ...

2026年5月24日 · 9 min · nchika