機械学習初心者(私)が、機械学習の初歩を学ぶ際に残した記録です。

ソースコード・Jupyter Notebook・実行環境は、GitHub 上の debimate/projects/ml/ を参照してください。記載内容の誤り(認識違い)の指摘は大歓迎です。


コンテンツ一覧

Mathematics(数学の基礎)

No.項目カテゴリ
1平均(算術平均)代表値
2中央値(メジアン)代表値
3四分位点(quantile)代表値・散らばり
4分散(バリアンス)散らばり
5標準偏差散らばり
6歪度(skewness)と log1p 変換分布の形
7カーネル密度推定(KDE)分布の可視化
8相関係数2 変数の関係

Machine Learning(評価・概念・アルゴリズム)

No.項目カテゴリ
1混同行列・偽陽性/偽陰性・閾値調整評価指標
2ROC-AUC / PR-AUC評価指標
3過学習(overfitting)学習概念
4正則化(regularization)学習概念
5交差検証(cross validation)学習概念
6ハイパーパラメータ(hyperparameter)学習概念
7標準化と特徴量スケーリング(standardization)前処理
8LogisticRegression - ロジスティック回帰教師あり
9kNN - k近傍法教師あり
10RandomForest - ランダムフォレスト教師あり
11GradientBoosting - 勾配ブースティング教師あり
12k-means - K-means/k平均法教師なし
13PCA - Principal Component Analysis教師なし

MLOps

作成中。

理解度チェック

学習で扱った判断軸を自分でも試せる形式にまとめたクイズ集。問題と折りたたみ解答で構成されており、判断軸の定着を確認したいときに使う(Claude製)。

No.項目
1機械学習の判断軸クイズ集

Notebooks

No.内容
1クレカ不正検出

プロジェクト構成

projects/ml/
├── notes/        ← このページ配下のMarkdown本体
│   ├── math/
│   ├── ml/
│   └── mlops/
├── notebooks/    ← Jupyter Notebooks
├── datasets/     ← 分析対象データ(再取得可能なので Git 非追跡)
├── scripts/      ← データセット取得スクリプト
└── pyproject.toml

前提

インストール

cd projects/ml
uv sync

データセットのダウンロード

uv run python scripts/download_datasets.py

参考文献(手元にある書籍)