scikit-learn データ分析実装ハンドブック(サイキットラーンデータブンセキジッソウハンドブック)
- 著者:
- 毛利拓也/北川廣野/澤田千代子/谷一徳(モウリタクヤ/キタガワコヤ/サワダチヨコ/タニカズノリ)
- 出版社:
- 秀和システム
- 出版日:
- 2019年11月15日頃
- ISBN:
- 9784798055428
- 在庫:
- 在庫あり
書籍紹介
実データに合わせて最適な予測モデルを作ることのできる Python ライブラリの scikit-learn 解説書です。本書は他の実装本とは異なり、アルゴリズムの解説に敢えて数式を採用し、実装で指定するハイパーパラメータと数式の関係が分かるよう工夫しました。また、ハイパーパラメータの値を増減し、そのときの予測の変化も紙面が許す限り記載しました。本書は不動産価格の予測やワイン品種の分類で使用する典型的なデータセットだけでなく、より実践的なデータ分析が学べるよう、タイタニック、気温、 MovieLens のデータセットを採用しています。これらのデータセットを用いて、前処理から予測モデル作成までの分析例を実例で紹介します。
第 1 章 機械学習とは何か
1.1 機械学習とは何か
1.2 機械学習の種類
第 2 章 scikit-learn と開発環境
2.1 scikit-learn とは
2.2 scikit-learn のセットアップ
2.3 scikit-learn による機械学習の基本的な実装
2.4 アルゴリズムチートシート
第 3 章 回帰
3.1 回帰のアルゴリズム
3.2 線形回帰
3.3 線形回帰の正則化
3.4 線形回帰の確率的勾配降下法
3.5 線形サポートベクトル回帰
3.6 ガウスカーネルのサポートベクトル回帰
3.7 ランダムフォレスト回帰
第 4 章 分類
4.1 分類のアルゴリズム
4.2 ロジスティック回帰
4.3 線形サポートベクトル分類
4.4 ガウスカーネルのサポートベクトル分類
4.5 ランダムフォレスト
第 5 章 クラスタリング
5.1 クラスタリングのアルゴリズム
5.2 K-means
5.3 混合ガウス分布 (GMM) 、変分混合ガウス分布 (VBGMM)
第 6 章 次元削減
6.1 次元削減のアルゴリズム
6.2 主成分分析 (PCA)
6.3 カーネル PCA
第 7 章 モデルの評価
7.1 モデルの評価
第 8 章 Preprocessing 、実データ分析
8.1 はじめに
8.2 ロジスティック回帰を活用したタイタニックの予測モデルの作成
8.3 ランダムフォレストを活用した気温分析と消費の予測モデルの作成
8.4 Collaborative filtering を活用したレコメンデーションモデル
8.5 MovieLens を使ったモデル作り
第 9 章 scikit-learn API
9.1 regression (回帰)
9.2 classification (分類)
9.3 clustering (クラスタリング)
9.4 dimensionality reduction (次元削減)
言及の推移
言及 Qiita 記事 (4 件)
言及 Zenn 記事 (1 件)
この本に興味がある方におすすめ
この本に関連
毛利拓也 の他の書籍
関連記事
アルゴリズム本ガイド - 競プロだけじゃない、実務に活きる選び方
アルゴリズム本の 3 タイプと、実務でアルゴリズムの知識が活きる場面、数学が苦手な人向けの学習ルートを紹介します。
機械学習・AI 本ガイド - エンジニアが読むべき技術書の選び方
機械学習の基礎から実践まで学べる技術書の選び方を紹介。数学が苦手な人向けの学習ルートと、ML 本の賞味期限の見極め方を解説します。
データベース本ガイド - SQL から設計まで学べる技術書の選び方
データベースの基礎から設計、パフォーマンスチューニングまで学べる技術書の選び方と学習順序を紹介します。