R ユーザのための tidymodels[実践]入門〜モダンな統計・機械学習モデリングの世界
- 著者:
- 松村 優哉/瓜生 真也/吉村 広志
- 出版社:
- 技術評論社
- 出版日:
- 2023年01月06日
- ISBN:
- 9784297132361
- 価格:
- ¥2,992
- 在庫:
- 1
- 判型:
- 単行本
書籍紹介
R には多くの分析手法を実行するパッケージが提供されていますが、同じ用途であってもパッケージごとに関数の記法が違ったり、データの入力形式や出力形式が違ったりするため、データの前処理やモデルの評価といった工程におけるコーディングは、意識しなければバラバラになってしまいます。また、これが原因でスムーズな分析パイプラインを作成できず、分析環境で行ったモデリングを本番システムへ移行することを考えると、その保守は困難を極めます。 これらの問題を解消するために開発され、統一的なインターフェースを提供するのが tidymodels です。データ整形における同様のコーディングの問題を解決するためのパッケージ群で知られる tidyverse のプロジェクトの 1 つとして注目を浴びています。 データ分析の工程には、データ準備、モデルの作成、モデルの評価、モデルの改善、モデルの運用といった一連の工程があります。本書ではそれぞれの工程を tidymodels パッケージ群で行う方法について解説します。 tidymodels パッケージ群を利用することで、スムーズなデータ分析パイプラインを効率的に構築できるようになるでしょう。 tidymodels とは 本書の特徴 本書の構成 本書の対象読者 本書で解説しなかったこと 本書のサポートページ ようこそ tidymodels の世界へ 第 1 章 データの準備 ■ 1-1 データ分割とリサンプリング法 ■ 1-2 rsample パッケージによるデータ分割のアプローチ ■ 1-3 無作為抽出によるデータ分割が不適切なケースへの対応 ■ 1-4 リサンプリング法 ■ 1-5 recipes パッケージによる前処理 ■ 1-6 まとめと参考文献 第 2 章 回帰モデルの作成 ■ 2-1 stats パッケージによる線形回帰モデルの作成 ■ 2-2 parsnip パッケージによる線形回帰モデルの作成 ■ 2-3 parsnip パッケージの便利な機能 ■ 2-4 yardstick パッケージによるモデルの評価 ■ 2-5 まとめと参考文献 第 3 章 分類モデルの作成 ■ 3-1 分類モデルとは ■ 3-2 parsnip パッケージの predict () 関数の扱い方 ■ 3-3 parsnip パッケージによる分類モデルの作成 ■ 3-4 yardstick パッケージによる離散値の評価指標 ■ 3-5 yardstick パッケージによる連続的な確率に対する評価指標 ■ 3-6 まとめと参考文献 第 4 章 モデルの運用 ■ 4-1 workflows パッケージによるレシピやモデル、データの変更 ■ 4-2 workflowsets パッケージによる複数レシピ・モデルの一元管理 ■ 4-3 まとめと参考文献 第 5 章 ハイパーパラメータチューニング ■ 5-1 ハイパーパラメータチューニングの流れ ■ 5-2 ハイパーパラメータチューニングの手法 ■ 5-3 tune パッケージによるハイパーパラメータチューニング ■ 5-4 まとめと参考文献 第 6 章 自然言語処理を使った tidymodels 実践 ■ 6-1 データと形態素解析器 MeCab の準備 ■ 6-2 tidymodels によるモデリング ■ 6-3 まとめと参考文献