強化学習 (第 2 版)(キョウカガクシュウダイニハン)
- 著者:
- R. Sutton/A. Barto/奥村 エルネスト 純/鈴木 雅大/松尾 豊/三上 貞芳(リチャードサットン/アンドリューバート/オクムラエルネストジュン/スズキ マサヒロ/マツオ ユタカ/ミカミ サダヨシ)
- 出版社:
- 森北出版
- 出版日:
- 2022年11月01日頃
- ISBN:
- 9784627826625
- 価格:
- ¥6,600
- 在庫:
- 1
- 判型:
- 単行本
書籍紹介
不朽の名著、待望の改訂版!
強化学習発展の立役者自らが書き下ろした書。「強化学習の考え方とアルゴリズムを明確に簡潔に説明する」という第 1 版の特長はそのままに、第 2 版では、発展的手法や心理学・神経科学との関係の紹介が大幅に加筆されています。
第 I 部では、テーブル形式の範囲でできるだけ多くの強化学習を扱い、核となる考え方を単純な設定で進めます。第 II 部では、そうした考え方を関数近似に拡張します。第 III 部では、心理学・神経科学との関係、 AlphaGo などのケーススタディ、将来展望について述べています。
ますます重要性を増す強化学習について、基礎から応用までを学べる一冊です。
[原著] Reinforcement Learning, Second Edition: An Introduction (The MIT Press, 2018)
***
「第 1 版は、強化学習の学習者には必読の教科書となっています。刊行から 20 年の時間が経ち、 AlphaGo などの新しい技術も出てきました。こうした新しい話題をカバーしながら、基礎からしっかりと説明がされているのが、この改訂版です。……強化学習の分野もまだまだこれから大きく発展していくと考えられますが、本書は、現時点で、この分野を学ぶための最もわかりやすく整理された教科書だと思います。」
ーー東京大学教授・松尾 豊 (監訳者序文より)
第 1 章 序
第 I 部 テーブル形式の解法
第 2 章 多腕バンディット問題
第 3 章 有限マルコフ決定過程
第 4 章 動的計画法
第 5 章 モンテカルロ法
第 6 章 TD 学習
第 7 章 n ステップ・ブートストラップ法
第 8 章 テーブル形式手法におけるプランニングと学習
第 II 部 近似による解法
第 9 章 近似を用いた方策オン型予測
第 10 章 関数近似を用いた方策オン型制御
第 11 章 近似を用いた方策オフ型手法
第 12 章 適格度トレース
第 13 章 方策勾配法
第 III 部 さらに深く
第 14 章 心理学
第 15 章 神経科学
第 16 章 応用と事例紹介
第 17 章 強化学習のこれから
言及 Qiita 記事 (3 件)
この本に興味がある方におすすめ
この本に関連
関連記事
機械学習・AI 本ガイド - エンジニアが読むべき技術書の選び方
機械学習の基礎から実践まで学べる技術書の選び方を紹介。数学が苦手な人向けの学習ルートと、ML 本の賞味期限の見極め方を解説します。
技術書の速読術 - 必要な情報を素早く見つける読み方
技術書の速読は「文字を速く読む」ことではなく「読まなくていい部分を見極めて飛ばす」こと。目的別の読み方と速読の 5 ステップを紹介します。
技術書の「訳者あとがき」にだけ書かれている秘密
翻訳書の末尾にある「訳者あとがき」を読み飛ばしていませんか。訳者が原著にはない独自の視点や補足情報を書いている、隠れた価値あるセクションの魅力を紹介します。