強化学習(キョウカガクシュウ)
- 著者:
- 森村 哲郎(モリムラ テツロウ)
- 出版社:
- 講談社
- 出版日:
- 2019年05月23日頃
- ISBN:
- 9784065155912
- 価格:
- ¥3,300
- シリーズ:
- 機械学習プロフェッショナルシリーズ
- 在庫:
- 1
- 判型:
- 全集・双書
書籍紹介
理論は裏切らない
・強化学習で必要になる数理を広くカバーした。
・一貫したていねいな解説なので、じっくり読める。付録・参考文献も充実!
・ベルマン方程式、 TD 学習、方策勾配、 POMDP 、深層強化学習をより深く!
【おもな内容】
第 1 章 準備
1.1 強化学習とは
1.2 マルコフ決定過程と逐次的意思決定問題
1.3 方策
1.4 逐次的意思決定問題の定式化
第 2 章 プランニング
2.1 準備
2.2 動的計画法
2.3 動的計画法による解法
2.4 線形計画法による解法
第 3 章 探索と活用のトレードオフ
3.1 概要
3.2 探索と活用のトレードオフ
3.3 方策モデル
第 4 章 モデルフリー型の強化学習
4.1 データにもとづく意思決定
4.2 価値関数の推定
4.3 方策と行動価値関数の学習
4.4 収束性
4.5 アクター・クリティック法
第 5 章 モデルベース型の強化学習
5.1 問題設定の整理
5.2 環境推定
5.3 ブラックボックス生成モデルに対するプランニング
5.4 オンラインのモデルベース型強化学習
第 6 章 関数近似を用いた強化学習
6.1 概要
6.2 価値関数の関数近似
6.3 方策の関数近似
第 7 章 部分観測マルコフ決定過程
7.1 部分観測マルコフ決定過程 (POMDP) の基礎
7.2 POMDP のプランニング
7.3 POMDP の学習
第 8 章 最近の話題
8.1 分布強化学習
8.2 深層強化学習
付録 A 補足
A.1 証明
A.2 ノルム
A.3 線形計画法
A.4 自然勾配法の補足
準備
プランニング
探索と活用のトレードオフ
モデルフリー型の強化学習
モデルベース型の強化学習
関数近似を用いた強化学習
部分観測マルコフ決定過程
最近の話題
言及の推移
言及 Qiita 記事 (9 件)
データサイエンスにオススメの本80冊!
♡ 255Python, SQL, 機械学習, 統計学, データサイエンス# ざっくりとした強化学習手法の分類
♡ 3機械学習, Python3, 強化学習, ReinforcementLearning【無料公開】モバイルシステム技術検定2級(第11版対応)本番形式のオリジナル問題と解説
♡ 1モバイル, 資格, 学習方法, 合格体験記, モバイルシステム技術検定マルチエージェントAI特集① COMAアルゴリズム
♡ 1深層強化学習, マルチエージェント深層強化学習, マルチエージェント【文系合格者が解説】G検定の強化学習を完全攻略|Q学習・DQN・AlphaGoまで一気にわかる
♡ 0DeepLearning, AI, 資格, G検定, JDLA【ChatGPT・NotebookLM活用】文系でもできるG検定AI勉強法5選|プロンプト例つき
♡ 0DeepLearning, AI, 資格, G検定, JDLAAnthropicの全貌!OpenAI安全チームの逆襲を徹底解説
♡ 0AI, VOICEVOX, きなこもっちー, テック解説, キャラクター解説Anthropicの全貌!OpenAI安全チームの逆襲を徹底解説
♡ 0OpenAI, Anthropic, Claude, AI安全性, 機械的解釈可能性Constitutional AIとは?AIが自分で自分を教育する革命的技術を解説
♡ 0RLHF, Anthropic, Claude, AI安全性, RLAIF
言及 Zenn 記事 (7 件)
深層強化学習のための物理シミュレーション環境構築(PyBullet)
♡ 29python, tensorflow, 深層強化学習, pybullet2020年のKaggle強化学習コンペティションとか強化学習フレームワークをざっと紹介
♡ 29kaggle, 強化学習強化学習アルゴリズムの色々な分類
♡ 23機械学習, 強化学習, 深層学習, アルゴリズム, 理論強化学習で能力は“創発”するのか? - RLスケール則の現在地(2025)
♡ 22強化学習, llm, physicalai実装から始めるはじめての強化学習
♡ 6ai, python, 強化学習, 人工知能深層強化学習を用いたロボット制御
♡ 1ai, ロボット, 深層強化学習, 制御工学, ppoDouble DQNで深層強化学習
♡ 1ai, python, 強化学習