大規模言語モデル入門 2 〜生成型 LLM の実装と評価(ダイキボゲンゴモデルニュウモンツーセイセイガタエルエルエムノジッソウトヒョウカ)
- 著者:
- 山田 育矢/鈴木 正敏/西川 荘介/藤井 一喜/山田 康輔/李 凌寒(ヤマダ イクヤ/スズキ マサトシ/ニシカワ ソウスケ/フジイ カズキ/ヤマダ コウスケ/リ リョウカン)
- 出版社:
- 技術評論社
- 出版日:
- 2024年09月04日頃
- ISBN:
- 9784297143930
- 在庫:
- 在庫あり
書籍紹介
「大規模言語モデル入門」の続編です。「大規模言語モデル入門」は理論と実装のバランスをとって構成しましたが、本書では実装部分で扱い切れなかった話題を取り上げ、特に大規模言語モデルの評価と生成 LLM に関連する解説を充実させます。「大規模言語モデル入門」の 9 章に続き、 10 章から始まります。
10 章では、後続する章で行う言語モデルの評価方法について解説します。自動評価と人手評価の 2 つの側面から、ベンチマーク、評価指標、具体的な評価ツールやデータセットなどを取り上げます。 11 から 13 章では、主に大規模言語モデルの性能を上げるためのトピックとして、指示チューニング、人間のフィードバックからの学習、 RAG に焦点を当て、それぞれの実装方法、利用するデータセット、評価の方法について解説します。 14 章では大規模言語モデルの学習における並列・分散処理について詳しく解説します。大規模なデータを限られた計算資源で学習させるノウハウは多くのエンジニアにとって有益な情報となるでしょう。
大規模言語モデルの性能を高めるための各トピックの実装とともに、それぞれの評価について理解できる一冊です。
技書の森解説
大規模言語モデル (LLM) を API 経由で呼ぶだけでなく、自分でファインチューニングし、その出力を定量的に評価したい。本書はそうした「使う側から作る側へ踏み込む」ための技術書です。前著『大規模言語モデル入門』が Transformer の基礎と BERT 系モデルの活用を扱ったのに対し、本書は生成型 LLM に焦点を絞り、事前学習・指示チューニング・ RLHF といった訓練パイプラインの実装と、 BLEU ・ ROUGE や人間評価を含む評価手法を体系的に解説します。
著者らが公開しているモデルとデータセット (Hugging Face 上) を手元で動かしながら読む構成のため、理論の説明だけで終わらず実装と結果を結びつけて理解できます。前提として Python と PyTorch の基本操作、そして Transformer のアーキテクチャに関する基礎的な理解が求められます。
LLM を取り巻く技術は動きが速い領域ですが、本書が扱う訓練手法と評価の枠組みは生成モデルの品質をコントロールする上での基盤であり、特定のフレームワークのバージョンが変わっても残り続ける種類の知識です。 API 利用の先へ進みたいエンジニアにとって、実装力を一段上げるための手引きになります。
言及 Qiita 記事 (2 件)
この本に興味がある方におすすめ
この本に関連
関連記事
機械学習・AI 本ガイド - エンジニアが読むべき技術書の選び方
機械学習の基礎から実践まで学べる技術書の選び方を紹介。「Python ではじめる機械学習」などのハンズオン本を軸に、数学が苦手な人向けの学習ルートと ML 本の賞味期限の見極め方を解説します。
データベース本ガイド - SQL から設計まで学べる技術書の選び方
データベースの基礎から設計、パフォーマンスチューニングまで学べる技術書の選び方と学習順序を紹介します。
技術書 1 冊分の知識で年収が 50 万円変わる計算
技術書への投資リターンを具体的な数字で試算します。1 冊 3000 円の本が、スキルアップを通じてどれだけの年収増につながりうるのか。投資対効果の観点から技術書の価値を考えます。