大規模言語モデル入門 2 〜生成型 LLM の実装と評価(ダイキボゲンゴモデルニュウモンツーセイセイガタエルエルエムノジッソウトヒョウカ)

Name: 大規模言語モデル入門2〜生成型LLMの実装と評価
Rating: 4 (1 reviews)
Author: 山田 育矢/鈴木 正敏/西川 荘介/藤井 一喜/山田 康輔/李 凌寒
ISBN: 9784297143930

著者:: 山田育矢/鈴木正敏/西川荘介/藤井一喜/山田康輔/李凌寒(ヤマダイクヤ/スズキマサトシ/ニシカワソウスケ/フジイカズキ/ヤマダコウスケ/リリョウカン)
出版社:: 技術評論社
出版日:: 2024年09月04日頃
ISBN:: 9784297143930
在庫:: 在庫あり

★★★★☆4(1 件)

中級者向け

LLM自然言語処理機械学習深層学習生成モデルモデル評価並列処理分散処理RAG指示チューニング

Amazon で見る楽天ブックスで見る

なぜ注目されているか

総合

28位

3 件の言及

言及数

616位

書籍紹介

「大規模言語モデル入門」の続編です。「大規模言語モデル入門」は理論と実装のバランスをとって構成しましたが、本書では実装部分で扱い切れなかった話題を取り上げ、特に大規模言語モデルの評価と生成 LLM に関連する解説を充実させます。「大規模言語モデル入門」の 9 章に続き、 10 章から始まります。

10 章では、後続する章で行う言語モデルの評価方法について解説します。自動評価と人手評価の 2 つの側面から、ベンチマーク、評価指標、具体的な評価ツールやデータセットなどを取り上げます。 11 から 13 章では、主に大規模言語モデルの性能を上げるためのトピックとして、指示チューニング、人間のフィードバックからの学習、 RAG に焦点を当て、それぞれの実装方法、利用するデータセット、評価の方法について解説します。 14 章では大規模言語モデルの学習における並列・分散処理について詳しく解説します。大規模なデータを限られた計算資源で学習させるノウハウは多くのエンジニアにとって有益な情報となるでしょう。

大規模言語モデルの性能を高めるための各トピックの実装とともに、それぞれの評価について理解できる一冊です。

技書の森解説

大規模言語モデル (LLM) を API 経由で呼ぶだけでなく、自分でファインチューニングし、その出力を定量的に評価したい。本書はそうした「使う側から作る側へ踏み込む」ための技術書です。前著『大規模言語モデル入門』が Transformer の基礎と BERT 系モデルの活用を扱ったのに対し、本書は生成型 LLM に焦点を絞り、事前学習・指示チューニング・ RLHF といった訓練パイプラインの実装と、 BLEU ・ ROUGE や人間評価を含む評価手法を体系的に解説します。

著者らが公開しているモデルとデータセット (Hugging Face 上) を手元で動かしながら読む構成のため、理論の説明だけで終わらず実装と結果を結びつけて理解できます。前提として Python と PyTorch の基本操作、そして Transformer のアーキテクチャに関する基礎的な理解が求められます。

LLM を取り巻く技術は動きが速い領域ですが、本書が扱う訓練手法と評価の枠組みは生成モデルの品質をコントロールする上での基盤であり、特定のフレームワークのバージョンが変わっても残り続ける種類の知識です。 API 利用の先へ進みたいエンジニアにとって、実装力を一段上げるための手引きになります。