ファインチューニング

ファインチューニングとは

ファインチューニング (Fine-tuning) は、大量のデータで事前学習 (Pre-training) された基盤モデルに対して、特定のタスクやドメインのデータで追加学習を行い、モデルの振る舞いを調整する手法である。

モデルの重みそのものを更新するため、プロンプトエンジニアリングや RAG では対応しきれない、文体の統一、専門用語の正確な使用、特定フォーマットの出力に効果がある。

RAG とファインチューニング vs プロンプトエンジニアリングの違いを以下にまとめる。

観点	プロンプトエンジニアリング	RAG	ファインチューニング
モデルの変更	なし	なし	重みを更新
知識の追加	プロンプト内のみ	外部 DB から検索	学習データに組み込み
コスト	低い	中 (検索インフラ)	高い (GPU 学習)
更新の容易さ	即時	ドキュメント追加で即時	再学習が必要
得意なこと	出力形式の指定	最新情報の参照	文体・トーンの統一

実務では、プロンプトエンジニアリング → RAG → ファインチューニングの順に試し、必要な精度が得られた段階で止めるのが効率的。

ファインチューニングの手法を以下にまとめる。

LoRA は元のモデルの重みを凍結し、小さなアダプター層だけを学習するため、GPU メモリと学習時間を大幅に削減できる。

AWS での実装を以下にまとめる。

サービス	用途
Bedrock Custom Model	Bedrock 上のモデルをファインチューニング
SageMaker Training	カスタムの学習ジョブを実行
SageMaker JumpStart	事前学習済みモデルをワンクリックでファインチューニング

Bedrock のカスタムモデルは、S3 に学習データ (JSONL 形式) を置くだけでファインチューニングを開始できる。

ファインチューニングの成否は学習データの品質に大きく依存する。