大規模言語モデル入門
山田 育矢, 鈴木 正敏, 山田 康輔, 李 凌寒
技術評論社
プログラミングAILLM
この本について
GPT・BERTに代表される大規模言語モデルの仕組みと活用法を、日本語で体系的に解説した技術書。Transformerアーキテクチャの基礎から、事前学習、ファインチューニング、RLHF、プロンプトエンジニアリングまで網羅。LLMの「中で何が起きているか」を理解したいエンジニアにとっての必読書。
- ISBN
- 9784297136338
- 言語
- 日本語
キーコンセプト
Transformerアーキテクチャの詳解事前学習とファインチューニングRLHF・プロンプトエンジニアリングGPT・BERTの仕組みを日本語で解説
こんな人におすすめ
LLMの仕組みを技術的に理解したいエンジニア・研究者
この本を読む
提供