大規模言語モデル入門

Name: 大規模言語モデル入門
ISBN: 9784297136338

山田育矢, 鈴木正敏, 山田康輔, 李凌寒

技術評論社

プログラミングAILLM

この本について

GPT・BERTに代表される大規模言語モデルの仕組みと活用法を、日本語で体系的に解説した技術書。Transformerアーキテクチャの基礎から、事前学習、ファインチューニング、RLHF、プロンプトエンジニアリングまで網羅。LLMの「中で何が起きているか」を理解したいエンジニアにとっての必読書。

Transformerアーキテクチャの詳解事前学習とファインチューニングRLHF・プロンプトエンジニアリングGPT・BERTの仕組みを日本語で解説

LLMの仕組みを技術的に理解したいエンジニア・研究者

提供