Foundations of Large Language Models ๋์ ์๊ฐ
Tong Xiao์ Jingbo Zhu๊ฐ ์์ฑํ์ฌ arXiv์ ๊ณต๊ฐํ "๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ์ ๊ธฐ์ด(Foundations of Large Language Models)" ๋ผ๋ ์ ๋ชฉ์ ๋ฌธ์(๋ผ๊ธฐ์ ์์ด ๋ฐฉ๋ํด์ ๋์๋ผ๊ณ ์ง์นญํ๊ฒ ์ต๋๋ค)๋ LLM์ ๊ธฐ๋ณธ ์์น, ๊ธฐ์ , ๋ฐ์ ๋ฑ์ ๋ด์ฉ์ ๋ค๋ฃจ๊ณ ์์ต๋๋ค. ์ด ๋์๋ LLM์ ๊ฐ๋
๋ถํฐ ํ์ต(Training) ๋ฐฉ๋ฒ๋ก ๊น์ง ํฌ๊ด์ ์ผ๋ก ์ค๋ช
ํ๊ณ ์์ต๋๋ค.
Foundations of Large Language Models ๋์์ ๋ชฉ์ฐจ
1์ฅ: ์ฌ์ ํ์ต(Pre-training)
NLP ๋ชจ๋ธ์ ๊ธฐ์ด๊ฐ ๋๋ ์ฌ์ ํ์ต์ ๊ฐ๋ ๊ณผ ๋ฐฉ๋ฒ๋ก ์ ๋ค๋ฃน๋๋ค. ๋น์ง๋(Unsupervised), ์ง๋(Supervised), ์๊ธฐ์ง๋(Self-supervised) ํ์ต์ ์๋ฆฌ์ ์ฐจ์ด์ ์ ์ค๋ช ํ๋ฉฐ, BERT์ ๊ฐ์ ๋ชจ๋ธ ์ฌ๋ก๋ฅผ ํตํด ๊ตฌ์ฒด์ ์ธ ์ฌ์ ํ์ต ๊ณผ์ ๊ณผ ์์ฉ ๋ฐฉ์์ ์๊ฐํฉ๋๋ค.
- 1.1. Pre-training NLP Models (NLP ๋ชจ๋ธ์ ์ฌ์ ํ์ต)
- Unsupervised, Supervised and Self-supervised Pre-training: ๋น์ง๋, ์ง๋, ์๊ธฐ ์ง๋ ํ์ต ๋ฐฉ๋ฒ๋ก ๋ฐ ํน์ง
- Adapting Pre-trained Models: ์ฌ์ ํ์ต ๋ชจ๋ธ์ ๋ค์ํ ํ์ ์์ ์ ์ ์ํ๋ ๋ฐฉ๋ฒ
- 1.2. Self-supervised Pre-training Tasks (์๊ธฐ ์ง๋ ํ์ต ๊ณผ์ )
- Decoder-only Pre-training: ๋์ฝ๋ ์ค์ฌ ์ฌ์ ํ์ต ๋ฐฉ๋ฒ ๋ฐ ์ธ์ด ์์ฑ ๋ชจ๋ธ
- Encoder-only Pre-training: ์ธ์ฝ๋ ์ค์ฌ ์ฌ์ ํ์ต ๋ฐฉ๋ฒ ๋ฐ ํ ์คํธ ํํ ์์ฑ
- Encoder-Decoder Pre-training: ์ธ์ฝ๋-๋์ฝ๋ ๊ธฐ๋ฐ ์ฌ์ ํ์ต๊ณผ ํ์ฉ
- 1.3. Example: BERT
- The Standard Model: BERT ๋ชจ๋ธ์ ๊ตฌ์กฐ์ ํ์ต ๋ฐฉ๋ฒ
- Multilingual Models: ๋ค๊ตญ์ด ๋ชจ๋ธ ํ์ฅ๊ณผ ํจ์จ์ฑ ํฅ์
- 1.4. Applying BERT Models (BERT ๋ชจ๋ธ ์ ์ฉ)
- ์ฌ์ ํ์ต๋ BERT๋ฅผ ๋ค์ํ NLP ์์ ์ ํ์ฉํ๋ ๊ตฌ์ฒด์ ์ธ ์ฌ๋ก
2์ฅ: ์์ฑ ๋ชจ๋ธ(Generative Models)
๋ํ ์ธ์ด ๋ชจ๋ธ์ ์ฃผ์ ์ ํ์ธ ์์ฑ ๋ชจ๋ธ์ ์ค๊ณ, ํ์ต, ๊ทธ๋ฆฌ๊ณ ํ์ฅ ๊ฐ๋ฅ์ฑ์ ํ๊ตฌํฉ๋๋ค. GPT์ ๊ฐ์ ๋์ฝ๋ ์ค์ฌ ๋ชจ๋ธ๊ณผ T5 ๊ฐ์ ์ธ์ฝ๋-๋์ฝ๋ ๋ชจ๋ธ์ ๋น๊ตํ๋ฉฐ, ์ด๋ค ๋ชจ๋ธ์ ์ฅ๋ฌธ ์์ฑ ๋ฐ ๋ถ์ฐ ํ์ต ๊ธฐ์ ์ ๋ค๋ฃน๋๋ค.
- 2.1. A Brief Introduction to LLMs (๋ํ ์ธ์ด ๋ชจ๋ธ ๊ฐ์)
- Decoder-only Transformers: GPT ๋ฑ ๋์ฝ๋ ์ค์ฌ ๋ชจ๋ธ์ ๊ตฌ์กฐ์ ํน์ง
- Training LLMs: ๋ํ ์ธ์ด ๋ชจ๋ธ์ ํ์ต ๊ณผ์ ๊ณผ ๊ธฐ์
- Fine-tuning LLMs: ๋ชจ๋ธ์ ๋ฏธ์ธ ์กฐ์ ์ ํตํ ์์ ๋ณ ์ฑ๋ฅ ์ต์ ํ
- Prompting LLMs: ํ๋กฌํํธ๋ฅผ ํ์ฉํด ๋ชจ๋ธ์ ํน์ ์์ ์ ์ ์
- 2.2. Training at Scale (๋๊ท๋ชจ ํ์ต)
- Data Preparation: ๋ฐ์ดํฐ ์ค๋น ๋ฐ ์ ์ฒ๋ฆฌ ๊ณผ์
- Distributed Training: ๋ถ์ฐ ํ์ต ๊ธฐ๋ฒ๊ณผ ํจ์จ์ฑ ํฅ์
- Scaling Laws: ํ์ต ์ฑ๋ฅ๊ณผ ๋ชจ๋ธ ํฌ๊ธฐ์ ์๊ด๊ด๊ณ
- 2.3. Long Sequence Modeling (์ฅ๋ฌธ ์์ฑ)
- Efficient Architectures: ์ฅ๋ฌธ ์์ฑ์ ์ํ ํจ์จ์ ์ธ ๋ชจ๋ธ ์ํคํ ์ฒ
- Cache and Memory Management: ๋ฉ๋ชจ๋ฆฌ ๋ฐ ์บ์ฑ ์ต์ ํ ๊ธฐ๋ฒ
3์ฅ: ํ๋กฌํํธ(Prompting)
๋ํ ์ธ์ด ๋ชจ๋ธ์ ๊ฐ๋ ฅํ ์ ์๋ ฅ์ ํ์ฉํ๊ธฐ ์ํ ํ๋กฌํํธ ์ค๊ณ์ ๊ณ ๊ธ ๊ธฐ๋ฒ์ ๋ค๋ฃน๋๋ค. Zero-shot ๋ฐ Few-shot ํ์ต์ ์๋ฆฌ์ ์ค๊ณ ์ ๋ต, ๊ทธ๋ฆฌ๊ณ ๋ฌธ์ ํด๊ฒฐ์ ์ํ ๊ณ ๊ธ ํ๋กฌํํธ ๊ธฐ๋ฒ์ ์๊ฐํฉ๋๋ค.
- 3.1. General Prompt Design (์ผ๋ฐ ํ๋กฌํํธ ์ค๊ณ)
- Basics: ๊ธฐ๋ณธ ํ๋กฌํํธ ์ค๊ณ ์์น
- In-context Learning: ์์ ๋ฅผ ํ์ฉํ ํ์ต ๊ธฐ๋ฒ
- Prompt Engineering Strategies: ํจ๊ณผ์ ์ธ ํ๋กฌํํธ ์ค๊ณ ์ ๋ต
- 3.2. Advanced Prompting Methods (๊ณ ๊ธ ํ๋กฌํํธ ๊ธฐ๋ฒ)
- Chain of Thought: ๋จ๊ณ์ ๋ฌธ์ ํด๊ฒฐ์ ์ํ ํ๋กฌํํธ ์ค๊ณ
- Problem Decomposition: ๋ฌธ์ ๋ฅผ ์์ ๋จ์๋ก ๋๋๋ ๋ฐฉ๋ฒ
- RAG and Tool Use: ๊ฒ์ ๊ธฐ๋ฐ ์์ฑ๊ณผ ์ธ๋ถ ๋๊ตฌ ํ์ฉ
- 3.3. Learning to Prompt (ํ๋กฌํํธ ํ์ต)
- Prompt Optimization: ํ๋กฌํํธ ์ต์ ํ ๋ฐฉ๋ฒ
4์ฅ: ์ ๋ ฌ(Alignment)
๋ํ ์ธ์ด ๋ชจ๋ธ์ด ์ธ๊ฐ์ ๊ฐ์น์ ๊ธฐ๋์ ๋ง๋๋ก ์ ๋ ฌ์ํค๋ ๊ธฐ์ ์ ๋ค๋ฃน๋๋ค. ์ธ๊ฐ ํผ๋๋ฐฑ ๊ธฐ๋ฐ ๊ฐํ ํ์ต(RLHF)์ ๋ฐ์ดํฐ ์์ง, ๋ณด์ ๋ชจ๋ธ๋ง ๋ฑ์ ํตํด ์ฌ์ฉ์ ์ค์ฌ์ ๋ชจ๋ธ ๊ฐ์ ๋ฐฉ์์ ์ค๋ช ํฉ๋๋ค.
- 4.1. An Overview of LLM Alignment (์ ๋ ฌ ๊ฐ์)
- Instruction Alignment: ๋ช ๋ น์ด ๊ธฐ๋ฐ ์ ๋ ฌ ๋ฐฉ์
- Human Feedback Alignment: ์ธ๊ฐ ํผ๋๋ฐฑ์ ํ์ฉํ ์ ๋ ฌ
- 4.2. Improved Human Preference Alignment (ํฅ์๋ ์ ํธ๋ ์ ๋ ฌ)
- Better Reward Modeling: ๋ ๋์ ๋ณด์ ๋ชจ๋ธ ์ค๊ณ
- Direct Preference Optimization: ์ ํธ๋ ์ต์ ํ๋ฅผ ์ํ ์ง์ ํ์ต
๋ผ์ด์ ์ค
"๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ์ ๊ธฐ์ด(Foundations of Large Language Models)" ๋์๋ Creative Commons Attribution-NonCommercial 4.0 Unported License(CC BY-NC 4.0)๋ก ๋ฐฐํฌ๋๋ฉฐ, ๋น์์ ์ ์ฉ๋๋ก ์์ ๋กญ๊ฒ ํ์ฉํ ์ ์์ต๋๋ค.
๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ์ ๊ธฐ์ด ๋์
์ด ๊ธ์ GPT ๋ชจ๋ธ๋ก ์ ๋ฆฌํ ๊ธ์ ๋ฐํ์ผ๋ก ํ ๊ฒ์ผ๋ก, ์๋ฌธ์ ๋ด์ฉ ๋๋ ์๋์ ๋ค๋ฅด๊ฒ ์ ๋ฆฌ๋ ๋ด์ฉ์ด ์์ ์ ์์ต๋๋ค. ๊ด์ฌ์๋ ๋ด์ฉ์ด์๋ผ๋ฉด ์๋ฌธ๋ ํจ๊ป ์ฐธ๊ณ ํด์ฃผ์ธ์! ์ฝ์ผ์๋ฉด์ ์ด์ํ๊ฑฐ๋ ์๋ชป๋ ๋ด์ฉ์ ๋ฐ๊ฒฌํ์๋ฉด ๋ง๊ธ๋ก ์๋ ค์ฃผ์๊ธฐ๋ฅผ ๋ถํ๋๋ฆฝ๋๋ค.
ํ์ดํ ์น ํ๊ตญ ์ฌ์ฉ์ ๋ชจ์
์ด ์ ๋ฆฌํ ์ด ๊ธ์ด ์ ์ฉํ์
จ๋์? ํ์์ผ๋ก ๊ฐ์
ํ์๋ฉด ์ฃผ์ ๊ธ๋ค์ ์ด๋ฉ์ผ
๋ก ๋ณด๋ด๋๋ฆฝ๋๋ค! (๊ธฐ๋ณธ์ Weekly์ง๋ง Daily๋ก ๋ณ๊ฒฝ๋ ๊ฐ๋ฅํฉ๋๋ค.)
์๋
์ชฝ์ ์ข์์
๋ฅผ ๋๋ฌ์ฃผ์๋ฉด ์๋ก์ด ์์๋ค์ ์ ๋ฆฌํ๊ณ ๊ณต์ ํ๋๋ฐ ํ์ด ๋ฉ๋๋ค~