AI Engineering from Scratch: 선형대수부터 자율 에이전트 스웜까지, 230개 이상의 실습 과정으로 구성된 오픈소스 AI 엔지니어링 커리큘럼

AI Engineering from Scratch 소개

AI 엔지니어링을 제대로 배우고 싶은데 어디서 시작해야 할지 막막한 분들이 많습니다. 시중에는 수많은 AI 관련 강의와 자료들이 있지만, 대부분 특정 분야(NLP 또는 비전 또는 에이전트)에만 집중하거나, Python 하나만 다루거나, 영상 시청과 이론 학습에 그쳐 실제로 무언가를 만들어 본 경험을 쌓기 어렵습니다. AI Engineering from Scratch는 이런 한계를 넘어서기 위해 설계된 오픈소스 커리큘럼입니다.

AI Engineering from Scratch는 선형대수와 확률론 같은 수학 기초부터 시작하여, 고전적인 머신러닝, 딥러닝, 자연어 처리, 컴퓨터 비전, 음성 처리, 트랜스포머 아키텍처, 대규모 언어 모델(LLM), 자율 에이전트, 멀티 에이전트 스웜까지 AI 엔지니어링의 전 영역을 20개 단계, 230개 이상의 실습 과정으로 체계적으로 다룹니다. Python만 사용하는 것이 아니라, TypeScript, Rust, Julia까지 다양한 언어를 사용하며, 각 레슨은 단순한 이론 설명에 그치지 않고 직접 동작하는 코드와 노트북, 문서, 그리고 재사용 가능한 결과물(프롬프트, 스킬, 에이전트, MCP 서버)을 생산합니다.

rohitg00가 개발 및 공개한 이 프로젝트는 "배우고(Learn it), 만들고(Build it), 다른 사람들을 위해 공유하라(Ship it for others)"라는 모토 아래 운영됩니다. 특히, MIT 라이선스로 오픈소스 공개되어 있어 누구나 무료로 활용하고 기여할 수 있습니다.

다른 AI 강의/교재와의 비교

AI Engineering from Scratch는 기존의 AI 학습 자료들과 여러 면에서 차별화됩니다.

항목 기타 강의/교재 AI Engineering from Scratch
범위 한 분야(NLP 또는 비전 또는 에이전트) 전 영역: 수학, ML, DL, NLP, 비전, 음성, 트랜스포머, LLM, 에이전트, 스웜
언어 Python만 Python, TypeScript, Rust, Julia
결과물 "뭔가 배웠어요" 프롬프트, 스킬, 에이전트의 포트폴리오
깊이 피상적이거나 이론 과잉 직접 구현 후 프레임워크 사용
형식 영상 또는 문서 실행 가능한 코드 + 노트북 + 문서 + 웹 앱

이 커리큘럼의 핵심 철학은 "프레임워크를 사용하기 전에 직접 구현"입니다. 예를 들어 신경망을 배울 때, NumPy로 역전파를 직접 구현한 후에야 PyTorch나 TensorFlow를 사용합니다. 이를 통해 도구의 내부 동작 원리를 깊이 이해하면서도 실제 현장에서 쓰이는 프레임워크 활용 능력까지 동시에 갖출 수 있습니다.

AI Engineering from Scratch의 강의 구성

Phase 0: 설정 및 도구 (12개 레슨)

AI 개발을 위한 환경을 갖추는 단계입니다: 개발 환경 구성, Git과 협업, GPU 설정 및 클라우드, API 키 관리, Jupyter 노트북, Python 환경, Docker, 에디터 설정, 데이터 관리, 터미널과 쉘, Linux 기초, 디버깅과 프로파일링을 다룹니다. 각 레슨은 Python, Node.js, Rust 등 실제 언어로 작성된 실행 가능한 코드를 포함합니다.

Phase 1: 수학 기초 (22개 레슨)

모든 AI 알고리즘의 직관적 이해를 코드로 쌓는 단계입니다. 선형대수 직관, 벡터와 행렬 연산, 행렬 변환과 고유값, 미적분학(도함수·그래디언트), 연쇄 법칙과 자동 미분, 확률과 분포, 베이즈 정리, 최적화(그래디언트 디센트 계열), 정보 이론(엔트로피, KL 다이버전스), 차원 축소(PCA, t-SNE, UMAP), SVD, 텐서 연산, 수치 안정성, 노름과 거리, 통계, 샘플링, 선형 시스템, 볼록 최적화, 복소수, 푸리에 변환, 그래프 이론, 확률 과정까지 망라합니다. Python과 Julia로 구현합니다.

Phase 2–5: ML 기초, 신경망, 딥러닝, 컴퓨터 비전

고전적인 머신러닝(회귀, 분류, 클러스터링, 앙상블 등)부터 신경망의 기초, CNN·RNN·LSTM·어텐션 메커니즘 같은 딥러닝 아키텍처, 그리고 컴퓨터 비전의 핵심 기법들을 체계적으로 학습합니다. 고전 ML은 "여전히 대부분의 프로덕션 AI의 근간"이라고 설명하며, 단순히 이론을 넘어 직접 구현하는 방식으로 진행됩니다.

Phase 6–9: 자연어 처리, 음성 처리, 트랜스포머, LLM

자연어 처리(NLP) 파이프라인, 음성 처리, 그리고 현대 AI의 핵심인 트랜스포머 아키텍처를 깊이 다룹니다. 이 단계에서 attention is all you need 논문의 원리를 직접 구현하고, GPT 같은 대규모 언어 모델의 내부 동작 방식을 코드로 이해합니다.

Phase 10–13: RAG, 멀티모달, 추론, 평가

검색 증강 생성(RAG), 멀티모달 AI, LLM 추론(Chain-of-Thought, ReAct 등), 그리고 AI 시스템 평가 방법론을 다룹니다. 최신 AI 시스템 구축에 필수적인 내용들입니다.

Phase 14–16: AI 에이전트, MCP, 멀티 에이전트 스웜

단일 에이전트부터 멀티 에이전트 협업, 그리고 대규모 자율 에이전트 스웜(swarm)까지 다루는 이 단계는 현재 AI 분야에서 가장 빠르게 발전하는 영역을 커버합니다. MCP(Model Context Protocol) 서버를 직접 구현하고, DAG 기반 오케스트레이션, 자기 조직화 시스템을 TypeScript와 Rust로 구현합니다.

Phase 17–18: 인프라, 프로덕션, 윤리 및 안전

AI를 실제 세계에 배포하기 위한 인프라(모델 서빙, Docker, Kubernetes, ONNX/WASM을 활용한 엣지 배포, CI/CD, A/B 테스팅)와 보안을 다루고, AI 윤리, 정렬(Alignment), 레드팀(Red Teaming), 차등 프라이버시, 해석 가능성(SHAP, Attention)까지 포괄합니다.

Phase 19: 캡스톤 프로젝트 (5개)

전체 과정을 통합하는 5개의 대형 프로젝트로 마무리합니다.

  1. 미니 GPT 및 채팅 인터페이스 구현 (Phase 1, 3, 7, 10 통합)
  2. 멀티모달 RAG 시스템 구현 (Phase 5, 11, 12, 13 통합)
  3. 자율 리서치 에이전트 구현 (Phase 14, 15, 6 통합)
  4. 멀티 에이전트 개발팀 구현 (Phase 14, 15, 16, 17 통합)
  5. 프로덕션 AI 플랫폼 구현 (전 Phase 통합)

AI Engineering from Scratch 각 레슨의 구조

모든 레슨은 다음과 같은 일관된 구조를 따릅니다.

phases/XX-phase-name/NN-lesson-name/
├── code/           실행 가능한 구현 (Python, TS, Rust, Julia)
├── notebook/       실험을 위한 Jupyter 노트북
├── docs/
│   └── en.md       레슨 문서
└── outputs/        이 레슨에서 생산된 프롬프트, 스킬, 에이전트

그리고 각 레슨은 6단계로 진행됩니다.

  1. Motto: 한 줄로 표현한 핵심 아이디어
  2. Problem: 왜 이것이 중요한가
  3. Concept: 시각적 다이어그램과 직관적 설명
  4. Build It: 처음부터 직접 구현
  5. Use It: 실제 프레임워크로 동일한 것 구현
  6. Ship It: 이 레슨에서 생산된 프롬프트, 스킬, 또는 에이전트

강좌 결과물: 재사용 가능한 툴킷

매 레슨이 끝나면 실제로 사용 가능한 결과물이 생산됩니다. 전체 과정을 마치면 다음과 같은 포트폴리오를 갖추게 됩니다.

outputs/
├── prompts/          모든 AI 태스크를 위한 프롬프트 템플릿
├── skills/           AI 코딩 에이전트용 SKILL.md 파일
├── agents/           배포 준비된 에이전트 정의
└── mcp-servers/      강좌 중 직접 구현한 MCP 서버들

이 결과물들은 SkillKit으로 설치하여 Claude Code, Cursor, 또는 다른 AI 에이전트에 바로 연결할 수 있습니다.

AI Engineering from Scratch 시작하기

필수 조건

  • 코드를 작성할 수 있을 것 (Python 또는 어떤 언어라도)
  • AI가 실제로 어떻게 동작하는지 이해하고 싶은 의지

설치 및 첫 레슨 실행

git clone https://github.com/rohitg00/ai-engineering-from-scratch.git
cd ai-engineering-from-scratch

# 환경 확인
python phases/00-setup-and-tooling/01-dev-environment/code/verify.py

# 첫 번째 실제 레슨
python phases/01-math-foundations/01-linear-algebra-intuition/code/vectors.py

커리큘럼의 진행 상황은 ROADMAP.md에서 확인할 수 있으며, 기여 방법은 CONTRIBUTING.md를 참고하세요. 팀이나 학교를 위한 포크(Fork)에 대한 안내는 FORKING.md를 확인하시기 바랍니다.

라이선스

AI Engineering from Scratch 프로젝트는 MIT License으로 공개 및 배포 되고 있습니다.

:github: AI Engineering from Scratch 프로젝트 GitHub 저장소

더 읽어보기




이 글은 GPT 모델로 정리한 글을 바탕으로 한 것으로, 원문의 내용 또는 의도와 다르게 정리된 내용이 있을 수 있습니다. 관심있는 내용이시라면 원문도 함께 참고해주세요! 읽으시면서 어색하거나 잘못된 내용을 발견하시면 덧글로 알려주시기를 부탁드립니다. :hugs:

:pytorch:파이토치 한국 사용자 모임:south_korea:이 정리한 이 글이 유용하셨나요? 회원으로 가입하시면 주요 글들을 이메일:love_letter:로 보내드립니다! (기본은 Weekly지만 Daily로 변경도 가능합니다.)

:wrapped_gift: 아래:down_right_arrow:쪽에 좋아요:+1:를 눌러주시면 새로운 소식들을 정리하고 공유하는데 힘이 됩니다~ :star_struck: