CMU의 Machine Learning in Production 및 AI Engineering 강의 소개
CMU(카네기 멜론 대학교)의 Machine Learning in Production (MLIP) 및 AI Engineering 강의는 머신러닝 모델을 단순히 만드는 것에서 끝나는 것이 아니라, 이를 실제 제품으로 개발하고 배포하는 전 과정에 초점을 맞춘 실무 중심의 강의입니다. 이 강의에서는 AI 엔지니어링과 MLOps의 핵심 개념을 다루며, 최신 기술과 연구를 기반으로 실무적인 경험을 제공하며, AI 시스템의 책임성(Responsible AI), 안정성(Safety), 보안(Security), 공정성(Fairness), 설명 가능성(explainability) 등과 같이 실전에서 꼭 필요한 내용들을 포함하고 있습니다. AI 시스템을 실제 서비스로 제공하려면 MLOps, 데이터 품질 관리, 지속적 배포(CD), 확장성 등 여러 요소를 고려해야 합니다. 본 강의는 이러한 내용을 깊이 있게 다루며, 최신 기술과 연구 결과를 기반으로 실제 프로덕션 환경에서 AI 시스템을 운영할 수 있는 역량을 키우는 데 중점을 둡니다.
MLIP 및 AI Engineering 강의 개요
MLIP(Machine Learning in Production) 강의(MLIP: 17-445/17-645/17-745, AI Engineering: 11-695)는 2025년 봄 학기에 개설되며, 머신러닝 모델을 실제 프로덕션 환경에서 안정적으로 운영하는 방법을 학습할 수 있도록 구성되어 있습니다. 데이터 과학(Data Science)의 이론적 내용이 아닌, 소프트웨어 엔지니어링과 머신러닝이 협업하는 방식을 중점적으로 다루며, 머신러닝을 활용한 제품 개발과 운영에 관심이 있는 분들에게 적합합니다. 강의에서는 다양한 사례 연구를 통해 AI 시스템이 실무에서 어떻게 활용되는지를 탐구합니다.
예를 들어, 자동 음성 인식 및 실시간 번역이나 스마트 의료 진단 시스템, 추천 시스템(예: 영화 추천), 스마트 교통 시스템 및 자율주행 기술 등을 실제 사례로 분석하며, 이를 AI 시스템에 적용하는 방안을 학습합니다. 또한, Apache Kafka, Docker, Jenkins, Prometheus, Grafana 등 최신 MLOps 도구를 활용하여 모델을 효과적으로 배포하고 모니터링하는 방법도 익힙니다.
이 강의는 기본적인 머신러닝 지식(예: scikit-learn 사용 경험)과 파이썬 프로그래밍 능력을 필요로 하지만, 소프트웨어 엔지니어링 경험이 없더라도 수강이 가능합니다.
강의 구성
주요 내용
이 강의는 다음과 같은 핵심 내용을 포함하고 있습니다:
프로덕션 환경에서의 머신러닝 시스템 설계
모델이 오류를 일으킬 가능성을 고려한 안전한 시스템 구축
사용자 인터페이스 및 전체 시스템 아키텍처 설계
MLOps 및 배포 전략
지속적 통합(CI) 및 지속적 배포(CD) 파이프라인 구축
A/B 테스트 및 Canary Deployment를 통한 실험적 배포
데이터 품질 및 모델 유지보수
데이터 드리프트 감지 및 대응
데이터 품질 평가 및 자동화된 테스트 기법
확장성 및 대규모 데이터 처리
대량의 데이터 및 사용자 요청을 처리하는 시스템 설계
배치 프로세싱 vs 스트림 프로세싱 아키텍처 비교
책임 있는 AI 개발
공정성(Fairness), 설명 가능성(Explainability), 프라이버시 및 보안 고려
알고리즘적 편향(Bias) 문제 해결 및 윤리적 AI 구현
실습 및 프로젝트
학생들은 100만명의 사용자(1 million users)에게 추천 서비스를 제공하는 영화 추천 시스템을 개발하는 실습 기반 프로젝트 를 수행하게 됩니다. 이를 통해 실제 프로덕션 환경에서 AI 모델을 배포하고 운영하는 경험을 쌓을 수 있습니다.
또한, Apache Kafka, Docker, Jenkins, Prometheus, Grafana, MLFlow 등 다양한 MLOps 최신 도구 를 활용하여 실무에서 필요로 하는 기술을 익히는 것을 목표로 합니다.