W&B, 실제 프로덕션 환경에서의 RAG 활용에 대한 강좌 'RAG++' 개설 및 사전 등록 중

W&B, 실제 프로덕션 환경에서의 RAG 활용에 대한 강좌 'RAG++' 개설 및 사전 등록 중

강의 소개

RAG++는 Weights & Biases에서 제공하는 "RAG in Production"이라는 주제의 강의입니다. 이 강의는 Weights & Biases의 두 머신러닝 엔지니어인 Bharat Ramanathan과 Ayush Thakur가 강의를 진행하며, RAG (Retrieval-Augmented Generation) 모델의 실제 프로덕션 환경에서의 사용과 관련된 내용을 다룹니다.

이 강의는 RAG(Recital-Augmented Generation) 시스템을 실무에서 효율적으로 사용하는 방법을 단계별로 학습할 수 있도록 설계되어 있습니다. 데이터 수집과 전처리부터 쿼리 향상, 평가 및 최적화, 그리고 파인튜닝까지의 전체 워크플로우를 이해하고, 실습을 통해 실질적인 기술을 배울 수 있습니다. 특히, RAG 모델을 실제 환경에서 활용하는 방법과 관련된 다양한 기술적 내용을 다루며, 특히 데이터 검색과 생성 모델을 결합하여 더욱 효율적인 결과를 제공하는 방법론에 중점을 두고 있습니다.

주요 강사

  • Meor Amer: Cohere의 Developer Advocate, LLM을 활용한 애플리케이션 개발 지원.

  • Charles Pierse: Weaviate Labs 팀의 ML 엔지니어, AI 연구를 실무에 적용.

  • Bharat Ramanathan: Weights & Biases의 ML 엔지니어, Wandbot 개발.

  • Ayush Thakur: Weights & Biases 및 Google Developer Expert, 컴퓨터 비전과 표현 학습 전문가.

학습 목표

  • RAG 앱 성능 향상: 실무 경험을 바탕으로 한 최적화된 솔루션 제공.

  • 일관성 및 신뢰성 증대: 높은 정확도와 관련성, 적은 오류를 달성.

  • 비용 절감: 성능을 개선하면서 비용 절감 방법 제공.

강의 목차 (Course curriculumn)

  1. Course Introduction (과정 소개)
    • 환영 인사 및 과정 개요
    • Weave와 Cohere 크레딧 설정 방법
  2. Introduction to Advanced RAG and Wandbot (고급 RAG와 Wandbot 소개)
    • 챕터 목표 설명
    • 기본에서 고급 RAG로 전환
    • Wandbot 개요
    • 20/80 규칙 적용
    • RAG 베스트 프랙티스
    • 도전 과제와 해결책
    • RAG 설정을 위한 실습 노트북 (Notebook 1)
  3. Evaluation (평가)
    • 챕터 목표
    • 평가 기본 사항 이해
    • 평가용 노트북 활용 (Notebook 2)
    • 검색기 평가 방법
    • LLM을 평가의 심판으로 활용하기
    • Assertions 사용
    • 전통적인 NLP의 한계
    • LLM 평가의 실제 적용
    • 모델 재평가
    • LLM 평가의 한계점
    • 페어와이즈(pairwise) 평가 방법
    • 결론
  4. Data Ingestion and Preprocessing (데이터 수집 및 전처리)
    • 챕터 목표
    • 데이터 수집 및 파싱
    • 청킹(Chunking) 기법
    • 메타데이터 관리
    • 데이터 수집 시의 문제점과 해결책
    • 베스트 프랙티스
    • 실습 노트북 (Notebook 3)
    • 청킹의 실제 적용
    • BM25 알고리즘
    • 결론
  5. Query Enhancement (쿼리 향상)
    • 재검색(Reranking)
    • 상위 문서 검색(Parent-document Retrieval)
    • 메타데이터 필터링
    • 키워드 기반 텍스트 검색
    • 크로스 인코더 vs 바이 인코더 비교
    • 검색 평가
  6. Speed, Latency, and Efficiency (속도, 지연 시간, 효율성)
    • 개인화된 호출 최적화
    • 검색 병렬화 (Paralyzing Retrieval)
    • 구성 가능한 파이프라인 설정
    • LLM 호출 수 줄이기
  7. Fine-Tuning (파인튜닝)
    • 모델의 파인튜닝 방법
  8. Course Assignment and Next Steps (과정 과제 및 다음 단계)
    • 과정 프로젝트 진행
    • 과정 완료 및 축하

강의 소개 및 사전 등록




이 글은 GPT 모델로 정리한 글을 바탕으로 한 것으로, 원문의 내용 또는 의도와 다르게 정리된 내용이 있을 수 있습니다. 관심있는 내용이시라면 원문도 함께 참고해주세요! 읽으시면서 어색하거나 잘못된 내용을 발견하시면 덧글로 알려주시기를 부탁드립니다. :hugs:

:pytorch:파이토치 한국 사용자 모임:kr:이 정리한 이 글이 유용하셨나요? 회원으로 가입하시면 주요 글들을 이메일:love_letter:로 보내드립니다! (기본은 Weekly지만 Daily로 변경도 가능합니다.)

:gift: 아래:arrow_lower_right:쪽에 좋아요:+1:를 눌러주시면 새로운 소식들을 정리하고 공유하는데 힘이 됩니다~ :star_struck:

오늘 새벽에 강좌가 개설되었다고 메일이 왔네요! :smiley:

RAG++ 개설


아래는 첫 번째 강좌(오리엔테이션)의 내용 원문과 DeepL 번역 내용입니다:

RAG++ 과정에 오신 것을 환영합니다!

이 과정은 RAG 개념 증명과 프로덕션 준비 시스템 간의 격차를 해소하는 데 도움이 되도록 설계되었습니다. 실시간 고객 지원 봇인 Wandbot을 구축하고 배포한 경험에서 얻은 실질적인 인사이트와 교훈을 공유할 것입니다.

이 과정에서는 평가, 고급 기술 및 프로덕션 배포를 위한 실제 고려 사항에 중점을 두고 RAG 시스템을 다음 단계로 끌어올리기 위한 실용적인 로드맵을 제공합니다. 사용자에게 가치를 제공하는 고성능 RAG 시스템을 구축 및 배포할 수 있는 지식, 기술, 자신감을 얻을 수 있습니다.

이 과정을 마치면 다음을 수행할 수 있습니다:

  • RAG 시스템을 프로덕션 환경에 자신 있게 배포할 수 있습니다.

  • 강력한 평가 파이프라인을 구축합니다.

  • 고급 RAG 구성 요소를 효과적으로 활용합니다.

  • 검색 품질과 응답 생성을 개선합니다.

  • RAG 시스템의 성능과 지연 시간을 최적화합니다.

이 과정을 최대한 활용하는 방법

  • 강의 녹화본 시청하기

  • 각 챕터 아래에 링크된 강의 노트와 함께 따라하기

  • 강의 링크 및 노트북 표식에서 추가 리소스 살펴보기

  • Cohere 크레딧 받기

  • 모든 레슨 완료하기

  • 과제 제출하기

  • 잘 취득한 수료증을 자랑하고 RAG 파이프라인을 정리하세요!

행운을 빕니다!

Welcome to the RAG++ course!

This course is designed to help you bridge the gap between a RAG proof of concept and a production-ready system. We'll share practical insights and lessons learned from our experience building and deploying Wandbot, a live customer support bot.

This course provides a practical roadmap for taking your RAG systems to the next level, focusing on evaluation, advanced techniques, and real-world considerations for production deployment. You'll gain the knowledge, skills, and confidence to build and deploy high-performing RAG systems that deliver value to your users.

By the end of this course, you'll be able to:

  • Confidently deploy RAG systems into production.
  • Build robust evaluation pipelines.
  • Utilize advanced RAG components effectively.
  • Improve retrieval quality and response generation.
  • Optimize your RAG system's performance and latency.

How to best take advantage of the course:

  • Watch the lesson recordings
  • Follow along with the course notebooks linked under each chapter
  • Explore extra resources in the lesson links and notebook markdowns
  • Get your Cohere credits
  • Complete all lessons
  • Submit your assignment
  • Show off your well-earned certificate and get your RAG pipeline sorted!

Good luck!