[GN] NeumAI - 오픈소스 대규모 RAG 프레임워크

GeekNewsxguru님께 허락을 받고 GN에 올라온 글들 중에 AI 관련된 소식들을 공유하고 있습니다. :smiley_cat:


소개

  • 개발자가 데이터를 활용하여 Retrieval Augmented Generation (RAG)을 통해 대규모 언어 모델을 컨텍스트화할 수 있도록 지원하는 데이터 플랫폼
    • 문서 저장소 및 NoSQL과 같은 기존 데이터 소스에서 데이터를 추출
    • 콘텐츠를 벡터 임베딩으로 처리
    • 유사성 검색을 위해 벡터 데이터베이스에 벡터 임베딩을 수집
  • 애플리케이션에 따라 확장할 수 있고 데이터 커넥터, 임베딩 모델, 벡터 데이터베이스와 같은 서비스를 통합하는 데 소요되는 시간을 줄일 수 있는 포괄적인 RAG 솔루션

특징

  • 수십억 개의 데이터 포인트를 처리가능한 고성능 분산 아키텍처: 고도의 병렬화를 통해 임베딩 생성 및 수집을 최적화
  • 공통 데이터 소스, 임베딩 서비스 및 벡터 스토어를 지원 하는 내장 데이터 커넥터
  • 데이터 소스를 실시간으로 동기화하여 데이터를 항상 최신 상태로 유지
  • 로드, 청킹, 선택 등의 형태로 사용자 지정 가능한 데이터 전처리
  • 메타데이터를 통한 하이브리드 검색을 지원하는 일관된 데이터 관리 : 메타데이터를 자동으로 보강하고 추적하여 풍부한 검색 경험을 제공

원문

홈페이지

GitHub 저장소

블로그

출처 / GeekNews