[GN] tinyvector - 작고 빠른 벡터 임베딩 데이터베이스 오픈소스

GeekNewsxguru님께 허락을 받고 GN에 올라온 글들 중에 AI 관련된 소식들을 공유하고 있습니다. :smiley_cat:


소개

  • SQLite + Python(Flask) + Numpy 로 구성
  • 500라인도 안되는 코드로 쉽게 커스터마이징 가능
  • 중/소규모 데이터셋에서 고급 벡터 데이터베이스들과 비슷한 성능
  • 모든 인덱스를 메모리에 저장해서 빠르게 쿼리 가능
  • 곧 추가될 기능들
    • 강력한 쿼리(SQL 기능 모두 지원)
    • 모델과 통합(SBert, Hugging Face models, OpenAI, Cohere,..)
    • Python/JS 클라이언트

원문

GitHub 저장소 / Python 버전

GitHub 저장소 / Rust 버전

출처 / GeekNews