PyTorch 팀이 공개한 LLM 파인튜닝 도구 torchtune 공식 출시
|
|
0
|
416
|
4월 17, 2024
|
Cheshire-Cat: 맞춤형 AI 구축을 위한 유연하고 확장성있는 프레임워크
|
|
0
|
112
|
4월 10, 2024
|
InfiniFlow의 RAGFlow, Apache 2.0 라이선스를 채택하며 오픈소스로 전환
|
|
0
|
420
|
4월 4, 2024
|
gemma.cpp: Gemma 모델의 빠른 실행을 위한 C++ 추론 엔진 (by Google)
|
|
1
|
667
|
2월 22, 2024
|
[GN] llmware - RAG을 포함한 LLM 기반 어플리케이션 개발용 통합 프레임워크
|
|
0
|
293
|
2월 17, 2024
|
[GN] TaskingAI - AI-Native 앱 개발을 위한 오픈소스 플랫폼
|
|
1
|
188
|
2월 6, 2024
|
[2024/01/08 ~ 01/14] 이번 주의 주요 ML 논문 (Top ML Papers of the Week)
|
|
0
|
455
|
1월 14, 2024
|
[GN] Tanuki - LLM 기반의 앱을 쉽게 개발하기
|
|
0
|
273
|
12월 29, 2023
|
메두사: 여러 디코딩 헤더를 사용한 대규모 언어 모델 추론 가속화 프레임워크 (Medusa: Simple Framework for Accelerating LLM Generation with Multiple Decoding Heads)
|
|
0
|
464
|
12월 26, 2023
|
LongLLMLingua: 중간 손실을 줄이고 프롬프트 압축을 통한 RAG 비용 절감 (LongLLMLingua: Bye-bye to Middle Loss and Save on Your RAG Costs via Prompt Compression
|
|
0
|
600
|
12월 22, 2023
|
[GN] PowerInfer - 소비자용 GPU를 사용해서 빠르게 LLM 서빙하기
|
|
0
|
493
|
12월 21, 2023
|
PyTorchKR이 정리한 오늘의 AI/ML 소식 @ 2023-12-20: 생성형 AI의 미래와 도전과제, LLM 프레임워크 RΞASON, GPT 임베딩 공간의 이상한 현상 등
|
|
1
|
247
|
12월 31, 2023
|
[GN] NeumAI - 오픈소스 대규모 RAG 프레임워크
|
|
0
|
371
|
11월 28, 2023
|
[GN] Microsoft AutoGen - 차세대 LLM 어플리케이션을 위한 프레임워크
|
|
0
|
505
|
10월 17, 2023
|
[GN] Lanarky - LLM을 프로덕션에 배포하기 위한 오픈소스 프레임워크
|
|
0
|
342
|
6월 19, 2023
|