|
mlx-vlm: M5와 같은 Apple Silicon에 최적화된 MLX 기반 시각-언어 모델(VLM) 추론 및 파인튜닝 도구
|
|
0
|
1002
|
2월 10, 2026
|
|
vLLM팀, 실시간 음성 상호작용 등, 옴니모달(Omni-Modality) 모델 서빙을 위한 vLLM-Omni 공개
|
|
0
|
558
|
12월 22, 2025
|
|
Mini-SGLang: SGLang의 핵심을 담은 경량화 고성능 LLM 추론 프레임워크
|
|
0
|
470
|
12월 18, 2025
|
|
TileRT: LLM의 연산을 Tile 단위 작업으로 분해하여 실행하는 초저지연(Ultra-Low Latency) 런타임
|
|
0
|
257
|
11월 26, 2025
|
|
FlashTensors: 단일 GPU 환경에서 다수의 모델을 빠르게 바꿔가며 운용할 수 있도록 하는 추론 엔진
|
|
0
|
404
|
11월 10, 2025
|
|
HAIF(Hyperswarm-RPC AI Inference Framework): MSA 구조로 AI 추론 작업을 분산처리하도록 설계된 프레임워크
|
|
0
|
201
|
10월 14, 2025
|
|
Tokasaurus: 고처리량 LLM 배치 추론을 위한 최적화 엔진 (feat. Stanford Scaling Intelligence Lab)
|
|
0
|
277
|
6월 9, 2025
|