주제에 inference-framework 태그가 달렸습니다

글	조회수	활동
mlx-vlm: M5와 같은 Apple Silicon에 최적화된 MLX 기반 시각-언어 모델(VLM) 추론 및 파인튜닝 도구 읽을거리&정보공유 apple-silicon , vision-language , fine-tuning , mlx , inference-framework , mlx-vlm , vlm , omni-model	1002	2월 10, 2026
vLLM팀, 실시간 음성 상호작용 등, 옴니모달(Omni-Modality) 모델 서빙을 위한 vLLM-Omni 공개 읽을거리&정보공유 vllm , inference-framework , vllm-omni , omni-modality	558	12월 22, 2025
Mini-SGLang: SGLang의 핵심을 담은 경량화 고성능 LLM 추론 프레임워크 읽을거리&정보공유 llm-framework , llm-inference , sglang , inference-framework , llm-inference-serving , mini-sglang	470	12월 18, 2025
TileRT: LLM의 연산을 Tile 단위 작업으로 분해하여 실행하는 초저지연(Ultra-Low Latency) 런타임 읽을거리&정보공유 llm-inference , vllm , sglang , inference-framework , tilert , tilelang , tilescale , tile-ai	257	11월 26, 2025
FlashTensors: 단일 GPU 환경에서 다수의 모델을 빠르게 바꿔가며 운용할 수 있도록 하는 추론 엔진 읽을거리&정보공유 safetensors , llm-inference , inference-framework , flashtensors , llm-hotswap	404	11월 10, 2025
HAIF(Hyperswarm-RPC AI Inference Framework): MSA 구조로 AI 추론 작업을 분산처리하도록 설계된 프레임워크 읽을거리&정보공유 llm-inference , inference-framework , llm-inference-serving , haif , hyperswarm-rpc-ai-inference-framework	201	10월 14, 2025
Tokasaurus: 고처리량 LLM 배치 추론을 위한 최적화 엔진 (feat. Stanford Scaling Intelligence Lab) 읽을거리&정보공유 llm-inference , tokasaurus , inference-optimizing , inference-framework , batch-inference , hydragen	277	6월 9, 2025