quantization
| 글 | 댓글 | 조회수 | 활동 | |
|---|---|---|---|---|
| turboquant-pytorch: Google의 TurboQuant를 PyTorch로 처음부터 직접 구현한 LLM KV 캐시 양자화 라이브러리 |
|
2 | 2680 | 4월 3, 2026 |
| flash-moe: 순수 C와 Metal로 구현한, M3 Max 맥북 프로에서 397B 파라미터 MoE 모델을 실행하는 고성능 추론 엔진 |
|
0 | 2115 | 3월 23, 2026 |
| Quanto, Hugging Face에서 개발한 PyTorch 기반의 양자화 도구(Quantization Toolkit) |
|
0 | 560 | 3월 25, 2024 |
| 양자화된 모델 추론 시 입출력 데이터 형식 |
|
4 | 504 | 2월 14, 2024 |