turboquant-pytorch: Google의 TurboQuant를 PyTorch로 처음부터 직접 구현한 LLM KV 캐시 양자화 라이브러리

많이 배우고 갑니다.

요즘에 OpenAI Whisper 모델에 대해서 논문을 구현해봤는데,

많은 관심과 스타를 눌러주시면 감사하겠습니다.

2개의 좋아요