fp8
글 | 댓글 | 조회수 | 활동 | |
---|---|---|---|---|
[GN] NVIDIA, LLM 추론을 가속하는 TensorRT-LLM 오픈소스 공개 |
![]() |
0 | 292 | 9월 13, 2023 |
Unit Scaling: 저정밀도의 학습을 위한 PyTorch 라이브러리 (Beta release) |
![]() |
0 | 140 | 8월 26, 2023 |