fp8
글 | 댓글 | 조회수 | 활동 | |
---|---|---|---|---|
DeepGEMM: NVIDIA Hopper GPU에서 효율적인 FP8 연산을 위한 GEMM 커널 라이브러리 (feat. DeepSeek) |
![]() |
0 | 165 | 2월 26, 2025 |
FlashAttention-3, NVIDIA Hopper 아키텍처에 최적화된 어텐션 가속화 구현 |
![]() |
0 | 408 | 7월 16, 2024 |
[GN] NVIDIA, LLM 추론을 가속하는 TensorRT-LLM 오픈소스 공개 |
![]() |
0 | 817 | 9월 13, 2023 |
Unit Scaling: 저정밀도의 학습을 위한 PyTorch 라이브러리 (Beta release) |
![]() |
0 | 291 | 8월 26, 2023 |