주제에 fp8 태그가 달렸습니다

글	조회수	활동
DeepGEMM: NVIDIA Hopper GPU에서 효율적인 FP8 연산을 위한 GEMM 커널 라이브러리 (feat. DeepSeek) 읽을거리&정보공유 fp8 , deepseek , cutlass , deepgemm , nvidia-hopper , gemm-kernel , grouped-gemm , tensor-memory-accelerator	384	2월 26, 2025
FlashAttention-3, NVIDIA Hopper 아키텍처에 최적화된 어텐션 가속화 구현 읽을거리&정보공유 together , nvidia-h100 , fp8 , flashattention-v2 , flashattention , flashattention-3 , wgmma , tma	568	7월 16, 2024
[GN] NVIDIA, LLM 추론을 가속하는 TensorRT-LLM 오픈소스 공개 읽을거리&정보공유 nvidia , geeknews , llm , nvidia-h100 , fp8 , tensorrt-llm , hopper-transformer , tensorrt	851	9월 13, 2023
Unit Scaling: 저정밀도의 학습을 위한 PyTorch 라이브러리 (Beta release) 읽을거리&정보공유 fp16 , graphcore , unit-scaling , fp8 , optimizing	305	8월 26, 2023