FlashAttention-3, NVIDIA Hopper 아키텍처에 최적화된 어텐션 가속화 구현
|
|
0
|
368
|
7월 16, 2024
|
NVIDIA H100 & TensorRT-LLM으로 Mixtral 8x7B 모델 고성능 달성하기 (feat. NVIDIA 블로그 글)
|
|
0
|
254
|
7월 10, 2024
|
Cerebras, 62개의 H100 GPU와 유사한 성능의 WSE-3 공개
|
|
0
|
1022
|
3월 17, 2024
|
[GN] 인텔 Gaudi 2 칩, Diffusion Transformer 벤치마크에서 Nvidia H100을 능가
|
|
0
|
370
|
3월 12, 2024
|
[GN] NVIDIA, LLM 추론을 가속하는 TensorRT-LLM 오픈소스 공개
|
|
0
|
812
|
9월 13, 2023
|
[GN] NVIDIA의 AI 성공 비밀
|
|
0
|
416
|
9월 12, 2023
|
[TLDR] 오늘의 AI 뉴스, 2023-06-28: ElevenLabs 음성 라이브러리 🔊, 바이두 - Ernie가 ChatGPT보다 낫다고 주장 🤖, 코스모스-2 멀티모달 AI 🧑💻
|
|
1
|
315
|
12월 31, 2023
|