Cake: 대규모 모델 분산 추론 프레임워크 (feat. Rust)
|
|
0
|
143
|
7월 16, 2024
|
Groq, 18배 가량 빠른 LLM 추론 성능을 보이는 LPU(Language Processing Unit) 추론 엔진공개
|
|
1
|
1981
|
3월 13, 2024
|
Groq의 LPU를 경제적 관점에서 분석 및 NVIDIA와 비교한 글 (feat. SemiAnalysis)
|
|
0
|
754
|
2월 24, 2024
|
gemma.cpp: Gemma 모델의 빠른 실행을 위한 C++ 추론 엔진 (by Google)
|
|
1
|
940
|
2월 22, 2024
|
Intel GPU에서의 효율적인 LLM 추론 방법에 대한 연구 소개 (feat. Intel)
|
|
0
|
710
|
1월 22, 2024
|
[GN] Microsoft (Long)LLMLingua - 추론 가속 및 비용 절감을 위해 프롬프트 압축하기
|
|
0
|
426
|
12월 22, 2023
|
(인텔 플랫폼에서) 더 빠른 Transformer를 위한 Intel Extension 공개
|
|
0
|
541
|
12월 7, 2023
|