llm-inference
글 | 댓글 | 조회수 | 활동 | |
---|---|---|---|---|
Groq, 18배 가량 빠른 LLM 추론 성능을 보이는 LPU(Language Processing Unit) 추론 엔진공개 | 1 | 1485 | 3월 13, 2024 | |
Groq의 LPU를 경제적 관점에서 분석 및 NVIDIA와 비교한 글 (feat. SemiAnalysis) | 0 | 440 | 2월 24, 2024 | |
gemma.cpp: Gemma 모델의 빠른 실행을 위한 C++ 추론 엔진 (by Google) | 1 | 665 | 2월 22, 2024 | |
Intel GPU에서의 효율적인 LLM 추론 방법에 대한 연구 소개 (feat. Intel) | 0 | 547 | 1월 22, 2024 | |
[GN] Microsoft (Long)LLMLingua - 추론 가속 및 비용 절감을 위해 프롬프트 압축하기 | 0 | 289 | 12월 22, 2023 | |
(인텔 플랫폼에서) 더 빠른 Transformer를 위한 Intel Extension 공개 | 0 | 349 | 12월 7, 2023 |