파이토치 한국 사용자 모임
speculative-decoding
글
댓글
조회수
활동
메두사: 여러 디코딩 헤더를 사용한 대규모 언어 모델 추론 가속화 프레임워크 (Medusa: Simple Framework for Accelerating LLM Generation with Multiple Decoding Heads)
읽을거리&정보공유
framework
,
llm-in-production
,
llm-framework
,
medusa
,
llm-acceleration
,
speculative-decoding
0
993
12월 26, 2023