파이토치 한국 사용자 모임
mode
글
댓글
조회수
활동
MoD(Mixture-of-Depths): Transformer 기반 언어 모델 연산 최적화를 위한 접근법, 그리고 MoDE(MoD+MoE)
읽을거리&정보공유
paper
,
deepmind
,
mixture-of-experts
,
mod
,
mixture-of-depths
,
moe
,
mod-transformer
,
mode
,
expert-choice-mod-routing
,
mixture-of-depths-and-experts
0
2457
4월 7, 2024