expert-choice-mod-routing
글 | 댓글 | 조회수 | 활동 | |
---|---|---|---|---|
MoD(Mixture-of-Depths): Transformer 기반 언어 모델 연산 최적화를 위한 접근법, 그리고 MoDE(MoD+MoE) | 0 | 2457 | 4월 7, 2024 |
글 | 댓글 | 조회수 | 활동 | |
---|---|---|---|---|
MoD(Mixture-of-Depths): Transformer 기반 언어 모델 연산 최적화를 위한 접근법, 그리고 MoDE(MoD+MoE) | 0 | 2457 | 4월 7, 2024 |