mode
글 | 댓글 | 조회수 | 활동 | |
---|---|---|---|---|
MoD(Mixture-of-Depths): Transformer 기반 언어 모델 연산 최적화를 위한 접근법, 그리고 MoDE(MoD+MoE) |
![]() |
0 | 2504 | 4월 7, 2024 |
글 | 댓글 | 조회수 | 활동 | |
---|---|---|---|---|
MoD(Mixture-of-Depths): Transformer 기반 언어 모델 연산 최적화를 위한 접근법, 그리고 MoDE(MoD+MoE) |
![]() |
0 | 2504 | 4월 7, 2024 |