sparse-moe
| 글 | 댓글 | 조회수 | 활동 | |
|---|---|---|---|---|
| Qwen3-Next: Qwen팀에서 새롭게 출시한 학습 및 추론 효율성을 향상한 모델 |
|
0 | 2901 | 9월 15, 2025 |
| [GN⁺] Mistral AI, Llama 2 70B 모델보다 뛰어난 Mixtral 8x7B 모델 공개 |
|
1 | 824 | 1월 10, 2024 |
| PyTorchKR이 정리한 오늘의 주요 AI/ML 소식들 @ 2023-12-13: Mixtral 8x7B, Phi2, 생성형 AI에서의 VectorDB |
|
1 | 444 | 12월 31, 2023 |
| HyperRouter: HyperNetwork를 통한 효율적인 학습 및 추론을 위한 희소 전문가 혼합 모델(SMoE) |
|
0 | 287 | 12월 15, 2023 |