|
MAI-Thinking-1 기술 보고서: 데이터 파이프라인부터 RL 인프라까지, 프런티어 모델 학습의 전 과정을 해부한 '힐 클라이밍 머신' (feat. Microsoft AI)
|
|
0
|
124
|
6월 8, 2026
|
|
JetBrains, AI 워크플로를 위한 오픈소스 MoE 모델 Mellum 2 공개
|
|
0
|
218
|
6월 3, 2026
|
|
Cohere Command A+: 엔터프라이즈 에이전트 워크로드를 위한 오픈 MoE 모델
|
|
0
|
374
|
5월 21, 2026
|
|
Xiaomi, 1.02T 파라미터 오픈소스 MoE 추론 모델 MiMo-v2.5 및 MiMo-v2.5-Pro 출시
|
|
1
|
292
|
5월 1, 2026
|
|
DeepSeek, 100만 토큰 컨텍스트를 효율적으로 지원하는 MoE 모델 DeepSeek-V4-Pro 및 DeepSeek-V4-Flash 공개
|
|
0
|
719
|
4월 25, 2026
|
|
Kimi-K2: 에이전트형 인공지능을 위한 최신 MoE LLM (feat. Moonshot AI)
|
|
0
|
1222
|
7월 13, 2025
|
|
MoD(Mixture-of-Depths): Transformer 기반 언어 모델 연산 최적화를 위한 접근법, 그리고 MoDE(MoD+MoE)
|
|
0
|
2795
|
4월 7, 2024
|