Hunyuan-T1, 텐센트가 공개한 최초의 Mamba 기반 초대형 모델
|
|
0
|
443
|
3월 23, 2025
|
[2024/08/05 ~ 08/11] 이번 주의 주요 ML 논문 (Top ML Papers of the Week)
|
|
0
|
417
|
8월 11, 2024
|
Samba: Microsoft가 공개한 효율적인 무제한 컨텍스트 언어 모델 (Mamba + MLP + Sliding Window Attention + 고품질 Dataset)
|
|
0
|
584
|
6월 14, 2024
|
Jamba: AI21이 공개한 Mamba 기반의 MoE 공개 모델 (OpenLLM)
|
|
0
|
1484
|
3월 29, 2024
|
Vision Mamba(Vim): 양방향 상태 공간 모델(SSM)을 활용한 효율적 시각 표현 학습
|
|
0
|
1589
|
2월 3, 2024
|
[GN] 2023년은 오픈 LLM의 해
|
|
0
|
317
|
12월 21, 2023
|
Mamba: 선택적 상태 공간을 활용한 선형 시간 시퀀스 모델링 (Linear-Time Sequence Modeling with Selective State Spaces)
|
|
0
|
6614
|
12월 14, 2023
|