sliding-window-attention
| 글 | 댓글 | 조회수 | 활동 | |
|---|---|---|---|---|
| SpikingBrain: 뇌 신경 메커니즘 기반의, 긴 문맥 처리와 에너지 효율적 대규모 언어 모델에 대한 연구 |
|
0 | 273 | 9월 17, 2025 |
| Samba: Microsoft가 공개한 효율적인 무제한 컨텍스트 언어 모델 (Mamba + MLP + Sliding Window Attention + 고품질 Dataset) |
|
0 | 641 | 6월 14, 2024 |