Tencent, 389B 규모(활성 52B)의 MoE LLM Hunyuan-A52B 공개
|
|
0
|
152
|
11월 9, 2024
|
LongWriter: Long Context LLM을 활용한 10,000+ 단어 생성이 가능한 모델
|
|
0
|
177
|
10월 10, 2024
|
[2024/07/22 ~ 07/28] 이번 주의 주요 ML 논문 (Top ML Papers of the Week)
|
|
0
|
581
|
7월 29, 2024
|
Samba: Microsoft가 공개한 효율적인 무제한 컨텍스트 언어 모델 (Mamba + MLP + Sliding Window Attention + 고품질 Dataset)
|
|
0
|
504
|
6월 14, 2024
|
GLM-4, 26개 언어를 지원하는 9B 규모의 LLM 및 MLLM(Multimodal-LLM)
|
|
0
|
673
|
6월 7, 2024
|
32GB 미만 메모리로 실행 가능한, 10M 컨텍스트 길이를 가진 Gemma 2B 모델 공개
|
|
0
|
467
|
5월 10, 2024
|
[2024/04/29 ~ 05/06] 이번 주의 주요 ML 논문 (Top ML Papers of the Week)
|
|
0
|
706
|
5월 6, 2024
|
[2024/04/01 ~ 04/07] 이번 주의 주요 ML 논문 (Top ML Papers of the Week)
|
|
0
|
716
|
4월 7, 2024
|
[GN⁺] Gemini Pro 1.5의 킬러 앱은 비디오입니다
|
|
1
|
450
|
2월 22, 2024
|
[GN⁺] 구글의 차세대 모델: Gemini 1.5
|
|
0
|
497
|
2월 16, 2024
|
Anthropic, 200k 컨텍스트 윈도우 길이를 갖는 Claude 2.1 공개
|
|
0
|
322
|
11월 22, 2023
|
YaRN: RoPE + LLM으로 10배 적은 토큰과 2.5배 적은 학습 단계로 Context Window를 128k까지 확장하기
|
|
0
|
1396
|
11월 5, 2023
|
[TLDR] 오늘의 AI 뉴스, 2023-10-09: Microsoft AI 칩 💾, AI 기반 저널리즘 📓, 음악 생성 스트리밍 🎵
|
|
1
|
262
|
12월 31, 2023
|
[2023/10/02 ~ 10/08] 이번 주의 주요 ML 논문 (Top ML Papers of the Week)
|
|
0
|
845
|
10월 9, 2023
|