[GN⁺] Mistral AI, 새로운 오픈 모델 Mixtral 8x22B 공개
|
|
0
|
160
|
4월 19, 2024
|
MoD(Mixture-of-Depths): Transformer 기반 언어 모델 연산 최적화를 위한 접근법, 그리고 MoDE(MoD+MoE)
|
|
0
|
1803
|
4월 7, 2024
|
Jamba: AI21이 공개한 Mamba 기반의 MoE 공개 모델 (OpenLLM)
|
|
0
|
784
|
3월 29, 2024
|
Qwen1.5-MoE: 2.7B 규모의 활성화된 매개변수로 7B 규모의 모델과 유사한 성능을 보이는 Qwen의 새로운 MoE 모델
|
|
0
|
286
|
3월 29, 2024
|
[GN⁺] 구글의 차세대 모델: Gemini 1.5
|
|
0
|
367
|
2월 16, 2024
|
MoE-LLaVA: 대규모 Vision-Language 모델을 위한 전문가 혼합 기법 적용 (Mixture of Experts for Large Vision-Language Models)
|
|
0
|
641
|
2월 6, 2024
|
[2024/01/01 ~ 01/07] 이번 주의 주요 ML 논문 (Top ML Papers of the Week)
|
|
0
|
557
|
1월 8, 2024
|
HyperRouter: HyperNetwork를 통한 효율적인 학습 및 추론을 위한 희소 전문가 혼합 모델(SMoE)
|
|
0
|
173
|
12월 15, 2023
|
[TLDR] 오늘의 AI 뉴스, 2023-09-18: Adobe의 생성형 AI Firefly, 일반 사용 가능 👋, AI 저작권 문제 관련 설문조사 📃, AI 보안 🔐
|
|
1
|
252
|
12월 31, 2023
|
[TLDR] 오늘의 AI 뉴스, 2023-09-15: Microsoft 오픈소스 EvoDiff 🌐, RAG 기반 LLM 앱 구축 가이드 🤖, 가짜 유명인 이미지를 발견하기 위한 데이터셋 💃
|
|
1
|
438
|
12월 31, 2023
|
[TLDR] 오늘의 AI 뉴스, 2023-08-07: 알리바바의 오픈소스 AI 모델 💻, TPU 제조업체, 칩 회사 설립 💾, 제로-샷 이미지 분류 🖼️
|
|
1
|
236
|
12월 31, 2023
|
[TLDR] 오늘의 AI 뉴스, 2023-07-10: 구글의 병원 내 의료 AI 🏥, 알리바바의 이미지 생성기 🖼️, 크리스토퍼 놀란은 어떻게 AI를 사랑하는 방법을 배웠을까 ❤️
|
|
1
|
505
|
12월 31, 2023
|