|
[GN⁺] Llama 3-V - GPT4-V와 동등한 성능을 100배 작은 모델과 500달러로 구현하기
|
|
1
|
1697
|
6월 4, 2024
|
|
Meta, 다양한 모달리티에서 더 뛰어난 성능을 제공하는 융합 모델 Chameleon 공개
|
|
0
|
1046
|
5월 20, 2024
|
|
PaliGemma, Gemma 기반의 소규모 Multimodal-LLM
|
|
0
|
1440
|
5월 17, 2024
|
|
HPT 1.5 Air, HyperGAI가 공개한 Llama 3 기반의 8B 규모의 멀티모달 LLM (feat. OpenLLM)
|
|
0
|
435
|
5월 14, 2024
|
|
Idefics2, Hugging Face가 공개한 8B 규모의 멀티모달 모델 (Vision-Language)
|
|
0
|
871
|
5월 10, 2024
|
|
[2024/04/29 ~ 05/06] 이번 주의 주요 ML 논문 (Top ML Papers of the Week)
|
|
0
|
796
|
5월 6, 2024
|
|
PLLaVA, Vision-Language 모델인 LLaVA를 Video로 확장하는 프로젝트
|
|
0
|
823
|
5월 2, 2024
|
|
파인튜닝 가능한 멀티모달 LLM이 뭐가 있을까요?
|
|
7
|
1332
|
4월 26, 2024
|
|
Reka Core, Reka.AI에서 출시한 멀티모달 대규모 언어 모델(MLLM)
|
|
0
|
525
|
4월 16, 2024
|
|
Imp, 3B 규모의 소규모 멀티모달 언어 모델 (feat. Phi-2 + SigLIP + LLaVA)
|
|
0
|
560
|
3월 18, 2024
|
|
VLM(Vision-Language Model)과 시각 연역 추론에 대한 Apple의 연구
|
|
0
|
1538
|
3월 12, 2024
|
|
GroundingGPT: ByteDance가 공개한, 언어-강화 멀티모달 그라운딩 모델 (Language Enhanced Multi-modal Grounding Model)
|
|
5
|
506
|
3월 5, 2024
|
|
[GN⁺] Gemini Pro 1.5의 킬러 앱은 비디오입니다
|
|
1
|
490
|
2월 22, 2024
|
|
[GN⁺] 제프 딘: 머신 러닝의 최신 동향 [비디오]
|
|
0
|
276
|
2월 21, 2024
|
|
MM-LLMs: 멀티모달 대규모 언어 모델의 최근 발전에 대한 연구 (Recent Advances in MultiModal Large Language Models)
|
|
4
|
10872
|
2월 19, 2024
|
|
MGIE: Apple이 공개한 자연어 명령 기반 이미지 변경 모델 (MLLM-Guided Image Editing)
|
|
0
|
685
|
2월 10, 2024
|
|
[2024/01/29 ~ 02/04] 이번 주의 주요 ML 논문 (Top ML Papers of the Week)
|
|
0
|
1652
|
2월 5, 2024
|
|
[2023/12/18 ~ 12/24] 이번 주의 주요 ML 논문 (Top ML Papers of the Week)
|
|
0
|
1798
|
12월 25, 2023
|
|
MoE-LLaVA: 대규모 Vision-Language 모델을 위한 전문가 혼합 기법 적용 (Mixture of Experts for Large Vision-Language Models)
|
|
0
|
1510
|
2월 6, 2024
|
|
[2024/01/22 ~ 01/28] 이번 주의 주요 ML 논문 (Top ML Papers of the Week)
|
|
0
|
933
|
1월 29, 2024
|
|
SpeechAgents: 멀티모달, 멀티에이전트를 사용한 인간과의 의사소통 시뮬레이션 프로젝트
|
|
0
|
441
|
1월 23, 2024
|
|
Gemini의 추론 능력: 멀티모달 LLM의 '상식'에 대해 알아보기
|
|
0
|
643
|
1월 12, 2024
|
|
AI Employe: GPT-4V를 활용한 브라우저 자동화 도구
|
|
0
|
383
|
1월 8, 2024
|
|
[2024/01/01 ~ 01/07] 이번 주의 주요 ML 논문 (Top ML Papers of the Week)
|
|
0
|
885
|
1월 8, 2024
|
|
TinyGPT-V: 소형 백본을 사용한 효율적인 멀티모달 LLM (TinyGPT-V: Efficient Multimodal Large Language Model via Small Backbones)
|
|
0
|
723
|
1월 5, 2024
|
|
[2023/12/25 ~ 12/31] 이번 주의 주요 ML 논문 (Top ML Papers of the Week)
|
|
0
|
904
|
1월 1, 2024
|
|
Ferret: Apple이 공개'했'던 대규모 멀티모달 모델(LMM / MLLM)
|
|
2
|
1891
|
12월 29, 2023
|
|
텐센트가 공개한, 스마트폰 사용자처럼 동작하는 AppAgent 모델
|
|
0
|
1089
|
12월 27, 2023
|
|
[GN] LibreChat - 향상된 ChatGPT 클론
|
|
0
|
427
|
12월 26, 2023
|
|
[GN] 구글, AI 모델 Gemini 공개
|
|
1
|
635
|
12월 7, 2023
|