MM-LLMs: 멀티모달 대규모 언어 모델의 최근 발전에 대한 연구 (Recent Advances in MultiModal Large Language Models)
|
|
4
|
7478
|
2월 19, 2024
|
MGIE: Apple이 공개한 자연어 명령 기반 이미지 변경 모델 (MLLM-Guided Image Editing)
|
|
0
|
604
|
2월 10, 2024
|
SpeechAgents: 멀티모달, 멀티에이전트를 사용한 인간과의 의사소통 시뮬레이션 프로젝트
|
|
0
|
320
|
1월 23, 2024
|
TinyGPT-V: 소형 백본을 사용한 효율적인 멀티모달 LLM (TinyGPT-V: Efficient Multimodal Large Language Model via Small Backbones)
|
|
0
|
577
|
1월 5, 2024
|
[2023/12/25 ~ 12/31] 이번 주의 주요 ML 논문 (Top ML Papers of the Week)
|
|
0
|
848
|
1월 1, 2024
|
Ferret: Apple이 공개'했'던 대규모 멀티모달 모델(LMM / MLLM)
|
|
2
|
1771
|
12월 29, 2023
|
텐센트가 공개한, 스마트폰 사용자처럼 동작하는 AppAgent 모델
|
|
0
|
905
|
12월 27, 2023
|
GPT-4V에서 특출난 시각적 근거(VG) 기능을 위한 표식-집합(SoM) 프롬프트 (Set-of-Mark Prompting Unleashes Extraordinary Visual Grounding in GPT-4V)
|
|
0
|
418
|
10월 26, 2023
|
[2023/10/02 ~ 10/08] 이번 주의 주요 ML 논문 (Top ML Papers of the Week)
|
|
0
|
850
|
10월 9, 2023
|