large-vision-language-model
글 | 댓글 | 조회수 | 활동 | |
---|---|---|---|---|
CAPTURE: Multimodal LLM(LVLM)의 이미지 캡션 생성 성능 평가 지표 (벤치마크 & 평가 데이터셋) |
![]() |
0 | 408 | 9월 5, 2024 |
VLMs are blind: 시각-언어 모델이 실패하는 (인간에게는 쉬운) 시각적 작업들에 대한 연구 (feat. BlindTest) |
![]() |
0 | 955 | 7월 13, 2024 |
AnomalyGPT: 대형 시각-언어 모델을 사용한 산업 이상 탐지 (AnomalyGPT: Detecting Industrial Anomalies using Large Vision-Language Models) |
![]() |
0 | 839 | 9월 19, 2023 |