large-vision-language-model
| 글 | 댓글 | 조회수 | 활동 | |
|---|---|---|---|---|
| CAPTURE: Multimodal LLM(LVLM)의 이미지 캡션 생성 성능 평가 지표 (벤치마크 & 평가 데이터셋) |
|
0 | 665 | 9월 5, 2024 |
| VLMs are blind: 시각-언어 모델이 실패하는 (인간에게는 쉬운) 시각적 작업들에 대한 연구 (feat. BlindTest) |
|
0 | 1208 | 7월 13, 2024 |
| AnomalyGPT: 대형 시각-언어 모델을 사용한 산업 이상 탐지 (AnomalyGPT: Detecting Industrial Anomalies using Large Vision-Language Models) |
|
0 | 1013 | 9월 19, 2023 |