large-vision-language-model
글 | 댓글 | 조회수 | 활동 | |
---|---|---|---|---|
CAPTURE: Multimodal LLM(LVLM)의 이미지 캡션 생성 성능 평가 지표 (벤치마크 & 평가 데이터셋) | 0 | 162 | 9월 5, 2024 | |
VLMs are blind: 시각-언어 모델이 실패하는 (인간에게는 쉬운) 시각적 작업들에 대한 연구 (feat. BlindTest) | 0 | 617 | 7월 13, 2024 | |
AnomalyGPT: 대형 시각-언어 모델을 사용한 산업 이상 탐지 (AnomalyGPT: Detecting Industrial Anomalies using Large Vision-Language Models) | 0 | 721 | 9월 19, 2023 |