파이토치 한국 사용자 모임

capture

글		댓글	조회수	활동
CAPTURE: Multimodal LLM(LVLM)의 이미지 캡션 생성 성능 평가 지표 (벤치마크 & 평가 데이터셋) 읽을거리&정보공유 multimodal , vision-language , large-vision-language-model , benchmark , capture , evaluation , mllm-benchmark , lvlm , image-captioning		0	678	9월 5, 2024