파이토치 한국 사용자 모임
lvlm
글
댓글
조회수
활동
CAPTURE: Multimodal LLM(LVLM)의 이미지 캡션 생성 성능 평가 지표 (벤치마크 & 평가 데이터셋)
읽을거리&정보공유
multimodal
,
vision-language
,
large-vision-language-model
,
benchmark
,
capture
,
evaluation
,
mllm-benchmark
,
lvlm
,
image-captioning
0
242
9월 5, 2024