파이토치 한국 사용자 모임
screen-parsing
글
댓글
조회수
활동
OmniParser, Microsoft가 공개한 순수 Vision 기반의 GUI Agent 연구 (feat. GPT-4V)
읽을거리&정보공유
llm-agent
,
microsoft
,
paper
,
set-of-mark
,
multimodal-agent
,
omniparser
,
gui-agent
,
mind2web
,
screenspot
,
local-semantics
,
seeassign
,
screen-parsing
0
690
10월 29, 2024