Browser-Use 소개
Browser-Use는 대규모 언어 모델(LLM)을 활용해 브라우저 내에서 웹사이트와 상호작용할 수 있는 기능을 제공하는 오픈소스 웹 자동화 라이브러리입니다. Browser-Use 라이브러리는 LangChain과 연동하여 웹 자동화를 수행하며, 여러 웹 페이지의 정보를 수집하고 처리하는 작업을 자동화합니다. 사용자는 이 라이브러리를 통해 다양한 웹 작업(예: 웹 데이터 수집, 자동 검색)을 자동화할 수 있습니다. 이를 통해 일상적인 웹 탐색 작업이나 특정 정보 수집 업무를 효율적으로 처리할 수 있습니다.
Browser-Use가 제공하는 기능은 다음과 같습니다:
- 언어 모델 통합: 다양한 LLM과 통합하여 언어 기반 웹 자동화 작업 수행.
- 상호작용 요소 탐지: 버튼이나 입력 필드 같은 상호작용 가능한 웹 요소를 자동으로 감지.
- 멀티탭 관리: 여러 브라우저 탭을 효율적으로 관리하여 다양한 작업 수행.
- XPath 추출 기능: 특정 요소를 위한 XPath를 제공하여 정보 추출을 더욱 쉽게 함.
- 비전 모델 지원: 시각적인 정보 처리가 가능해 이미지 기반 탐색 작업도 지원.
- 동적 콘텐츠 처리: 쿠키 및 동적으로 변경되는 콘텐츠를 자동으로 관리.
- 자율 오류 수정: LLM이 오류를 인식하고 자율적으로 수정해 오류 발생 시 반복 수행을 줄임.
또한, Browser-Use는 LangChain을 통해 다양한 LLM 모델과 호환됩니다. 현재 지원되는 모델은 GPT-4o, GPT-4o Mini, Claude 3.5 Sonnet, LLama 3.1 405B 등이 있습니다.
빠른 시작
아래는 Browser-Use를 사용하여 LLM으로 HackerNews 웹사이트에서 상위 10개 게시물의 제목, 점수, 시간 정보를 가져오고, 각 게시물의 점수 대비 시간 비율을 계산하는 간단한 예제입니다.
from langchain_openai import ChatOpenAI
from browser_use import Agent
agent = Agent(
# HackerNews의 상위 10개 게시물 제목, 점수, 시간을 가져오고, 각 점수 대비 시간 비율을 계산해 주세요.
task="Go to hackernews on show hn and give me top 10 post titles, their points and hours. Calculate for each the ratio of points per hour.",
llm=ChatOpenAI(model="gpt-4o"),
)
await agent.run()
실행 결과는 다음과 같습니다:
실행 데모
항공권 조회 데모
프롬프트: kayak.com으로 이동하여 2025년 1월 12일 취리히에서 샌프란시스코로 출발하는 편도 항공편을 찾으세요. (2.5배 속도)
Prompt: Go to kayak.com and find a one-way flight from Zürich to San Francisco on 12 January 2025. (2.5x speed)
이미지 검색 데모
프롬프트: 새 탭을 열고 다음 인물에 대한 이미지를 검색합니다: 알버트 아인슈타인, 오프라 윈프리, 스티브 잡스. (2.5배 속도)
Prompt: Opening new tabs and searching for images for these people: Albert Einstein, Oprah Winfrey, Steve Jobs. (2.5x speed)
제한 사항
Browser-Use 사용 시 다음과 같은 제한 사항이 있습니다:
- 성능 저하: 추출할 콘텐츠가 많아지면 메시지 길이가 길어지고, 처리 속도가 느려질 수 있습니다.
- 비용 문제: 에이전트 하나당 약 0.01달러의 비용이 소요됩니다.
- 반복 작업: 일부 작업에서 동일한 작업을 반복하는 경향이 있습니다.
- 요소 미추출: 일부 상호작용 요소가 추출되지 않을 수 있습니다.
라이선스
Browser-Use는 MIT License로 공개 및 배포되고 있습니다.
Browser-Use GitHub 저장소
https://github.com/gregpr07/browser-use
이 글은 GPT 모델로 정리한 글을 바탕으로 한 것으로, 원문의 내용 또는 의도와 다르게 정리된 내용이 있을 수 있습니다. 관심있는 내용이시라면 원문도 함께 참고해주세요! 읽으시면서 어색하거나 잘못된 내용을 발견하시면 덧글로 알려주시기를 부탁드립니다.
파이토치 한국 사용자 모임
이 정리한 이 글이 유용하셨나요? 회원으로 가입하시면 주요 글들을 이메일
로 보내드립니다! (기본은 Weekly지만 Daily로 변경도 가능합니다.)
아래
쪽에 좋아요
를 눌러주시면 새로운 소식들을 정리하고 공유하는데 힘이 됩니다~