BrowserOS 소개
웹 브라우저는 현대 인터넷 사용의 핵심 도구이지만, 대부분의 브라우저는 AI 에이전트와의 깊은 통합을 고려하지 않고 설계되었습니다. BrowserOS는 이러한 한계를 넘어서, AI 에이전트 기능을 브라우저 자체에 내장한 오픈소스 Chromium 기반 브라우저입니다. ChatGPT Atlas, Perplexity Comet, Dia 등 유사한 AI 통합 브라우저들의 오픈소스 대안으로 등장한 BrowserOS는 10,000개 이상의 GitHub 스타를 기록하며 개발자 커뮤니티에서 빠르게 주목받고 있습니다. AGPL-3.0 라이선스로 공개된 이 프로젝트는 브라우저와 AI 에이전트, MCP(Model Context Protocol) 서버를 하나의 통합 환경에서 제공합니다.
BrowserOS의 핵심 특징은 단순히 AI 챗봇을 브라우저에 붙여넣은 것이 아니라, AI 에이전트가 브라우저 자체를 도구로 활용할 수 있도록 53가지 이상의 브라우저 자동화 도구를 내장했다는 점입니다. 자연어 명령으로 웹 페이지 탐색, 클릭, 텍스트 입력, 데이터 추출 등의 작업을 수행할 수 있으며, Claude Code를 포함한 다양한 MCP 클라이언트와 통합하여 로컬 파일 시스템 접근 및 복잡한 자동화 워크플로우 구성도 가능합니다. Kimi K2.5를 기본 모델로 사용하며, ChatGPT, Claude, Gemini, GPT-4o/o3, Azure OpenAI, AWS Bedrock, OpenRouter를 비롯한 다양한 클라우드 모델과 Ollama, LM Studio 등의 로컬 모델도 지원합니다.
| BrowserOS | Chrome | Brave | Dia | Comet | Atlas | |
|---|---|---|---|---|---|---|
| Open Source | ||||||
| AI Agent | ||||||
| MCP Server | ||||||
| Visual Workflows | ||||||
| Cowork (files + browser) | ||||||
| Scheduled Tasks | ||||||
| Bring Your Own Keys | ||||||
| Local Models (Ollama) | ||||||
| Local-first Privacy | ||||||
| Ad Blocking (MV2) |
BrowserOS의 주요 기능
BrowserOS는 14가지 핵심 기능 영역을 중심으로 구성되어 있습니다. AI 에이전트(AI Agent) 기능은 53가지 이상의 브라우저 자동화 도구를 통해 자연어 명령으로 웹 작업을 처리하며, MCP 서버(MCP Server) 기능을 통해 Claude Code를 비롯한 외부 에이전트 클라이언트와 쉽게 연결할 수 있습니다. 비주얼 워크플로우(Visual Workflows)는 그래프 기반의 자동화 빌더로, 복잡한 자동화 파이프라인을 시각적으로 설계할 수 있게 해줍니다.
Cowork 기능은 브라우저 자동화와 로컬 파일 시스템 작업을 결합하여, 웹에서 데이터를 가져와 로컬 파일로 저장하거나 반대로 로컬 파일을 웹에 업로드하는 작업을 자연스럽게 연결합니다. 스케줄 작업(Scheduled Tasks) 기능으로 특정 간격이나 조건에 따라 자동화 태스크를 예약 실행할 수 있으며, 메모리(Memory Systems) 시스템은 대화 간에 컨텍스트를 유지하여 AI 에이전트가 이전 작업의 맥락을 기억할 수 있게 합니다. SOUL.md는 AI의 개성과 행동 지침을 정의할 수 있는 독특한 기능으로, 사용자가 자신만의 AI 어시스턴트 캐릭터를 설정할 수 있습니다.
또한 40가지 이상의 앱 통합을 MCP를 통해 지원하며, Gmail, Slack, GitHub, Linear, Notion, Figma, Salesforce 등 주요 생산성 도구들과 연결할 수 있습니다. LLM 허브(LLM Hub)는 여러 모델을 나란히 비교하는 인터페이스를 제공하며, uBlock Origin을 통한 광고 차단과 Manifest V2 지원도 포함되어 있습니다.
BrowserOS의 아키텍처
BrowserOS는 모노레포 구조로 두 개의 주요 서브시스템으로 구성됩니다. 브라우저 서브시스템은 Python 빌드 시스템을 갖춘 Chromium 포크이며, 에이전트 플랫폼은 TypeScript와 Go로 구현되어 있습니다. 핵심 패키지로는 browseros(코어), server(Bun 기반 MCP 서버), agent(브라우저 확장), cli(Go 기반 터미널 도구), agent-sdk(Node.js SDK), cdp-protocol(타입 안전 바인딩)이 포함됩니다.
지원 LLM 제공업체
| Provider | Type | Auth |
|---|---|---|
| Kimi K2.5 | Cloud (default) | Built-in |
| ChatGPT Pro/Plus | Cloud | OAuth |
| GitHub Copilot | Cloud | OAuth |
| Qwen Code | Cloud | OAuth |
| Claude (Anthropic) | Cloud | API key |
| GPT-4o / o3 (OpenAI) | Cloud | API key |
| Gemini (Google) | Cloud | API key |
| Azure OpenAI | Cloud | API key |
| AWS Bedrock | Cloud | IAM credentials |
| OpenRouter | Cloud | API key |
| Ollama | Local | Setup |
| LM Studio | Local | Setup |
BrowserOS는 다양한 LLM 제공업체를 지원합니다. 클라우드 모델로는 Kimi K2.5(기본), ChatGPT Pro/Plus, GitHub Copilot, Qwen Code, Claude, GPT-4o/o3, Gemini, Azure OpenAI, AWS Bedrock, OpenRouter 등을 지원합니다. 로컬 모델 실행을 위해서는 Ollama와 LM Studio와의 통합을 지원하여, 인터넷 없이도 프라이버시를 보호하며 AI 기능을 사용할 수 있습니다.
BrowserOS 설치 및 사용법
BrowserOS는 macOS, Windows, Linux 모든 주요 플랫폼을 지원합니다. 각 플랫폼에 맞는 설치 파일(macOS: DMG, Windows: EXE, Linux: AppImage 또는 .deb)을 공식 홈페이지에서 다운로드할 수 있습니다.
CLI를 통한 설치도 지원합니다:
macOS/Linux:
curl -fsSL https://cdn.browseros.com/cli/install.sh | bash
Windows (PowerShell):
irm https://cdn.browseros.com/cli/install.ps1 | iex
설치 후에는 브라우저를 열고 AI 에이전트 패널을 활성화하여 자연어로 웹 작업을 지시할 수 있습니다. Claude Code 등의 MCP 클라이언트와 통합하려면 내장 MCP 서버 설정에서 연결 정보를 확인하여 클라이언트에 추가하면 됩니다.
라이선스
BrowserOS 프로젝트는 AGPL-3.0 라이선스로 공개되어 있습니다. 오픈소스로 자유롭게 사용, 수정이 가능하나, 수정된 버전을 배포 시에는 동일한 라이선스 조건(소스 코드 공개)을 따라야 합니다.
BrowserOS 공식 홈페이지
BrowserOS 문서 사이트
BrowserOS 프로젝트 GitHub 저장소
더 읽어보기
이 글은 GPT 모델로 정리한 글을 바탕으로 한 것으로, 원문의 내용 또는 의도와 다르게 정리된 내용이 있을 수 있습니다. 관심있는 내용이시라면 원문도 함께 참고해주세요! 읽으시면서 어색하거나 잘못된 내용을 발견하시면 덧글로 알려주시기를 부탁드립니다. ![]()
파이토치 한국 사용자 모임
이 정리한 이 글이 유용하셨나요? 회원으로 가입하시면 주요 글들을 이메일
로 보내드립니다! (기본은 Weekly지만 Daily로 변경도 가능합니다.)
아래
쪽에 좋아요
를 눌러주시면 새로운 소식들을 정리하고 공유하는데 힘이 됩니다~ ![]()
