Moltbot 소개
Moltbot은 사용자의 로컬 환경 또는 개인 서버에서 직접 구동되는 오픈소스 AI 에이전트이자 개인 비서 플랫폼입니다. "The lobster way
"라는 독특한 슬로건을 가진 이 프로젝트는, 단순히 웹 브라우저에서 대화하는 챗봇을 넘어 사용자의 모든 커뮤니케이션 채널과 디지털 환경 전반에 깊숙하게 관여하고 이를 하나로 연결하는 'AI 게이트웨이(Gateway)' 역할을 지향합니다. 즉, 사용자의 개인 장비(로컬 컴퓨터, 서버 등)를 거점으로 삼아 동작하며, 사용자가 즐겨 쓰는 다양한 메신저 앱과 강력한 LLM(대규모 언어 모델) 사이를 연결하는 게이트웨이(Gateway) 겸 신경망 역할을 수행합니다.
Moltbot은 초기 Anthropic의 Claude 모델을 주로 활용하는 봇이라는 의미와, 랍스터(Lobster)의 집게발(claw)이라는 중의적인 의미를 담아 Clawdbot으로 이름을 지었습니다. 하지만, 최근 이름을 Moltbot으로 변경하고 있습니다. 이에 따라 홈페이지 및 GitHub 저장소에서는 이름 변경이 진행 중이며, 일부 사이트/패키지가 정상적으로 접속/설치되지 않을 수 있습니다.
Moltbot의 핵심은 연결성과 제어권입니다. 현재 대부분의 상용 AI 서비스는 공급자의 클라우드 서버 내에 데이터가 갇혀 있고, 웹사이트나 전용 앱을 통해서만 접근할 수 있습니다. 반면 Moltbot은 사용자가 자신의 데이터와 도구에 대한 통제권을 100% 가질 수 있도록 설계되었습니다. 사용자는 WhatsApp이나 Telegram, Discord와 같은 친숙한 메신저를 통해 Moltbot에게 작업을 지시할 수 있으며, Moltbot은 단순한 답변 생성을 넘어 사용자의 컴퓨터에서 직접 파일을 검색하거나, 웹을 브라우징하고, 캘린더 일정을 관리하는 등 실질적인 행동을 수행합니다.
Moltbot은 특히 '연결성'에 중점을 둡니다. Anthropic의 Claude, OpenAI의 GPT 시리즈, 또는 Ollama를 통해 구동되는 로컬 모델 등 다양한 '두뇌'를 연결할 수 있으며, 이 지능을 사용자의 일상적인 커뮤니케이션 채널로 확장시킵니다. 개발자나 파워 유저는 이를 통해 자신만의 맞춤형 자동화 워크플로우를 구축할 수 있으며, 반복적인 작업이나 정보 검색, 시스템 제어 등을 대화형 인터페이스(ChatOps)로 통합하여 처리할 수 있게 됩니다. 이는 마치 영화 '아이언맨'의 자비스(JARVIS)처럼, 내 인프라 위에서 나만을 위해 24시간 대기하는 비서를 구축하는 것과 같습니다.
Moltbot vs. 기존 SaaS형 챗봇 비교
Moltbot은 ChatGPT나 Claude.ai와 같은 일반적인 SaaS(Software as a Service)형 AI 챗봇과는 근본적인 아키텍처와 활용 철학에서 뚜렷한 차이를 보입니다.
가장 큰 차이점은 실행 주체와 환경입니다. 일반적인 AI 서비스는 모든 연산과 데이터 처리가 서비스 제공업체의 중앙 서버에서 이루어집니다. 따라서 사용자는 해당 업체가 제공하는 인터페이스와 기능 범위 내에서만 활동할 수 있습니다. 하지만 Moltbot은 사용자의 로컬 머신이나 개인 서버(VPS)에서 직접 실행됩니다. 이는 AI가 사용자의 로컬 파일 시스템(fs)에 접근하거나, 로컬 네트워크 내의 다른 장비를 제어하는 등 물리적인 환경과 상호작용할 수 있음을 의미합니다. 즉, AI가 단순히 "텍스트를 생성하는 도구"가 아니라 "내 컴퓨터를 조작할 수 있는 대리인"이 되는 것입니다.
또한 접근 채널의 통합 측면에서도 차별화됩니다. 기존 서비스들은 파편화되어 있어, 업무용으로는 Slack, 개인용으로는 카카오톡이나 Telegram을 쓰는 사용자가 AI를 쓰기 위해 별도의 웹사이트를 켜야 하는 불편함이 있었습니다. Moltbot은 이 장벽을 허뭅니다. 사용자가 WhatsApp으로 이동하든, Discord로 이동하든, 혹은 iMessage를 사용하든 Moltbot은 그 모든 채널에 동시에 존재하며, 모든 대화의 맥락(Context)과 기억(Memory)을 공유합니다. 텔레그램에서 지시한 파일 분석 작업을 퇴근길에 iMessage로 결과를 받아보는 식의 끊김 없는 경험을 제공합니다.
Moltbot의 주요 특징 및 기능
로컬 중심의 유니버설 게이트웨이 (The Gateway)
WhatsApp / Telegram / Slack / Discord / Google Chat / Signal / iMessage / BlueBubbles / Microsoft Teams / Matrix / Zalo / Zalo Personal / WebChat
│
▼
┌───────────────────────────────┐
│ Gateway │
│ (control plane) │
│ ws://127.0.0.1:18789 │
└──────────────┬────────────────┘
│
├─ Pi agent (RPC)
├─ CLI (clawdbot …)
├─ WebChat UI
├─ macOS app
└─ iOS / Android nodes
Moltbot 시스템의 심장부는 '게이트웨이'입니다. 이는 Node.js 기반으로 작동하는 서버 애플리케이션으로, 사용자의 로컬 환경에 설치되어 모든 트래픽과 로직을 제어합니다. 게이트웨이는 외부 메신저로부터 들어오는 메시지를 수신하여 적절한 AI 모델로 라우팅하고, AI의 응답을 다시 메신저로 전송하는 역할을 합니다.
이 과정에서 가장 중요한 것은 보안입니다. Moltbot은 무작위로 들어오는 메시지에 반응하지 않으며, 엄격한 페어링(Pairing) 시스템을 통해 인증된 사용자(Admin)의 메시지만 처리합니다. 사용자는 설치 시 생성되는 페어링 코드를 통해 자신의 메신저 계정을 승인해야만 봇과 대화할 수 있습니다.
노드(Nodes)와 앱: 물리적 확장
또한, Moltbot은 서버(Gateway)와 클라이언트(Node/App)를 분리하여 확장성을 극대화했습니다.
-
macOS App: 단순한 앱이 아니라 메뉴바에 상주하는 컨트롤 플레인입니다. Voice Wake 기능을 통해 음성 호출이 가능하며, Talk Mode 오버레이를 통해 화면을 보며 AI와 대화할 수 있습니다. 또한 원격 게이트웨이를 제어하는 리모컨 역할도 수행합니다.
-
Mobile Nodes (iOS/Android): 모바일 앱은 '노드'로 작동하여 스마트폰의 카메라, 스크린 레코딩, 위치 정보(Location) 기능을 AI에게 제공합니다. Bonjour 프로토콜을 이용해 로컬 네트워크에서 자동으로 게이트웨이와 페어링됩니다.
-
macOS Node Mode: macOS 등 데스크톱 환경을 노드로 설정하면, AI가
system.run명령어로 쉘 스크립트를 실행하거나 시스템 알림을 보내고, 화면을 캡처(Canvas exposure)하는 등 OS 수준의 제어권을 갖게 됩니다.
광범위한 멀티 채널 및 미디어 통합 (Multi-channel Inbox)
Moltbot은 현존하는 대부분의 주요 커뮤니케이션 플랫폼을 지원하는 받은 편지함(Inbox) 기능을 제공합니다. Moltbot이 지원하는 플랫폼은 다음과 같습니다:
- Channels: WhatsApp (Baileys), Telegram (grammY), Slack (Bolt), Discord (discord.js), Google Chat (Chat API), Signal (signal-cli), iMessage (imsg), BlueBubbles (extension), Microsoft Teams (extension), Matrix (extension), Zalo (extension), Zalo Personal (extension), WebChat.
이러한 플랫폼들을 통해 단순히 텍스트만 주고받는 것이 아닙니다. Moltbot은 멀티모달(Multi-modal) 기능을 통해 음성 메모, 이미지, 문서 파일(PDF 등)을 원활하게 처리합니다.
예를 들어, 사용자가 운전 중에 텔레그램으로 음성 메시지를 보내면, Moltbot은 이를 텍스트로 변환하여 이해하고 적절한 작업을 수행한 뒤 음성으로 다시 응답할 수 있습니다. 또한, 사용자가 전송한 문서를 읽고 요약하거나, 이미지를 분석하는 작업도 대화창 내에서 즉시 수행됩니다.
행동하는 AI: 스킬(Skills) 및 도구(Tools) 시스템
Moltbot의 진정한 가치는 스킬(Skill) 시스템에 있습니다. 이는 AI가 외부 세계와 상호작용할 수 있게 해주는 기능 모듈입니다. 기본적으로 제공되는 스킬 외에도 사용자가 직접 TypeScript로 스킬을 작성하여 기능을 확장할 수 있습니다.
-
시스템 제어: 로컬 파일 시스템 읽기/쓰기, 터미널 명령어 실행(Shell), 화면 캡처 등이 가능하여 원격 서버 관리 도구로도 활용될 수 있습니다.
-
웹 및 정보 검색: Puppeteer 등을 활용한 브라우저 자동화 도구를 통해 웹페이지를 방문하여 정보를 긁어오거나, 특정 작업을 대신 수행할 수 있습니다. 실시간 검색 기능을 통해 최신 뉴스나 주가 정보를 조회하는 것도 가능합니다.
-
생산성 도구 연동: Google Calendar와 연동하여 일정을 관리하거나, Linear와 같은 이슈 트래킹 도구, Notion과 같은 메모 앱과 연결하여 프로젝트 관리를 돕습니다.
-
시각적 상호작용 (Live Canvas): 복잡한 정보나 UI가 필요할 때, 텍스트 대신 'Live Canvas'라는 별도의 웹 뷰를 생성하여 시각적인 정보를 렌더링하고 사용자와 상호작용합니다.
그 외에도 다양한 도구들을 사용하여 단순 대화를 넘어 실질적인 작업을 수행할 수 있습니다:
-
브라우저 제어 (Browser Control): 단순한 HTTP 요청이 아니라, 전용 Chrome/Chromium 인스턴스를 띄워 제어합니다. 이를 통해 웹페이지 스냅샷을 찍거나, 복잡한 사용자 행동(클릭, 입력)을 시뮬레이션하고, 파일 업로드까지 수행할 수 있습니다. 브라우저 프로필 관리도 가능하여 로그인 세션을 유지할 수 있습니다.
-
Canvas & A2UI: 텍스트만으로 부족한 정보는 Canvas라는 별도의 UI 영역을 통해 전달됩니다. 특히 A2UI (Agent to UI) 기술을 통해 에이전트가 직접 HTML/JS 코드를 생성하고 렌더링하여 사용자에게 인터랙티브한 대시보드나 시각 자료를 즉석에서 만들어 보여줍니다.
-
자동화: 정해진 시간에 작업을 수행하는 Cron Jobs, 외부 시스템의 이벤트를 수신하는 Webhooks, 그리고 이메일을 트리거로 사용하는 Gmail Pub/Sub 연동을 통해 업무 자동화의 허브 역할을 수행합니다.
자율 에이전트 기능: 스케줄러(Cron) 및 메모리
Moltbot은 사용자가 말을 걸 때만 반응하는 수동적인 봇이 아닙니다. 내장된 Cron 스케줄러를 통해 사용자가 지정한 시간에 특정 작업을 수행하고 먼저 말을 걸 수 있습니다. 예를 들어 "매일 아침 7시에 주요 IT 뉴스 헤드라인을 요약해서 보내줘"라거나, "매시간 서버 상태를 체크해서 이상이 있으면 보고해"와 같은 지시가 가능합니다.
또한, 영구적인 메모리(Persistent Memory) 시스템을 갖추고 있어 과거의 대화 내용이나 사용자의 선호도, 저장된 정보를 기억하고 이를 장기적으로 활용합니다. 이는 일회성 대화에 그치는 기존 LLM 서비스와 달리, 시간이 지날수록 사용자를 더 잘 이해하는 개인 비서로 진화할 수 있는 기반이 됩니다.
운영 및 보안 (Ops & Safety)
Moltbot은 개발자가 직접 운영하는 시스템인 만큼 배포와 보안에도 신경을 썼습니다:
- 배포 유연성: Docker를 통한 컨테이너 배포는 물론, Nix를 통한 선언적(Declarative) 설정 관리를 지원하여 재현 가능한 인프라 구성을 돕습니다.
- 원격 접속: 외부에서 안전하게 로컬 게이트웨이에 접근할 수 있도록 Tailscale Serve/Funnel을 네이티브하게 지원하며, 토큰/비밀번호 인증 기반의 SSH 터널링 기능도 제공합니다.
- 안정성: 모델이나 API 호출 실패 시 자동으로 재시도(Retry Policy)하거나 다른 모델로 전환(Model Failover)하는 로직이 내장되어 있어 서비스 중단을 최소화합니다. 또한 사용량 추적(Usage Tracking) 기능을 통해 API 비용이나 리소스 사용량을 모니터링할 수 있습니다.
Moltbot 설치 및 시작하기
Moltbot은 개발자 친화적인 환경을 제공하며, Node.js v22 이상이 설치된 환경이라면 어디서든 구동 가능합니다.
기본적으로는 npm 패키지 매니저를 통해 전역으로 설치한 후, clawdbot onboard 명령어를 통해 대화형 설정 마법사를 실행할 수 있습니다. 이 과정에서 사용할 LLM 제공자(Anthropic, OpenAI 등)의 API 키를 입력하고, 연동할 메신저 채널을 설정하게 됩니다:
# Node.js 22 이상 필요
npm install -g clawdbot@latest
# 설치 마법사 실행 (Gateway, 채널, 스킬 설정 포함)
clawdbot onboard --install-daemon
설치 후에는 다음과 같이 게이트웨이를 실행하고 메시지 전송 등을 테스트해볼 수 있습니다:
# 게이트웨이 실행
clawdbot gateway --port 18789 --verbose
# 메시지 전송 테스트
clawdbot message send --to +1234567890 --message "Hello from Moltbot"
Moltbot은 로컬 PC 외에도 지속적인 가동을 위해 다양한 호스팅 옵션을 지원합니다:
-
Docker: 컨테이너 기반의 배포를 완벽하게 지원하여, 복잡한 의존성 설정 없이 깔끔하게 실행할 수 있습니다.
-
클라우드 호스팅: Railway, Replit, Coolify와 같은 PaaS 플랫폼이나, 저렴한 VPS(가상 사설 서버)에 배포할 수 있는 가이드와 설정 파일을 제공합니다.
-
Homebrew: macOS 사용자를 위한 패키지 관리자 Homebrew를 통한 설치도 지원합니다.
라이선스
Moltbot 프로젝트는 MIT 라이선스 하에 배포되고 있습니다. 따라서 개인적인 용도는 물론 상업적인 용도로도 자유롭게 사용, 수정 및 재배포가 가능합니다. 단, 연결하여 사용하는 외부 LLM 서비스(Anthropic API 등)의 각 서비스의 이용 약관은 별도로 확인해야 합니다.
Moltbot/Clawdbot 공식 홈페이지
Moltbot/Clawdbot 관련 문서 및 가이드
Moltbot/Clawdbot 프로젝트 GitHub 저장소
이 글은 GPT 모델로 정리한 글을 바탕으로 한 것으로, 원문의 내용 또는 의도와 다르게 정리된 내용이 있을 수 있습니다. 관심있는 내용이시라면 원문도 함께 참고해주세요! 읽으시면서 어색하거나 잘못된 내용을 발견하시면 덧글로 알려주시기를 부탁드립니다. ![]()
파이토치 한국 사용자 모임
이 정리한 이 글이 유용하셨나요? 회원으로 가입하시면 주요 글들을 이메일
로 보내드립니다! (기본은 Weekly지만 Daily로 변경도 가능합니다.)
아래
쪽에 좋아요
를 눌러주시면 새로운 소식들을 정리하고 공유하는데 힘이 됩니다~ ![]()

