DeerFlow v2: 리서치, 코딩, 창작 등의 작업을 위한 오픈소스 SuperAgent Harness (feat. ByteDance)

9bow · 3월 23, 2026, 9:30오후

DeerFlow 소개

2026년 현재 소프트웨어 엔지니어링 생태계에서는 대규모 언어 모델(LLM)을 단순한 텍스트 생성 도구를 넘어 자율적으로 작업을 수행하는 자율형 에이전트(Autonomous Agent) 형태로 발전시키는 데 집중하고 있습니다. 개발자들은 수 분에서 수 시간까지 걸리는 복잡한 작업을 스스로 계획하고 실행할 수 있는 신뢰성 높은 프레임워크를 필요로 하고 있습니다. 단순한 API 호출이나 단일 프롬프트로는 해결하기 어려운 다단계 리서치, 코드 작성, 그리고 시스템 배포와 같은 문제들이 대두되었기 때문입니다. 이러한 흐름 속에서 등장한 슈퍼 에이전트(Super Agent) 프레임워크는 AI가 실제 물리적인 환경 혹은 가상 환경과 상호작용할 수 있는 기반을 제공합니다. 이는 소프트웨어 개발 라이프사이클 전반에 걸쳐 생산성을 극대화하는 핵심 기술로 자리 잡고 있습니다.

바이트댄스(ByteDance)가 최근 2.0으로 판올림한 DeerFlow(Deep Exploration and Efficient Research Flow) 는 이러한 시대적 요구에 부응하는 강력한 오픈소스 슈퍼 에이전트 프레임워크입니다. 이 프로젝트는 단순한 챗봇이나 텍스트 생성기를 넘어, 서브 에이전트(Sub-agents), 장기 기억(Memory), 그리고 안전한 샌드박스(Sandbox)를 조율하여 복잡한 작업을 자율적으로 수행하도록 설계되었습니다.

DeerFlow는 초기 버전의 제한적인 리서치 기능을 넘어 완전한 풀스택 생태계로 진화하며 2026년 2월 말 GitHub 트렌딩 1위에 오르는 등 전 세계 개발자 커뮤니티의 큰 주목을 받았습니다. 사용자는 특정 기업의 모델에 종속되지 않고 OpenAI, DeepSeek, Gemini, Doubao 등 다양한 최신 모델을 자유롭게 선택하여 유연하게 결합할 수 있습니다. 결과적으로 개발자는 코딩, 심층 리서치, 웹 콘텐츠 창작 등 거의 모든 유형의 지식 노동을 자동화하는 강력한 런타임 환경을 갖추게 됩니다.

DeerFlow가 갖는 가장 큰 차별점은 AI 에이전트에게 온전한 권한과 도구가 부여된 실질적인 컴퓨팅 실행 환경을 제공한다는 점입니다. 기존의 많은 시스템들이 제한된 API 호출 권한을 제공하는 데 그쳤다면, DeerFlow는 에이전트가 직접 터미널 명령어를 실행하고, 파일을 편집하며, 격리된 파일 시스템에서 긴 프로젝트를 스스로 관리할 수 있는 환경을 기본으로 탑재했습니다.

또한, 작업 진행에 필요한 기능들만 그때그때 불러오는 점진적 스킬 로딩(Progressive Loading) 메커니즘을 도입하여 토큰 사용량을 최적화하고 비용 효율성을 극대화했습니다. 텔레그램, 슬랙 등 다양한 비즈니스 메신저와의 원활한 연동은 물론, 개발자들의 최신 터미널 환경인 Claude Code와의 완벽한 통합을 지원하여 개발자의 기존 작업 흐름을 전혀 방해하지 않습니다. 이러한 고도화된 특징들은 DeerFlow를 단순한 자동화 스크립트 모음이 아닌, 개발자와 능동적으로 협업하며 지식을 축적하는 지능형 파트너로 격상시켰습니다.

기존 DeerFlow 1.x 버전과의 상세 비교

DeerFlow 2.0은 이전 1.x 버전의 아키텍처에서 단순히 기능을 덧붙인 것이 아니라, 코드를 전혀 공유하지 않고 바닥부터 완전히 새롭게 재작성(Ground-up rewrite)된 버전입니다. 이전에 소개했었던 기존의 DeerFlow 1.x 버전과 비교했을 때, 다음과 같은 핵심적인 아키텍처 및 철학의 변화가 있었습니다:

실행 환경의 진화 (Python 구동 환경 vs 완벽히 격리된 AIO 샌드박스): 기존 1.x 버전은 requirements.txt로 의존성을 설치하고 단순한 Python 스크립트(main.py)를 통해 데이터 처리 및 분석을 실행하는 구조였습니다. 반면, 2.0 버전은 에이전트에게 브라우저, 셸(Shell), 파일 시스템, MCP 프로토콜, VSCode 서버를 단일 Docker 컨테이너에 결합한 완벽히 격리된 'AIO(All-in-One) 샌드박스'를 제공합니다. 에이전트가 실제 컴퓨터 운영체제를 가진 것처럼 안전하고 영구적인 가상 환경에서 동작하게 됩니다.
스킬 및 도구 관리 (내장 도구 위주 vs 점진적 확장 스킬 아키텍처): 1.x 버전은 웹 크롤러나 보고서, 팟캐스트 생성 기능 등이 시스템에 직접 하드코딩되어 고정된 형태로 내장되어 있었습니다. 2.0 버전은 마크다운(Markdown) 기반으로 정의된 독립적인 '스킬(Skills)' 시스템을 채택했습니다. 시스템은 수많은 스킬을 한 번에 불러오지 않고, 에이전트가 특정 작업에 필요한 순간에만 동적으로 로딩하는 '점진적 로딩(Progressive Loading)' 방식을 사용하여 LLM의 컨텍스트 윈도우 부담을 획기적으로 줄였습니다.
작업 스케일 및 병렬성 (Supervisor 중심 vs 다단계 동적 서브 에이전트): 1.x 버전은 "Supervisor + Handoffs"라는 명확한 패턴을 중심으로 고정된 Worker 에이전트들이 협업하는 구조에 초점을 맞추었습니다. 2.0 버전에서는 이를 더욱 고도화하여, 리드(Lead) 에이전트가 수 분에서 수 시간까지 소요되는 극도로 복잡한 작업을 분석한 뒤, 각기 격리된 컨텍스트를 가진 수많은 '서브 에이전트(Sub-Agents)'를 실시간으로 스폰(Spawn)하고 병렬로 실행시킵니다.
메모리 및 컨텍스트 시스템 (단발성 세션 vs 영구적 장기 기억 시스템): 과거 버전은 단일 작업에 대한 컨텍스트 유지에 집중했습니다. 2.0 버전에는 사용자의 프로필, 주로 사용하는 기술 스택, 코딩 선호도 등을 로컬에 영구적으로 저장하고 세션을 넘어 지속적으로 학습하는 장기 기억(Long-Term Memory) 시스템이 도입되었습니다. 특히 동일한 사실이 중복으로 저장되어 컨텍스트가 낭비되는 것을 방지하는 정교한 필터링 로직이 추가되었습니다.
통합 및 배포 방식 (단순 스크립트 vs 엔터프라이즈급 인프라 연동): 단순한 로컬 구동에 초점을 맞췄던 1.x와 달리, 2.0은 LangGraph 서버와 Node.js 기반 프론트엔드를 포함한 프로덕션 레벨의 배포를 지원합니다. 별도의 공인 IP 없이도 Slack, Telegram, Feishu 등을 지원하는 메신저(IM) 채널 통합 기능을 내장했으며, Claude Code와 같은 최신 터미널 개발 환경과의 네이티브 연동도 완벽하게 지원합니다.

DeerFlow 2.0의 주요 특징 및 기능

강력하고 독립적인 에이전트 런타임 환경

                        ┌──────────────────────────────────────┐
                        │          Nginx (Port 2026)           │
                        │      Unified reverse proxy           │
                        └───────┬──────────────────┬───────────┘
                                │                  │
              /api/langgraph/*  │                  │  /api/* (other)
                                ▼                  ▼
               ┌────────────────────┐  ┌────────────────────────┐
               │ LangGraph Server   │  │   Gateway API (8001)   │
               │    (Port 2024)     │  │   FastAPI REST         │
               │                    │  │                        │
               │ ┌────────────────┐ │  │ Models, MCP, Skills,   │
               │ │  Lead Agent    │ │  │ Memory, Uploads,       │
               │ │  ┌──────────┐  │ │  │ Artifacts              │
               │ │  │Middleware│  │ │  └────────────────────────┘
               │ │  │  Chain   │  │ │
               │ │  └──────────┘  │ │
               │ │  ┌──────────┐  │ │
               │ │  │  Tools   │  │ │
               │ │  └──────────┘  │ │
               │ │  ┌──────────┐  │ │
               │ │  │Subagents │  │ │
               │ │  └──────────┘  │ │
               │ └────────────────┘ │
               └────────────────────┘

격리된 AIO(All-in-One) 샌드박스와 파일 시스템: DeerFlow 2.0의 가장 큰 특징은 에이전트가 사고하는 것에 그치지 않고 물리적인 파일과 시스템에 직접 개입할 수 있다는 것입니다. 모든 주요 작업은 Docker 기반의 완전히 격리된 컨테이너 내부에서 실행됩니다. 샌드박스 내부에는 사용자가 업로드한 파일을 보관하는 /mnt/user-data/uploads/, 에이전트가 자유롭게 코드를 짜고 테스트하는 /workspace/, 그리고 최종 산출물이 저장되는 /outputs/ 폴더가 명확히 분리되어 있습니다. 에이전트는 이 샌드박스 안에서 Bash 명령어를 실행하고, 의존성을 설치하며, 심지어 이미지를 렌더링하고 비디오 컴포지션을 수행하는 등 제약 없는 활동을 안전하게 수행할 수 있습니다.

점진적으로 로딩되는 스킬(Skills)과 확장 가능한 도구(Tools): 시스템의 범용성을 넓히기 위해 DeerFlow는 스킬(Skills) 아키텍처를 도입했습니다. 스킬은 특정 작업을 어떻게 수행할지에 대한 모범 사례와 워크플로우를 담은 구조화된 마크다운 모듈입니다. 기본적으로 리서치, 보고서 생성, 슬라이드 제작, 웹페이지 퍼블리싱 기능이 포함되어 있으며, 사용자가 직접 만든 커스텀 스킬을 /mnt/skills/custom/ 디렉토리에 추가하여 확장할 수 있습니다. 핵심은 이 스킬들이 토큰을 낭비하지 않도록 작업에 꼭 필요한 시점에만 동적으로 로딩된다는 점입니다. 이 외에도 MCP(Model Context Protocol) 서버 연동을 통해 다양한 서드파티 도구와 데이터소스를 손쉽게 연결할 수 있습니다.

지능형 멀티 에이전트 작업 처리 체계

동적 서브 에이전트(Sub-Agents) 오케스트레이션: 현업의 과제들은 대부분 한 번의 프롬프트나 단일 사고 흐름으로 해결되지 않습니다. DeerFlow의 리드 에이전트는 사용자의 복잡한 지시를 받으면 이를 논리적인 하위 작업들로 분해(Decomposition)합니다. 이후 리드 에이전트는 필요한 수만큼의 서브 에이전트들을 즉석에서 스폰(Spawn)합니다. 각 서브 에이전트는 메인 에이전트의 불필요한 컨텍스트로부터 완벽하게 격리된 채 오직 자신에게 할당된 작업(예: 특정 기술 스택에 대한 논문 검색, 병렬 코드 테스트 등)에만 집중합니다. 개별 서브 에이전트의 작업이 완료되면, 리드 에이전트가 이들의 구조화된 결과물들을 취합하여 최종적이고 일관된 하나의 결과물로 엮어냅니다.

컨텍스트 엔지니어링 및 영구적 장기 기억(Long-Term Memory): 장시간 켜놓고 사용하는 에이전트의 고질적인 문제는 '컨텍스트 윈도우 한계'입니다. 이를 극복하기 위해 DeerFlow는 완료된 하위 작업을 공격적으로 요약(Aggressive Summarization)하고, 중간 진행 과정에서 생성된 방대한 텍스트나 데이터를 샌드박스의 파일 시스템으로 오프로드(Offload)하는 메커니즘을 사용합니다. 이에 더해 한 번의 대화 세션이 종료되더라도 사용자의 작업 스타일, 선호하는 언어, 빈번한 오타 습관 등을 로컬 시스템에 영구적인 기억으로 기록합니다. 메모리 업데이트 시에는 중복되는 사실(Fact entries)을 건너뛰는 스마트 적용 기능이 탑재되어 장기간 사용해도 기억의 파편화나 팽창 현상을 겪지 않습니다.

유연한 외부 생태계 및 도구 통합

Claude Code 터미널 네이티브 연동: 최신 개발 트렌드를 반영하여, Anthropic이 선보인 터미널 환경 도구인 Claude Code와 긴밀하게 통합됩니다. claude-to-deerflow 스킬을 패키지 매니저로 설치하면, 개발자는 에디터나 터미널 화면을 벗어날 필요 없이 곧바로 /claude-to-deerflow 명령어를 입력하여 백그라운드에서 실행 중인 DeerFlow 인스턴스를 호출할 수 있습니다. 이를 통해 코딩 중 필요한 심층 리서치를 에이전트에게 지시하거나, 작업의 진행 상태를 스트리밍 형태로 실시간 모니터링할 수 있습니다.

메신저(IM) 채널 지원 및 InfoQuest 검색 엔진: 팀 단위의 협업이나 모바일 환경에서의 접근을 돕기 위해 텔레그램(Telegram), 슬랙(Slack), 페이슈/라크(Feishu/Lark)와 같은 메신저 봇 연동을 기본 지원합니다. 웹소켓(WebSocket) 및 롱 폴링 방식을 채택하여 개발자가 라우터 설정이나 공인 IP를 할당받는 번거로움 없이도 config.yaml에 토큰만 입력하면 즉시 사용할 수 있습니다. 또한, BytePlus가 독자적으로 개발한 지능형 검색 및 크롤링 툴셋인 InfoQuest를 새롭게 통합하여 현존 최고 수준의 실시간 웹 데이터 수집 및 분석 능력을 확보했습니다.

DeerFlow v2 설치 및 사용 방법

DeerFlow 2.0은 LangGraph 에이전트 서버와 데이터베이스, 프론트엔드 환경이 복합적으로 구성되어 있으므로 공식적으로 Docker 기반의 실행을 강력히 권장합니다.

# 1. 저장소 복제(clone)
git clone https://github.com/bytedance/deer-flow.git
cd deer-flow

# 2. 로컬 설정 파일 템플릿 복사 및 생성
make config

# (이 단계에서 프로젝트 루트에 생성된 config.yaml과 .env 파일을 수정하여 OpenAI/DeepSeek 등의 API 키를 입력합니다)

# 3. Docker 기반 개발 런타임 환경 시작 (AIO 샌드박스 이미지 풀링 및 자동 인식 포함)
make docker-init  # 최초 1회, 샌드박스 이미지를 가져옵니다.
make docker-start # 서비스 구동 (기본 접속 포트: http://localhost:2026)

Python 코드 내부에 직접 임베딩하여 파이썬 라이브러리처럼 호출하고자 하는 개발자는 내장된 DeerFlowClient를 임포트하여 사용할 수도 있습니다.

라이선스

DeerFlow 프로젝트는 MIT License로 전체 코드가 공개 및 배포되고 있습니다. 제약 없이 개인 및 상업적 목적의 활용과 수정이 가능합니다.

DeerFlow 공식 홈페이지

DeerFlow 프로젝트 GitHub 저장소

이 글은 GPT 모델로 정리한 글을 바탕으로 한 것으로, 원문의 내용 또는 의도와 다르게 정리된 내용이 있을 수 있습니다. 관심있는 내용이시라면 원문도 함께 참고해주세요! 읽으시면서 어색하거나 잘못된 내용을 발견하시면 덧글로 알려주시기를 부탁드립니다.

파이토치 한국 사용자 모임이 정리한 이 글이 유용하셨나요? 회원으로 가입하시면 주요 글들을 이메일로 보내드립니다! (기본은 Weekly지만 Daily로 변경도 가능합니다.)

아래쪽에 좋아요를 눌러주시면 새로운 소식들을 정리하고 공유하는데 힘이 됩니다~