Claude Code Router 소개
대규모 언어 모델(LLM)의 등장과 함께 다양한 플랫폼과 API가 범람하면서, 하나의 환경에서 여러 모델을 유연하게 활용할 수 있는 기반 시스템에 대한 수요가 높아졌습니다. 특히 Anthropic의 Claude Code는 고도화된 코드 기반 작업을 지원하는 도구로 각광받고 있지만, 특정 API나 모델에 종속되어 있으면 비용 문제나 기능 제약에 부딪힐 수 있습니다. 이러한 문제를 해결하고자 탄생한 것이 바로 Claude Code Router입니다.
Claude Code Router는 다양한 LLM 제공업체(OpenAI, DeepSeek, Anthropic, Google 등)의 API를 기반으로, 사용자가 직접 라우팅 전략을 정의해 어떤 요청을 어떤 모델에 보낼지 세밀하게 설정할 수 있는 도구입니다. 예컨대, 배경 처리에는 경량 모델을, 고도 추론에는 DeepSeek Reasoner를, 긴 컨텍스트 처리에는 Gemini 2.5 Pro와 같은 모델을 사용하도록 분기할 수 있습니다. 이를 통해 성능과 비용을 모두 최적화하는 전략적인 LLM 운용이 가능해집니다.
또한 이 프로젝트는 단순히 라우터 기능에 그치지 않고, 플러그인 지원, GitHub Actions 통합, 다양한 명령어 확장 기능 등을 제공하며, 실제 코드 환경에서 Claude Code를 업무 자동화 도구로 활용하려는 개발자들에게 실질적인 도움이 되는 구성을 갖추고 있습니다. 특히 GitHub Actions와 연계해 특정 시간대에 작업을 예약 실행하는 기능은 비용 효율적인 대규모 배치 처리 전략에 유용하게 쓰일 수 있습니다.
Claude Code Router는 Claude Code를 기반으로 여러 LLM API를 유연하게 라우팅하여 사용할 수 있게 도와주는 커맨드라인 기반의 도구입니다. 기본적으로는 @anthropic-ai/claude-code
를 먼저 설치한 뒤, @musistudio/claude-code-router
를 글로벌로 설치해 함께 사용하게 됩니다. 설정은 사용자의 홈 디렉터리 하위에 존재하는 ~/.claude-code-router/config.json
파일을 통해 이루어지며, API 키와 모델 목록, 라우팅 전략 등을 자유롭게 정의할 수 있습니다.
Claude Code Router의 라우팅 전략 구성 방식
라우팅 설정의 핵심은 background, think, longContext 세 가지 시나리오에 대해 어떤 모델을 사용할지 지정하는 방식입니다.
- background: 배경 처리 전용 모델로, 고성능이 요구되지 않아 경량 모델인 Qwen-coder 2.5:7b 또는 3b와 같은 모델을 사용합니다. 로컬 Ollama로 구동 가능하여 비용 절감 효과가 큽니다.
- think: 복잡한 추론이 필요한 상황에서 사용되며, DeepSeek Reasoner가 주요 모델로 쓰입니다. 현재는 예산 조절 기능이 구현되어 있지 않지만, Plan Mode와 같이 고차원적인 작업에 활용됩니다.
- longContext: 입력 토큰 수가 많은 경우를 위한 전략으로, Gemini 2.5 Pro와 같은 긴 컨텍스트를 지원하는 모델을 사용합니다.
또한 /model provider,model
명령어를 사용하면 실행 중에 동적으로 모델을 변경할 수 있습니다. 예를 들어, OpenRouter에서 제공하는 Claude-3.5 Sonnet 모델을 사용하고 싶다면 /model openrouter,anthropic/claude-3.5-sonnet
을 입력하면 됩니다.
Cluade Code Router의 주요 특징
플러그인 시스템
Claude Code Router는 미들웨어 구조로 플러그인을 설치하고 활성화할 수 있습니다. 플러그인은 ~/.claude-code-router/plugins/
디렉터리에 배치하며, config.json
의 usePlugins
옵션에 이름을 추가해 사용할 수 있습니다. 현재 제공되는 플러그인은 다음과 같습니다:
notebook-tools-filter
: 주피터 노트북 관련 도구 호출을 필터링합니다.toolcall-improvement
: 툴 사용 능력이 떨어지는 모델(예: DeepSeek-V3)의 응답 품질을 개선하는 시스템 프롬프트를 추가합니다.
GitHub Actions와의 통합
Claude Code Router는 GitHub Actions를 통해 자동화된 워크플로우를 구성할 수 있습니다. @claude
가 포함된 이슈나 PR 코멘트 발생 시 특정 모델을 구동시켜 응답하도록 설정할 수 있으며, 이때 설정 파일에 Router 구성과 API 키, 실행 명령어를 포함시켜야 합니다.
특히 DeepSeek API는 특정 시간대(중국 기준 새벽)에 비용이 절반 이하로 떨어지기 때문에, 작업을 예약 실행해 비용을 절감하는 전략도 고려할 수 있습니다.
기타 팁 및 유용한 정보
DeepSeek API를 사용할 경우, 공식 API는 최대 64K 컨텍스트 제한이 있으며, ByteDance API를 사용하면 128K까지 확장 가능합니다. KV 캐시도 지원되므로 복잡한 연산에 유리합니다. 실제 테스트에서 Claude-4보다 DeepSeek 모델이 낮은 비용 대비 더 안정적인 결과를 내는 경우도 있었으며, 이는 컨텍스트 활용 전략이 모델 성능에 큰 영향을 준다는 점을 시사합니다.
라이선스
Claude Code Router 프로젝트는 MIT 라이선스로 공개되어 있으며, 상업적 이용 및 수정에 제약이 없습니다.
Claude Code Router 프로젝트 GitHub 저장소
이 글은 GPT 모델로 정리한 글을 바탕으로 한 것으로, 원문의 내용 또는 의도와 다르게 정리된 내용이 있을 수 있습니다. 관심있는 내용이시라면 원문도 함께 참고해주세요! 읽으시면서 어색하거나 잘못된 내용을 발견하시면 덧글로 알려주시기를 부탁드립니다.
파이토치 한국 사용자 모임
이 정리한 이 글이 유용하셨나요? 회원으로 가입하시면 주요 글들을 이메일
로 보내드립니다! (기본은 Weekly지만 Daily로 변경도 가능합니다.)
아래
쪽에 좋아요
를 눌러주시면 새로운 소식들을 정리하고 공유하는데 힘이 됩니다~