Anthropic, Claude API에 Opus를 조언자로 Sonnet/Haiku를 실행자로 조합하는 어드바이저(Advisor) 전략 및 어드바이저 도구 공개

어드바이저(Advisor) 전략 소개

대규모 언어 모델을 활용해 자율적으로 작업을 수행하는 에이전트(Agent) 를 구축하려는 개발자들에게 성능과 비용의 균형은 언제나 까다로운 문제입니다. 가장 강력한 모델인 Claude Opus는 복잡한 추론에서 탁월한 성능을 보이지만 토큰당 비용이 높고, Claude Sonnet이나 Claude Haiku는 빠르고 저렴하지만 어려운 결정의 순간에 품질이 아쉬울 때가 있습니다. 이러한 간극을 메우기 위해 개발자 커뮤니티가 자연스럽게 수렴한 패턴이 바로 이번에 Anthropic이 공식화한 어드바이저 전략(Advisor Strategy) 입니다.

Advisor 전략 소개

핵심 아이디어는 단순합니다. 저렴하고 빠른 모델인 Sonnet 또는 Haiku가 실행자(Executor) 로서 작업을 처음부터 끝까지 주도하며 도구를 호출하고 결과를 읽고 반복적으로 해답을 찾아갑니다. 실행자가 스스로 해결하기 어려운 결정의 순간에 도달하면, 더 강력한 Opus를 조언자(Advisor) 로 호출해 현재 공유된 맥락을 바탕으로 계획이나 수정, 또는 중단 신호를 받습니다. 조언자는 직접 도구를 호출하거나 사용자 대면 출력을 생성하지 않고 오로지 실행자에게 지침만 제공합니다. 이 구조 덕분에 최전선(frontier) 수준의 추론 능력은 실제로 필요한 순간에만 비용을 발생시키고, 나머지 실행 구간은 훨씬 저렴한 실행자 모델의 비용 수준에 머무르게 됩니다.

이 접근은 일반적인 서브에이전트(sub-agent) 패턴을 뒤집습니다. 보통은 큰 오케스트레이터 모델이 작업을 분해해 작은 워커 모델들에게 위임하지만, 어드바이저 전략에서는 더 작고 저렴한 모델이 주도권을 쥐고 필요할 때만 상위 모델로 에스컬레이션(escalation) 합니다. 작업 분해나 워커 풀, 오케스트레이션 로직 없이도 복잡한 작업을 효율적으로 처리할 수 있다는 점이 이 전략의 가장 큰 매력입니다. Anthropic의 자체 평가에서 Opus를 조언자로 둔 Sonnet은 SWE-bench Multilingual 벤치마크에서 Sonnet 단독 대비 2.7 퍼센트포인트 상승한 점수를 기록하면서 에이전트 작업당 비용은 오히려 11.9% 감소했습니다.

SWE-bench Multilingual 벤치마크 결과

어드바이저 도구(Advisor Tool)의 동작 방식

Anthropic은 이번 발표와 함께 어드바이저 전략을 API 호출 한 줄로 구현할 수 있도록 어드바이저 도구(Advisor Tool)를 공개했습니다. 이는 Claude Messages API에 통합된 서버 측(server-side) 도구로, Sonnet과 Haiku가 특정 작업에서 도움이 필요할 때 스스로 호출할 줄 아는 내장 도구입니다. 모델 간 핸드오프가 하나의 /v1/messages 요청 내부에서 일어나기 때문에 추가적인 왕복 통신(round-trip)이나 맥락 관리 로직이 필요하지 않습니다.

작동 흐름은 다음과 같습니다. 실행자 모델이 어드바이저 도구를 호출하기로 결정하면, Claude Platform이 정제된 맥락을 조언자 모델로 라우팅하고 조언자(Advisor)가 반환한 계획을 다시 실행자(Executor)에게 전달합니다. 이후 실행자는 같은 요청 안에서 작업을 이어갑니다. 조언자는 일반적으로 400~700개 정도의 짧은 계획 토큰만 생성하며, 전체 출력은 낮은 단가의 실행자 모델이 담당하기 때문에 Opus를 처음부터 끝까지 사용하는 것보다 전체 비용이 훨씬 낮게 유지됩니다.

아래는 Python SDK에서 어드바이저 도구를 선언하는 예시입니다. 코드 내에서 실행자와 조언자 모델을 각각 지정하고, max_uses로 요청당 조언자 호출 횟수 상한을 설정할 수 있습니다.

response = client.messages.create(
    model="claude-sonnet-4-6",  # executor
    tools=[
        {
            "type": "advisor_20260301",
            "name": "advisor",
            "model": "claude-opus-4-6",
            "max_uses": 3,
        },
        # ... your other tools
    ],
    messages=[...]
)

# Advisor tokens reported separately
# in the usage block.

요청을 보낼 때는 베타 헤더 anthropic-beta: advisor-tool-2026-03-01을 함께 전송해야 하며, 기존에 사용하던 다른 도구들과도 자유롭게 결합할 수 있습니다. 즉, 에이전트는 같은 루프 안에서 웹 검색 도구(Web Search Tool)로 정보를 찾고, 코드 실행 도구(Code Execution Tool)로 계산을 수행하면서, 필요한 순간에는 Opus에게 조언을 구할 수 있습니다.

벤치마크로 살펴보는 성능과 비용의 균형

Anthropic은 어드바이저 도구의 효과를 확인하기 위해 여러 대표 벤치마크에서 Sonnet 단독, Sonnet + Opus 조언자, Opus 단독 구성을 비교했습니다. 코드 수정 과제인 SWE-bench Multilingual, 웹 탐색 기반 질의응답 벤치마크인 BrowseComp, 터미널 환경에서의 에이전트 수행 능력을 평가하는 Terminal-Bench 2.0 등에서 Opus를 조언자로 추가한 Sonnet은 Sonnet 단독 대비 점수가 향상되면서도 작업당 비용은 더 낮아졌습니다.

BrowseComp 및 Terminal-Bench 벤치마크 결과

더 흥미로운 결과는 Haiku를 실행자로 사용했을 때 나타납니다. BrowseComp 벤치마크에서 Haiku 단독 점수는 19.7%였지만, Opus를 조언자로 추가한 Haiku는 41.2%로 두 배 이상 상승했습니다. Sonnet 단독 구성과 비교하면 점수는 29% 가량 낮지만 작업당 비용은 무려 85% 저렴하기 때문에, 지능과 비용의 균형이 중요한 대규모 처리 작업에 매우 유력한 선택지가 됩니다. 조언자 호출은 Haiku 단독 대비 비용을 더하지만, 그래도 전체 가격은 Sonnet 구성의 일부 수준에 머무릅니다.

Haiku + Opus Advisor 벤치마크 결과

가격 모델과 비용 관리 장치

어드바이저 도구의 과금은 직관적입니다. 조언자 토큰은 조언자 모델의 요금으로, 실행자 토큰은 실행자 모델의 요금으로 각각 청구됩니다. 조언자는 짧은 계획 토큰만 생성하고 전체 출력은 단가가 낮은 실행자가 담당하기 때문에, Opus를 처음부터 끝까지 사용하는 것보다 전체 비용이 현저히 낮게 유지됩니다.

또한 비용이 예측 불가능하게 늘어나는 것을 방지하는 몇 가지 장치가 기본으로 제공됩니다.

  • 요청당 조언자 호출 상한: max_uses 파라미터로 하나의 요청에서 조언자가 호출될 수 있는 횟수를 제한할 수 있습니다. 에이전트가 반복 루프에서 필요 이상으로 Opus를 호출하는 상황을 미리 차단할 수 있습니다.
  • 사용량 분리 보고: 응답의 usage 블록에서 조언자 토큰이 실행자 토큰과 분리되어 보고되므로, 각 티어(tier)별 지출을 독립적으로 추적하고 최적화할 수 있습니다.
  • 기존 도구와의 결합: 어드바이저 도구는 Messages API 요청 안에서 다른 도구와 동일한 방식으로 선언되는 하나의 엔트리이므로, 기존 에이전트 파이프라인을 크게 변경하지 않아도 점진적으로 도입할 수 있습니다.

실제 도입 사례와 반응

이번 발표에는 어드바이저 도구를 먼저 도입한 기업들의 반응도 함께 공개되었습니다. 코드 에디터 및 AI 빌더 플랫폼인 Bolt의 CEO 겸 창업자 Eric Simmons는 복잡한 작업에서 아키텍처 결정의 품질이 눈에 띄게 개선되었다고 평가했습니다.

"복잡한 작업에서 더 나은 아키텍처 결정을 내려주면서도, 단순한 작업에서는 오버헤드를 전혀 추가하지 않습니다. 생성되는 계획과 실행 경로의 차이는 마치 밤과 낮과 같습니다."

"It makes better architectural decisions on complex tasks while adding no overhead on simple ones. The plans and trajectories are night and day different." — Eric Simmons, CEO and Founder, Bolt

검색 및 에이전트 제품을 개발하는 Genspark의 공동창업자 겸 CTO Kay Zhu는 자체적으로 구축한 계획(planning) 도구보다도 더 나은 결과를 확인했다고 언급했습니다.

"에이전트 턴 수, 도구 호출, 전반적인 점수 모두에서 명확한 개선을 확인했습니다. 우리가 직접 만든 계획 도구보다도 더 나았습니다."

"We saw clear improvements in agent turns, tool calls, and overall score — better than a planning tool we built ourselves." — Kay Zhu, Cofounder & CTO, Genspark

법률 문서 자동화 스타트업 Eve Legal의 머신러닝 엔지니어 Anuraj Pandey는 Haiku와 Opus의 조합이 비용 대비 품질에서 특히 강력함을 강조했습니다.

"구조화된 문서 추출 작업에서, 어드바이저 도구는 Haiku 4.5가 복잡도에 따라 Opus 4.6을 동적으로 호출해 지능을 확장할 수 있게 해주었고, 최전선 모델 품질을 5배 낮은 비용으로 달성했습니다."

"On structured document extraction tasks, the advisor tool enables Haiku 4.5 to dynamically scale intelligence by consulting Opus 4.6 as complexity demands, matching frontier-model quality at 5× lower cost." — Anuraj Pandey, Machine Learning Engineer, Eve Legal

기존 서브에이전트 패턴과의 비교

어드바이저 전략의 가치를 더 명확히 이해하려면 기존의 대표적인 다중 모델 패턴과 비교해 보는 것이 유용합니다.

항목 전통적인 오케스트레이터-워커 어드바이저 전략
주도 모델 상위 모델(Opus)이 계획과 분해 담당 하위 모델(Sonnet/Haiku)이 실행 전 과정 주도
호출 구조 상위가 하위에게 하향식 위임 하위가 필요 시 상위로 상향식 에스컬레이션
오케스트레이션 로직 별도 구현 필요 실행자 모델의 판단으로 자동 처리
상위 모델 비용 발생 범위 전체 작업 흐름에 지속 발생 어려운 결정의 순간에만 발생
사용자 대면 출력 주체 상위 또는 하위 혼재 실행자 모델만 담당
맥락 공유 요청 간 수동 관리 필요 같은 요청 안에서 자동 전달

이 표가 보여주는 것처럼, 어드바이저 전략은 "항상 비싼 모델을 쓰거나, 항상 싼 모델을 쓰는" 이분법을 넘어, 지능을 동적으로 확장(scale) 한다는 새로운 관점을 제시합니다.

시작하기

어드바이저 도구는 현재 Claude Platform에서 베타로 제공되며, 다음 세 단계로 바로 사용해볼 수 있습니다.

  1. 요청에 anthropic-beta: advisor-tool-2026-03-01 베타 헤더를 추가합니다.
  2. Messages API 요청의 tools 배열에 advisor_20260301 타입의 엔트리를 추가하고, 조언자로 사용할 모델과 max_uses를 지정합니다.
  3. 공식 문서에서 제공하는 코딩 작업용 시스템 프롬프트를 참고하여, 각자의 에이전트 유스케이스에 맞게 시스템 프롬프트를 수정합니다.

Anthropic은 도입 시 기존에 사용하던 평가 스위트(eval suite)를 Sonnet 단독, Sonnet 실행자 + Opus 조언자, Opus 단독 세 가지 구성으로 각각 돌려보고 자신의 작업 부하에 가장 적합한 조합을 찾는 것을 권장하고 있습니다. 특히 높은 처리량이 필요한 대규모 작업이나, 복잡도가 작업마다 크게 다른 워크로드에서는 어드바이저 전략이 가장 큰 비용 효율을 가져올 가능성이 높습니다.

:scroll: The advisor strategy: Give agents an intelligence boost 블로그

:books: Claude의 신규 기능: Advisor Tool 공식 문서




이 글은 GPT 모델로 정리한 글을 바탕으로 한 것으로, 원문의 내용 또는 의도와 다르게 정리된 내용이 있을 수 있습니다. 관심있는 내용이시라면 원문도 함께 참고해주세요! 읽으시면서 어색하거나 잘못된 내용을 발견하시면 덧글로 알려주시기를 부탁드립니다. :hugs:

:pytorch:파이토치 한국 사용자 모임:south_korea:이 정리한 이 글이 유용하셨나요? 회원으로 가입하시면 주요 글들을 이메일:love_letter:로 보내드립니다! (기본은 Weekly지만 Daily로 변경도 가능합니다.)

:wrapped_gift: 아래:down_right_arrow:쪽에 좋아요:+1:를 눌러주시면 새로운 소식들을 정리하고 공유하는데 힘이 됩니다~ :star_struck:

1개의 좋아요