Anthropic, 수출통제 해제로 돌아온 Claude Fable 5, 주간 사용량의 50%까지 무료 제공 (~7/8, 16:59:59, KST)

Claude Fable 5 소개

Anthropic의 최상위 모델 Claude Fable 5가 3주 가까이 접속이 끊겼다가 지난 7월 1일 다시 열렸습니다. 그리고 이 재배포를 기념하듯, 지금 Claude 구독 요금제 사용자라면 누구나 7월 7일까지 일주일간 Fable 5를 추가 비용 없이 사용할 수 있는 프로모션이 진행되고 있습니다.

Claude Fable 5 는 Anthropic이 지난 6월 9일 공개한 모델로, 소프트웨어 엔지니어링, 지식 노동, 비전, 과학 연구 등 거의 모든 벤치마크에서 Anthropic이 지금까지 일반에 공개한 모델 중 최고 성능을 기록했습니다. Stripe는 초기 테스트에서 5천만 줄 규모의 Ruby 코드베이스 전체 마이그레이션을, 사람 팀이 두 달 넘게 걸릴 일을 Fable 5가 하루 만에 해냈다고 밝혔습니다. Fable 5의 벤치마크 성적표와 세부 기능은 이미 저희가 별도 게시물로 다뤘고, 이 모델을 실제로 잘 쓰는 법은 프롬프팅 가이드 정리 글에서 다뤘으니 참고해주세요.

이 글에서는 그 사이에 일어난, 그리고 아직 정리되지 않은 이야기를 다룹니다. 왜 Fable 5가 갑자기 며칠 만에 접속 불가 상태가 되었는지, 그 문제를 Anthropic이 어떻게 풀었는지, 그리고 지금 진행 중인 무료 프로모션을 어떻게 활용할 수 있는지를 순서대로 정리합니다.

타임라인: 공개, 중단, 그리고 재배포

Fable 5를 둘러싼 지난 한 달의 흐름은 다음과 같습니다.

6월 9일, 공개: Anthropic은 Fable 5와, 같은 기반 모델이지만 안전장치를 일부 해제한 사이버 방어 전용 모델 Claude Mythos 5를 함께 공개했습니다. Mythos 5는 Project Glasswing 참여 기관들에게만 제공되는 모델로, 세계에서 가장 강력한 사이버 보안 역량을 갖췄다고 소개되었습니다.


6월 12일, 접속 중단: 미국 정부가 Fable 5와 Mythos 5에 수출통제(export control) 조치를 적용하면서, Anthropic은 미국 국적이 아닌 사용자의 접근을 즉시 제한해야 했습니다. 실시간으로 국적을 확인할 안정적인 방법이 없었던 탓에, Anthropic은 두 모델에 대한 접속을 전체 사용자 대상으로 잠정 중단하는 조치를 내렸습니다.


6월 30일, 수출통제 해제: 정부의 수출통제 조치가 해제되면서, Anthropic은 Project Glasswing 파트너들의 Mythos 5 접근부터 순차적으로 복원했습니다.


7월 1일, 재배포: Fable 5가 Claude 플랫폼, Claude.ai, Claude Code, Claude Cowork를 통해 전 세계 사용자에게 다시 열렸습니다. Anthropic은 이 소식과 함께, 업계 공통의 탈옥(jailbreak) 심각도 평가 프레임워크를 제안하는 재배포 발표문을 냈습니다. 이 글의 핵심 참고 자료가 바로 이 발표문입니다.

왜 접속이 끊겼나: Amazon이 찾아낸 우회 경로

Anthropic의 설명에 따르면, 수출통제 조치는 Amazon 연구진이 Fable 5의 안전장치를 우회하는 방법을 찾아냈다는 보고서가 정부에 전달되면서 촉발되었습니다. 특정한 방식으로 프롬프트를 구성하면 모델이 소프트웨어 취약점 여러 개를 식별했고, 한 사례에서는 해당 취약점을 실제로 악용하는 코드까지 만들어냈다는 내용이었습니다.

여기서 중요한 사실은, Anthropic이 자체 검증을 통해 이 취약점 식별 자체는 Fable 5만의 문제가 아니었다는 점을 확인했다는 것입니다. Claude Opus 4.8, GPT-5.5, Kimi K2.7을 포함한 여러 경쟁 모델들도 같은 취약점을 찾아냈고, 실제 악용 코드 재현 테스트에서는 Claude Haiku 4.5부터 GPT-5.4까지 테스트한 거의 모든 모델이 동일한 결과를 냈습니다. 즉, 보고된 우회 기법이 Mythos급 모델만의 고유한 사이버 역량을 노출시킨 것은 아니었다는 뜻입니다. 그럼에도 Anthropic은 정부와 협의하며 해당 행동을 정확히 차단하는 개선된 안전 분류기(safety classifier)를 새로 훈련시켰고, 이 분류기는 보고서에 담긴 특정 우회 기법을 99% 이상의 확률로 차단합니다.

Fable 5의 방어선: 안전 분류기와 안전 마진

Fable 5처럼 강력한 모델을 안전하게 공개하려면, 단순히 "위험한 요청을 거부하도록 학습"시키는 것만으로는 부족합니다. Anthropic은 분류기(Classifier) 라는 별도의 소형 AI 시스템을 모델 앞단에 배치해, 사이버 보안이나 생물학, 화학 관련 잠재적 위험 요청을 실시간으로 탐지하고 차단합니다. 차단된 요청은 자동으로 한 단계 낮은 모델인 Claude Opus 4.8이 대신 응답하며, 이 사실은 사용자에게 그대로 안내됩니다. Anthropic이 밝힌 초기 데이터에 따르면 Fable 5 세션의 95% 이상은 이런 폴백(fallback)을 전혀 겪지 않습니다.

핵심은 이 분류기가 위험한 요청과 안전한 요청 사이에 안전 마진(safety margin) 이라는 여유 구간을 둔다는 점입니다. 아래 다이어그램에서 보듯, 일반 안전장치(A)에 비해 Fable 5의 안전장치(B)는 이 여유 구간을 훨씬 넓게 잡아, 실제로는 무해한 요청 중 일부까지도 보수적으로 차단합니다.

Anthropic은 이 트레이드오프를 의도적으로 선택했다고 설명합니다. 마진을 넓게 잡을수록 정상적인 코딩, 디버깅 요청까지 차단될 확률은 올라가지만, 그만큼 실제로 위험한 요청이 이 방어선을 뚫고 나갈 확률은 낮아집니다. Anthropic은 이를 "안전을 우선한 트레이드오프"라고 표현하며, 사용자 불편은 이해하지만 Fable 5의 다른 능력을 폭넓게 제공하기 위한 선택이었다고 밝혔습니다.

탈옥의 심각도를 어떻게 잴 것인가

이번 사태가 남긴 또 다른 결과물은, Anthropic이 Amazon, Microsoft, Google 등 Project Glasswing 파트너들과 함께 제안한 탈옥(jailbreak) 심각도 평가 프레임워크 입니다. 지금까지 AI 업계에는 발견된 탈옥 기법이 얼마나 심각한지 객관적으로 판단할 공통 기준이 없었습니다. 이번 사건에서 드러났듯, 이는 정부와 기업 모두에게 "이 발견에 얼마나 빨리, 얼마나 강하게 대응해야 하는가"를 판단하기 어렵게 만드는 문제였습니다.

아래 다이어그램은 탈옥이 안전 마진을 살짝 침범하는 수준(C, 경미한 탈옥)부터, 좁은 범위의 유해 행동만 이끌어내는 경우(D, 좁은 유해 탈옥), 그리고 광범위한 유해 행동을 한꺼번에 열어젖히는 경우(E, 보편적 탈옥)까지를 구분해서 보여줍니다.

Anthropic이 제안한 4가지 평가 기준은 다음과 같습니다.

역량 증대(Capability gain): 이 탈옥이 기존에 구할 수 있는 도구(다른 약한 AI 모델 포함) 대비 사용자에게 얼마나 더 큰 역량을 제공하는가.


역량 증대의 범위(Breadth of capability gain): 같은 탈옥 기법이 몇 가지 서로 다른 공격 목적에 통하는가.


무기화 용이성(Ease of weaponization): 탈옥을 실제 공격으로 바꾸는 데 얼마나 많은 숙련된 조작과 시도가 필요한가.


발견 용이성(Discoverability): 이 기법을 얻는 데 전문 지식이 필요한가, 아니면 이미 인터넷에 널리 알려져 있는가.

Anthropic은 가장 심각한 등급의 탈옥, 예를 들어 전력망이나 금융 시스템 같은 핵심 인프라에 실질적 피해를 주는 데 쓰이는 경우에는 심각도가 확인되는 즉시 예비 완화 조치에 들어가겠다고 밝혔고, 주요 탈옥 제보 채널을 24시간 모니터링하는 팀도 새로 꾸린다고 전했습니다. 보안 연구자들이 사이버 탈옥을 제보할 수 있는 HackerOne 프로그램도 함께 열렸습니다.

정부와의 협력은 어떻게 달라지나

Anthropic은 이번 사태를 계기로 미국 정부와의 협력 범위를 넓히겠다고 밝혔습니다. 지난 10주간 국가 사이버 국장실, 과학기술정책실, 재무부, 상무부 산하 CAISI(AI 표준혁신센터) 등과 협의해온 내용을 바탕으로, Anthropic은 국가 안보와 관련된 프런티어 모델에는 정부 파트너에게 사전 접근과 독립적 평가 기회를 제공하고, 새로 발견된 탈옥이나 오용 패턴은 신속하게 공유하며, 공동 연구를 위한 전담 인력과 컴퓨팅 자원을 배정하겠다고 발표했습니다. 이러한 협력은 지난 6월 2일 발표된 미국 행정명령 "Promoting Advanced Artificial Intelligence Innovation and Security"의 접근 방식과 맞닿아 있습니다.

Cloudflare가 Project Glasswing에 참여해 Mythos Preview를 실제로 사용해본 후기를 남긴 적이 있는데, Mythos급 모델이 방어 목적으로 실제 현장에서 어떻게 쓰이는지 감을 잡는 데 참고할 만합니다. Project Glasswing 자체의 출범 배경은 이전 게시물에서 다뤘습니다.

지금 진행 중인 프로모션: 7월 7일까지 Fable 5 무료 체험

여기서부터가 이 글의 실용적인 부분입니다. Anthropic은 지원 문서를 통해, Fable 5 재배포를 기념하는 한시적 프로모션을 안내하고 있습니다.

프로모션 기간: 2026년 7월 1일부터 7월 7일 오후 11시 59분 59초(태평양 표준시)까지입니다.

포함 내용: 이 기간 동안 Pro, Max, Team 요금제, 그리고 조직이 활성화한 경우 좌석 기반(seat-based) Enterprise 요금제의 프리미엄 좌석 사용자는 주간 사용량 한도의 최대 50%까지 Fable 5를 추가 비용 없이 쓸 수 있습니다. 별도로 신청하거나 활성화할 필요가 없으며, 기존 구독료 외에 청구되는 금액도 없습니다. 다만 Fable 5는 다른 Claude 모델보다 같은 주간 한도를 더 빠르게 소모한다는 점은 기억해둘 만합니다.

한도를 다 쓰면: 주간 한도의 50%까지 Fable 5를 사용한 뒤에는 두 가지 선택지가 있습니다. 하나는 사용량 크레딧(usage credits)을 활성화해 별도 과금으로 계속 Fable 5를 쓰는 것이고, 다른 하나는 다른 Claude 모델로 전환해 남은 주간 한도 내에서 작업을 이어가는 것입니다. 사용량 크레딧이 이미 켜져 있다면, 한도 초과 시점부터 자동으로 크레딧 과금으로 전환됩니다.

프로모션이 적용되지 않는 경우: 좌석 기반 Enterprise 요금제의 스탠다드 좌석, 종량제(usage-based) Enterprise 요금제, 그리고 Claude API를 통한 사용량은 이번 프로모션 대상이 아닙니다. API 사용량은 기존과 동일하게 표준 요금으로 별도 청구됩니다.

어디서 쓸 수 있나

플랫폼 접근 방법
Claude 웹, Claude Desktop, Claude Mobile 모델 선택기에서 "Fable 5" 선택
Claude Code 버전 2.1.170 이상 필요
Claude Cowork 최신 버전 Claude Desktop 필요
Claude Design, Claude for Microsoft 365, Claude for Teams, Claude Tag 각 플랫폼의 모델 선택기에서 동일하게 사용 가능

좌석 기반(legacy seat-based) Enterprise 요금제라면

레거시 좌석 기반 Enterprise 요금제를 쓰는 조직은 좌석 종류에 따라 상황이 다릅니다. 스탠다드 좌석 은 원래 Fable 5를 포함하지 않으며, 조직이 사용량 크레딧을 활성화한 경우에만 크레딧을 소모하며 Fable 5를 쓸 수 있습니다. 프리미엄 좌석 은 프로모션 기간 동안 추가 비용 없이 Fable 5를 쓸 수 있고, 프로모션이 끝난 뒤에도 조직이 사용량 크레딧을 켜두면 계속 사용할 수 있습니다.

자주 묻는 질문

Fable 5가 보이지 않는다면: 유료 Claude 요금제를 쓰고 있는지(무료 플랜은 프로모션 대상이 아닙니다), Claude Code라면 2.1.170 이상인지, Cowork라면 Claude Desktop 최신 버전인지, 조직이 Fable 5를 활성화했는지, 그리고 프로모션 기간(7월 7일까지)이 아직 끝나지 않았는지를 차례로 확인해보세요. Claude Code에서는 관리자가 매니지드 설정으로 Fable 5 접근을 제한해뒀을 수도 있습니다.

관리자가 이 프로모션을 끌 수 있나요: Claude 웹, Desktop, Mobile에서는 조직 관리자가 프로모션 자체를 비활성화할 수 없습니다. 다만 어떤 모델을 기본값으로 둘지는 관리자가 정할 수 있습니다. Claude Code에서는 관리자가 매니지드 설정을 통해 Fable 5를 포함한 모델 가용성을 제어할 수 있습니다.

항상 주간 한도의 50%를 Fable 5에 쓸 수 있나요: 아닙니다. 다른 모델 사용량도 같은 주간 한도 풀(pool)을 공유하기 때문에, 이미 다른 모델로 한도의 절반을 썼다면 남은 절반 안에서만 Fable 5를 쓸 수 있습니다. 사용량 설정 화면에서 두 수치를 모두 확인할 수 있습니다.

가격과 API 접근

프로모션과 별개로, 개발자는 Claude API를 통해 claude-fable-5 모델을 종량제로 바로 호출할 수 있습니다. 가격은 입력 토큰 100만 개당 10달러, 출력 토큰 100만 개당 50달러로, Anthropic은 이전 세대인 Claude Mythos Preview 대비 절반 이하 가격이라고 밝혔습니다. API 사용량은 이번 프로모션 대상이 아니므로 항상 이 표준 요금이 그대로 적용됩니다.

라이선스

Claude Fable 5와 Mythos 5는 오픈소스가 아닌 Anthropic 상업 이용약관에 따라 API 및 구독 서비스 형태로 제공되는 상용 모델입니다.

:scroll: Redeploying Claude Fable 5 소개 블로그

:scroll: Claude Fable 5 프로모션 액세스 안내 문서

더 읽어보기




이 글은 GPT 모델로 정리한 글을 바탕으로 한 것으로, 원문의 내용 또는 의도와 다르게 정리된 내용이 있을 수 있습니다. 관심있는 내용이시라면 원문도 함께 참고해주세요! 읽으시면서 어색하거나 잘못된 내용을 발견하시면 덧글로 알려주시기를 부탁드립니다. :hugs:

:pytorch:파이토치 한국 사용자 모임:south_korea:이 정리한 이 글이 유용하셨나요? 회원으로 가입하시면 주요 글들을 이메일:love_letter:로 보내드립니다! 텔레그램(Telegram)이나 Slack/Discord/Teams/Dooray/GoogleChat 등으로도 새 글 알림을 받으실 수 있습니다. :smiley:

:wrapped_gift: 아래:down_right_arrow:쪽에 좋아요:+1:를 눌러주시면 새로운 소식들을 정리하고 공유하는데 힘이 됩니다~ :star_struck: