Anthropic, 주요 빅테크 및 금융사와 함께 AI 시대의 핵심 소프트웨어 보안을 위한 Project Glasswing 발족

Project Glasswing 소개

Anthropic은 최근 Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Linux Foundation, Microsoft, NVIDIA, Palo Alto Networks 등 주요 빅테크, 금융사, 오픈소스 재단과 함께 Project Glasswing 이라는 새로운 보안 이니셔티브를 발표했습니다. 이 프로젝트는 전 세계에서 가장 중요한 소프트웨어를 AI의 힘을 빌려 함께 방어하기 위한 산업 공동의 노력입니다.

Project Glasswing이 촉발된 직접적인 계기는 Anthropic이 내부적으로 훈련한 차세대 프론티어 모델, Claude Mythos Preview 의 등장입니다. 이 모델은 일반 공개용이 아닌 연구용 프리뷰 모델로, 코드를 읽고 추론하는 능력에서 "소수의 최상위 보안 전문가를 제외한 모든 인간을 능가하는 수준"에 도달했다고 Anthropic은 설명합니다. 이미 수천 건의 고위험 취약점을 발견했으며, 그중에는 모든 주요 운영체제와 웹 브라우저에서 발견된 것들이 포함되어 있습니다.

이러한 능력은 양날의 검입니다. 같은 역량이 악의적 행위자의 손에 들어가면 사이버 공격의 빈도와 파괴력을 급격히 높일 수 있지만, 방어 측에서 활용하면 오랫동안 잠재되어 있던 결함을 찾아 패치하고 처음부터 더 안전한 소프트웨어를 만들 수 있습니다. Project Glasswing은 이 능력이 공격보다 먼저 방어에 쓰이도록 하기 위한 선제적 시도이며, Anthropic은 최대 1억 달러 상당의 Mythos Preview 사용 크레딧오픈소스 보안 조직에 400만 달러 직접 기부를 약속했습니다.

AI 시대의 사이버 보안, 위협과 기회가 교차하는 변곡점

오늘날 우리가 의존하는 소프트웨어, 즉 은행 시스템, 의료 기록, 물류 네트워크, 전력망을 움직이는 코드에는 언제나 버그가 존재해 왔습니다. 그 중 일부는 공격자가 시스템을 장악하거나 데이터를 탈취할 수 있는 심각한 보안 결함으로 이어졌습니다. Colonial Pipeline 공격, WannaCry와 NHS 사건, SolarWinds 사태 등은 이미 현실 세계에 큰 충격을 준 사례들입니다. 글로벌 사이버 범죄 피해액은 연간 약 5천억 달러로 추정됩니다.

그동안 많은 결함이 수년간 방치되어 온 이유는 이를 발견하고 악용하는 데 소수 전문가 수준의 지식과 시간이 필요했기 때문입니다. 그러나 최근 1년간의 프론티어 모델 발전은 이 비용과 장벽을 극적으로 낮추고 있습니다. AI 모델은 코드를 읽고 취약점을 찾아내는 작업, 그리고 exploit을 구성하는 작업에서 놀라운 능력을 보이기 시작했고, Firefox 사례처럼 실제로 의미 있는 성과가 축적되고 있습니다.

Anthropic은 Claude Mythos Preview를 이러한 흐름의 또 다른 변곡점으로 봅니다. 10년 전 DARPA Cyber Grand Challenge가 자율 취약점 탐지의 가능성을 처음 시연했다면, 이제는 프론티어 AI 모델이 실제로 최상위 인간 전문가와 경쟁 가능한 수준에 도달한 것입니다. 위협과 기회가 동시에 커지는 이 시기에 방어자가 선제적 우위를 확보해야 한다는 것이 Project Glasswing의 문제의식입니다.

Claude Mythos Preview가 찾아낸 실제 취약점들

지난 몇 주 동안 Anthropic과 파트너들은 Claude Mythos Preview를 통해 수천 건의 제로데이 취약점을 식별했습니다. 대부분의 주요 운영체제와 웹 브라우저를 포함한 핵심 소프트웨어에서 발견되었으며, 많은 경우 사람의 개입 없이 자율적으로 탐지되었다는 점이 특징입니다. 이미 패치가 완료된 몇 가지 대표적인 사례는 다음과 같습니다.

  • OpenBSD 27년 묵은 취약점: 보안에 가장 신경 쓴 운영체제 중 하나로 평가되는 OpenBSD에서, 원격 공격자가 단순히 해당 머신에 연결하는 것만으로 크래시를 유발할 수 있는 취약점이 발견되었습니다. OpenBSD는 방화벽과 같은 핵심 인프라에 광범위하게 사용되고 있어 파급력이 큽니다.
  • FFmpeg 16년 묵은 취약점: 수많은 소프트웨어에서 비디오 인코딩 및 디코딩에 사용되는 FFmpeg에서, 자동화 테스트 도구가 500만 번이나 해당 코드 라인에 도달했음에도 놓쳤던 결함을 Mythos Preview가 찾아냈습니다.
  • Linux kernel 권한 상승 체인: 모델이 여러 취약점을 자율적으로 연결(chain)하여, 일반 사용자 권한에서 머신 전체에 대한 완전한 제어권으로 권한을 상승시키는 공격 경로를 구성했습니다.

자세한 기술 디테일과 아직 공개되지 않은 다른 취약점들의 암호학적 해시는 Anthropic의 Frontier Red Team 블로그 글 "Mythos Preview"에서 공개되고 있으며, 수정 완료 후 세부 내용이 순차적으로 공개될 예정입니다.

벤치마크 상에서도 Mythos Preview와 차기 최상위 모델인 Claude Opus 4.6 사이의 격차는 뚜렷합니다. 사이버 보안 취약점 재현 벤치마크인 CyberGym에서 Mythos Preview는 83.1%를, Opus 4.6은 66.6%를 기록했습니다.

벤치마크 Claude Mythos Preview Claude Opus 4.6
CyberGym (취약점 재현) 83.1% 66.6%
SWE-bench Verified 77.8% 53.4%
SWE-bench (기타 변형) 82.0% 65.4%
SWE-bench Multimodal 59.0% 27.1%
Terminal-Bench 2.0 87.3% 77.8%
Coding benchmark 93.9% 80.8%
Humanity's Last Exam 86.9% 83.7%
BrowseComp 79.6% 72.7%

특히 Terminal-Bench 2.0에서는 Terminus-2 하네스, 최대 강도의 adaptive thinking, 태스크당 100만 토큰의 예산 조건에서 87.3%를 기록했으며, 타임아웃을 4시간으로 늘린 Terminal-Bench 2.1 조건에서는 92.1%까지 상승했습니다. SWE-bench Verified의 경우 암기(memorization) 의심 문제를 제외해도 Opus 4.6 대비 개선폭이 유지된다고 Anthropic은 밝히고 있습니다. 모델의 상세 특성과 안전성 평가는 Claude Mythos Preview 시스템 카드에서 확인할 수 있습니다.

Anthropic은 이 모델을 일반에 공개할 계획이 없다고 밝혔습니다. Mythos급 모델이 안전하게 배포되려면 그에 상응하는 사이버 보안 안전장치(safeguards)가 필요하며, 이러한 안전장치는 리스크가 상대적으로 낮은 차기 Claude Opus 모델과 함께 먼저 공개되어 개선 및 검증을 거칠 예정입니다.

파트너들이 말하는 Project Glasswing의 의미

Project Glasswing에는 클라우드, 보안, 금융, 오픈소스 생태계를 아우르는 주요 조직들이 참여하고 있으며, 이미 지난 수 주간 Claude Mythos Preview를 실제 업무에 적용해 왔습니다. 각 파트너의 메시지를 종합하면, 이 이니셔티브의 의미는 단순히 "더 강력한 보안 도구의 등장"에 그치지 않습니다.

"AI 역량은 핵심 인프라를 사이버 위협으로부터 보호하기 위해 요구되는 긴박함을 근본적으로 바꿔 놓는 임계점을 넘었고, 되돌릴 방법은 없습니다. 시스템을 강화하는 기존의 방식만으로는 더 이상 충분하지 않습니다." — Cisco

"AWS에서는 맞춤형 실리콘부터 기술 스택 전반에 걸쳐, 위협이 등장하기 전에 방어를 구축합니다. 우리는 매일 400조 건 이상의 네트워크 플로우를 분석하고 있으며, AI는 대규모 방어를 위한 핵심입니다. Claude Mythos Preview는 이미 우리의 중요한 코드베이스를 강화하는 데 도움이 되고 있습니다." — Amazon Web Services

"Microsoft는 우리의 오픈소스 보안 벤치마크인 CTI-REALM으로 테스트한 결과, Claude Mythos Preview가 이전 모델 대비 상당한 개선을 보였음을 확인했습니다." — Igor Tsyganskiy, EVP of Cybersecurity and Microsoft Research, Microsoft

"취약점이 발견되고 공격자에 의해 익스플로잇되기까지의 시간 간격이 붕괴되고 있습니다. 과거에 몇 달이 걸리던 일이 이제는 AI로 몇 분 만에 일어날 수 있습니다." — CrowdStrike

"오픈소스 유지관리자들은 역사적으로 보안을 스스로 감당해야 했습니다. 오픈소스 소프트웨어는 현대 시스템의 대부분을 차지하며, AI 에이전트가 새 소프트웨어를 작성할 때 참조하는 코드이기도 합니다. Project Glasswing은 모든 유지관리자에게 AI 기반 보안을 '믿을 만한 동반자'로 제공할 수 있는 현실적인 경로입니다." — Linux Foundation

"Project Glasswing은 금융 인프라 전반의 차세대 AI 방어 도구를 엄격하고 독립적인 방식으로 평가할 수 있는 독특한 초기 단계의 기회를 제공합니다." — Pat Opet, CISO, JPMorganChase

"Google은 이 범산업 사이버 보안 이니셔티브가 결성되는 것을 환영하며, Vertex AI를 통해 참가자들에게 Mythos Preview를 제공합니다. 우리는 이미 Big Sleep과 CodeMender와 같은 AI 기반 도구를 통해 중요한 소프트웨어 결함을 찾아 수정해 왔습니다." — Google

"최근 몇 주간 Claude Mythos Preview를 사용해 이전 세대 모델이 완전히 놓쳤던 복잡한 취약점을 찾아냈습니다. 동시에 이것은 공격자들도 곧 더 많은 제로데이와 익스플로잇을 더 빠르게 확보하게 된다는 위험 신호이기도 합니다. 이 모델이 방어자의 손에 먼저 쥐어져야 합니다." — Project Glasswing 파트너

Project Glasswing의 운영 방식과 향후 계획

Project Glasswing은 Anthropic과 출범 파트너 외에도, 핵심 소프트웨어 인프라를 구축하거나 유지하는 40여 개 이상의 추가 조직에 Claude Mythos Preview 접근 권한을 제공합니다. 이들은 자사 및 오픈소스 시스템을 스캔하고 보안을 강화하는 데 모델을 활용할 수 있으며, 주요 작업 영역은 로컬 취약점 탐지, 바이너리 블랙박스 테스트, 엔드포인트 보안, 시스템 침투 테스트 등입니다.

Anthropic의 1억 달러 상당 모델 사용 크레딧은 이번 리서치 프리뷰 기간 동안의 광범위한 사용을 지원합니다. 프리뷰 이후 Claude Mythos Preview는 참가자들에게 입력 100만 토큰당 25달러, 출력 100만 토큰당 125달러로 제공될 예정이며, Claude API, Amazon Bedrock, Google Cloud의 Vertex AI, 그리고 Microsoft Foundry를 통해 접근할 수 있습니다.

오픈소스 생태계 지원도 Project Glasswing의 핵심 축입니다. Anthropic은 Linux Foundation을 통해 Alpha-OmegaOpenSSF에 각각 합쳐 250만 달러, 그리고 Apache Software Foundation150만 달러를 기부했습니다. 오픈소스 유지관리자는 Claude for Open Source 프로그램을 통해 신청할 수 있습니다.

Anthropic은 향후 90일 이내에 학습한 내용, 패치된 취약점, 공개 가능한 개선 사항을 담은 공개 보고서를 발표할 예정이며, 선도 보안 조직들과 협력하여 AI 시대에 맞는 실무 권고안을 도출할 계획입니다. 이 권고안에는 다음과 같은 주제가 포함될 전망입니다.

  • 취약점 공개(Vulnerability disclosure) 프로세스
  • 소프트웨어 업데이트 프로세스
  • 오픈소스 및 공급망 보안
  • 소프트웨어 개발 라이프사이클과 secure-by-design 실천
  • 규제 산업을 위한 표준
  • 분류(triage) 자동화와 스케일링
  • 패치 자동화

Anthropic은 또한 Claude Mythos Preview의 공격 및 방어 측면의 사이버 능력에 대해 미 정부 관계자들과 지속적으로 논의하고 있다고 밝혔습니다. 핵심 인프라 보호는 민주주의 국가들의 최상위 국가 안보 과제이며, AI 기술 리더십을 유지하는 것이 이와 직결된다는 것이 Anthropic의 입장입니다. 중장기적으로는 민관 양쪽을 아우를 수 있는 독립적 제3자 기구가 이러한 대규모 사이버 보안 프로젝트를 이어가기에 가장 이상적인 형태가 될 수 있다고 제안합니다.

시사점

Project Glasswing의 출범은 AI 모델의 사이버 역량이 더 이상 가설이 아니라 "지금 당장의 현실"이 되었음을 공식화한 사건에 가깝습니다. 27년간 발견되지 않았던 OpenBSD 취약점과 500만 번의 자동 테스트를 통과한 FFmpeg 결함이 단일 모델에 의해 자율적으로 드러난 것은, 공격자 관점에서 방치된 결함의 수명이 근본적으로 단축되고 있다는 뜻입니다. 방어자가 먼저 움직이지 않으면, 같은 도구가 공격 측에 활용되는 순간 격차는 급속히 좁혀집니다.

AI 연구자와 개발자 관점에서 이번 발표가 주는 함의는 두 가지입니다. 첫째, 에이전틱 코딩 능력과 보안 역량이 사실상 같은 축 위에 있다는 점입니다. Mythos Preview의 높은 SWE-bench, Terminal-Bench 점수는 단순한 코딩 성능 지표가 아니라, 그 모델이 취약점을 찾고 익스플로잇을 구성할 수 있는 능력의 선행 지표로 해석될 수 있습니다. 둘째, 프론티어 모델의 안전한 배포는 점점 더 "모델 자체의 정렬"뿐 아니라 "외부 safeguards와 배포 정책"의 문제로 이동하고 있다는 점입니다. Anthropic이 Mythos Preview를 일반 공개하지 않고, 차기 Opus 모델로 안전장치를 먼저 검증하겠다고 밝힌 대목은 이러한 방향 전환을 상징적으로 보여줍니다.

:scroll: Anthropic의 Project Glasswing 소개 블로그




이 글은 GPT 모델로 정리한 글을 바탕으로 한 것으로, 원문의 내용 또는 의도와 다르게 정리된 내용이 있을 수 있습니다. 관심있는 내용이시라면 원문도 함께 참고해주세요! 읽으시면서 어색하거나 잘못된 내용을 발견하시면 덧글로 알려주시기를 부탁드립니다. :hugs:

:pytorch:파이토치 한국 사용자 모임:south_korea:이 정리한 이 글이 유용하셨나요? 회원으로 가입하시면 주요 글들을 이메일:love_letter:로 보내드립니다! (기본은 Weekly지만 Daily로 변경도 가능합니다.)

:wrapped_gift: 아래:down_right_arrow:쪽에 좋아요:+1:를 눌러주시면 새로운 소식들을 정리하고 공유하는데 힘이 됩니다~ :star_struck:

1개의 좋아요