Cloudflare, 단일 API Endpoint에서 여러 AI 모델을 연결/관리하는 AI Gateway의 신규 업데이트 공개

9bow · 9월 2, 2025, 3:30오전

AI Gateway 소개

AI 애플리케이션을 개발할 때 가장 큰 어려움 중 하나는 비결정적(non-deterministic) 특성을 가진 AI 모델을 안정적이고 예측 가능하게 운영하는 것입니다. 동일한 입력을 주더라도 결과가 다르게 나올 수 있고, 모델 버전이나 시스템 프롬프트, 심지어는 API 호출 환경에 따라 결과가 달라집니다. 여기에 성능, 비용, 안정성까지 고려해야 하니 개발자는 여러 겹의 복잡성과 마주하게 됩니다.

Cloudflare는 이미 인터넷 트래픽을 효율적으로 관리하고 보안과 성능을 보장하는 데 강점을 보여왔습니다. 그리고 2년 전, 이러한 철학을 AI 시대에도 적용하기 위해 AI Gateway를 선보였습니다. Cloudflare의 AI Gateway는 개발자가 AI 애플리케이션을 보다 쉽게 관리하고 제어할 수 있도록 지원하는 중앙 집중형 관측 및 제어 플랫폼으로, 이를 통해 요청 사용량, 토큰 수, 오류 및 비용 등의 인사이트를 실시간으로 확인할 수 있으며, 캐싱이나 요청 속도 제한(rate limiting), 자동 재시도, 모델 폴백(model fallback) 등의 기능을 통해 신뢰성과 성능을 높이는 것이 가능합니다

AI Gateway 업데이트 내용 소개

2025년 8월 말 공개된 AI Gateway 업데이트는 이전의 중앙 집중형 관측 및 제어 기능을 한 단계 확장해, 개발자가 다양한 AI 모델을 손쉽게 연결하고 비용과 보안을 통합 관리할 수 있는 환경을 제공합니다.

이번 업데이트를 통해 AI Gateway는 통합 결제, 보안 키 관리, 동적 라우팅(Dynamic Routing), 데이터 손실 방지(DLP, Data Loss Prevention)를 통한 보안 제어 등 다수의 기능을 강화했습니다. 즉, 이제 개발자는 Cloudflare의 AI Gateway 하나만으로 여러 AI 제공자를 연결하고, 사용량을 관리하며, 모델 간 트래픽을 유연하게 제어할 수 있습니다. 이는 기업과 개인 개발자 모두에게 관리 효율성과 비용 최적화라는 두 가지 이점을 동시에 제공합니다.

현재 많은 기업들이 다양한 AI 모델을 실험하거나 혼합해 사용하는 추세에 있습니다. 하지만 보통은 각 AI 제공업체(예: OpenAI, Anthropic, Google, xAI 등)마다 별도 계정을 만들고 API 키를 발급받아 관리해야 합니다. 이는 곧 여러 대시보드, 여러 결제 수단, 여러 API 호출 차이를 동시에 감당해야 한다는 뜻이죠.

AI Gateway는 이런 문제를 단일 계층에서 해결한다는 점에서 API 집약 관리 솔루션(Postman API Gateway, Kong Gateway 등) 과 유사하지만, Cloudflare 특유의 전 지구적 인프라와 보안 기능을 기반으로 한다는 차별점을 가집니다. 특히 기존 API 게이트웨이가 주로 HTTP 요청/응답 라우팅과 인증 관리에 초점을 맞췄다면, AI Gateway는 AI 모델 간의 호환성 및 비용 최적화까지 아우른다는 점에서 더 특화된 도구라고 볼 수 있습니다.

AI Gateway의 주요 기능

통합 결제와 멀티 모델 접근: AI Gateway를 사용하면 OpenAI, Anthropic, Google, Groq, xAI 등 주요 AI 제공자의 350개 이상의 모델에 하나의 Cloudflare 계정을 통해 접근할 수 있습니다. 개별 결제와 크레딧 충전 과정을 밟을 필요 없이, Cloudflare 대시보드에서 모든 사용량을 통합 관리할 수 있으며, 월간 청구서에도 AI 사용 내역이 함께 기록됩니다. 이는 특히 여러 모델을 실험하는 스타트업이나 연구팀에게 큰 행정적 부담을 줄여줍니다.
보안 키 관리 – Secrets Store 연동: 기존의 BYO(Bring Your Own) Provider Key 기능은 여전히 지원되지만, 이제는 Cloudflare의 Secrets Store와 연동되어 더욱 안전한 관리가 가능합니다. AES 기반 이중 암호화 구조와 전역 분산 저장 시스템을 통해, 민감한 API 키를 평문으로 노출하지 않고 안전하게 참조할 수 있습니다. 또한 RBAC(Role-Based Access Control)와 감사 로그를 활용해 키 접근 권한을 최소화하고, 필요할 때만 특정 개발자가 참조할 수 있도록 제한할 수 있습니다.
통합 요청/응답 포맷: AI 모델마다 요청 포맷과 응답 구조가 조금씩 다른 점은 개발자에게 큰 불편을 줍니다. Cloudflare는 AI Gateway에 자동 변환 계층(translation layer) 를 도입하여, 동일한 코드로 여러 모델을 호출할 수 있도록 했습니다. 즉, 개발자가 특정 SDK나 API를 선택했더라도, 내부적으로 AI Gateway가 이를 각 모델 제공자에 맞게 변환해주기 때문에 코드 호환성이 크게 높아집니다.
동적 라우팅(Dynamic Routes): AI 트래픽 제어를 위한 핵심 기능으로 Dynamic Routes가 추가되었습니다. 이를 통해 개발자는 조건부 규칙(if/else)을 설정해, 특정 사용자는 저렴한 모델로 연결하거나, 트래픽을 절반씩 나누어 A/B 테스트를 수행하거나, 여러 모델을 체인 방식으로 연결하는 등의 전략을 손쉽게 구현할 수 있습니다. Cloudflare Workers와 유사한 방식으로 시각적 UI에서 이를 설정할 수 있어 실험과 운영에 큰 유연성을 제공합니다.
내장 보안 기능 – AI Gateway Firewall과 DLP: 올해 초 추가된 Guardrails 기능에 이어, 이번 업데이트에서는 데이터 손실 방지(Data Loss Prevention, DLP) 기능이 AI Gateway Firewall에 포함되었습니다. 이를 통해 주민등록번호, 금융정보, 보험번호 등 민감 데이터를 탐지하고 요청을 차단하거나 관리자에게 경고를 보낼 수 있습니다. 또한 기업별로 맞춤형 DLP 프로필을 정의할 수 있어, 특정 기업 데이터나 내부 코드 유출을 방지하는 보안 정책을 강화할 수 있습니다.

AI Gateway 공식 홈페이지

AI Gateway 업데이트 소개 블로그

이 글은 GPT 모델로 정리한 글을 바탕으로 한 것으로, 원문의 내용 또는 의도와 다르게 정리된 내용이 있을 수 있습니다. 관심있는 내용이시라면 원문도 함께 참고해주세요! 읽으시면서 어색하거나 잘못된 내용을 발견하시면 덧글로 알려주시기를 부탁드립니다.

파이토치 한국 사용자 모임이 정리한 이 글이 유용하셨나요? 회원으로 가입하시면 주요 글들을 이메일로 보내드립니다! (기본은 Weekly지만 Daily로 변경도 가능합니다.)

아래쪽에 좋아요를 눌러주시면 새로운 소식들을 정리하고 공유하는데 힘이 됩니다~