OpenAI, GPT-4.1 시리즈 공개 (API로 사용 가능)

GPT-4.1 시리즈 소개

OpenAI가 이번에 공개한 GPT-4.1 시리즈는 총 세 가지 모델(GPT-4.1, mini, nano)로 구성되어 있습니다. 이 모델들은 GPT-4o 및 GPT-4.5보다 전반적으로 더 나은 성능을 보여주며, 실제 프로덕션 환경에서의 효용성을 중점에 두고 설계되었습니다. 특히 눈에 띄는 점은 최대 100만 토큰의 문맥을 지원하고, SWE-bench, Aider’s diff benchmark 등 실제 개발자 워크플로우에서 유용한 벤치마크에서 뛰어난 성과를 기록했다는 점입니다.

  • 코딩 성능: GPT-4.1은 SWE-bench Verified에서 54.6% 정확도를 기록, GPT-4o보다 21.4%p 향상.
  • 지시 따르기: MultiChallenge에서 38.3% 정확도, GPT-4o 대비 10.5%p 향상.
  • 긴 문맥 처리: 최대 100만 토큰까지 지원, long context 관련 모든 벤치마크에서 GPT-4o를 앞섬.
  • 가격 및 속도: GPT-4.1 mini는 GPT-4o보다 83% 저렴, GPT-4.1 nano는 가장 빠르고 저렴한 모델.

GPT-4.1 시리즈(GPT-4.1, mini, nano)는 ChatGPT 앱에서는 제공되지 않고, 오직 API로만 사용 가능합니다. 즉, OpenAI API 또는 Azure OpenAI API에서 직접 호출해 사용해야 하며, agent 시스템 구성이나 자체 애플리케이션에 통합하기 좋습니다. 특히, Responses API와 함께 사용하면, 장문 분석, 고객 요청 처리, 문서 기반 QA 같은 실전 태스크에 탁월한 성능을 보입니다.

GPT-4.1 시리즈의 주요 특징

  • 코딩 성능 향상: GPT-4.1은 다양한 코딩 태스크에서 GPT-4o를 압도합니다. 코드 수정(diff 형식)에서 GPT-4o 대비 정확도가 두 배 이상 향상되었고, SWE-bench 기준으로도 GPT-4.5를 넘는 성능을 보여줬습니다. 웹 프론트엔드 코딩에서도 사람 평가자들이 GPT-4.1이 만든 결과물을 80% 이상 선호했다고 합니다.
  • 지시 따르기 정확도 대폭 향상: 포맷 지시, 순서 지시, 부정 지시 등 실제 개발에서 자주 요구되는 복잡한 지시도 더 잘 이해하고 따릅니다. 특히 GPT-4.1은 이전 메시지에서 필요한 정보를 기억하고 활용하는 능력이 강화되어, 대화 기반 작업에서 훨씬 자연스럽고 정확한 흐름을 보여줍니다.
  • 긴 문맥 이해의 정점: 100만 토큰을 넘나드는 대규모 입력에서도 핵심 정보를 정확히 찾아내고, 복잡한 정보들 사이의 연관성도 잘 파악합니다. OpenAI가 새롭게 제안한 MRCR, Graphwalks 같은 롱 컨텍스트 벤치마크에서 높은 점수를 기록하며 그 성능을 증명했습니다.
  • 이미지 이해 능력 향상: GPT-4.1 시리즈는 시각 정보 처리에서도 뛰어난 성능을 보입니다. 특히 GPT-4.1 mini는 GPT-4o를 능가하는 이미지 기반 벤치마크 점수를 기록했습니다. 이러한 성능 덕분에 GPT-4.1은 차트, 수식, 지도, 도해 등 다양한 시각 정보를 해석하고, 복잡한 문제까지도 해결할 수 있습니다.

  • 비용 효율성

    모델 입력 (1M 토큰당) 출력 캐시된 입력 평균 비용
    GPT-4.1 $2.00 $8.00 $0.50 $1.84
    GPT-4.1 mini $0.40 $1.60 $0.10 $0.42
    GPT-4.1 nano $0.10 $0.40 $0.025 $0.12

GPT-4.1 mini와 nano는 특히 낮은 지연 시간과 비용으로 고품질의 결과를 원하는 서비스에 적합합니다.

:scroll: OpenAI의 GPT-4.1 시리즈 공개 블로그

https://openai.com/index/gpt-4-1/




이 글은 GPT 모델로 정리한 글을 바탕으로 한 것으로, 원문의 내용 또는 의도와 다르게 정리된 내용이 있을 수 있습니다. 관심있는 내용이시라면 원문도 함께 참고해주세요! 읽으시면서 어색하거나 잘못된 내용을 발견하시면 덧글로 알려주시기를 부탁드립니다. :hugs:

:pytorch:파이토치 한국 사용자 모임:south_korea:이 정리한 이 글이 유용하셨나요? 회원으로 가입하시면 주요 글들을 이메일:love_letter:로 보내드립니다! (기본은 Weekly지만 Daily로 변경도 가능합니다.)

:wrapped_gift: 아래:down_right_arrow:쪽에 좋아요:+1:를 눌러주시면 새로운 소식들을 정리하고 공유하는데 힘이 됩니다~ :star_struck:

1개의 좋아요