OpenAI에서 GPT-4 API를 (유료 사용자 대상으로) 공개했습니다 🎉

그간 GPT-4 API를 기다리시던 분들께 희소식입니다 :tada:

  • 유료 API 사용자 대상 OpenAI의 GPT-4 API 공개
  • 구형 Text Completion 모델들의 지원 중단 예고 (~24년 1월 4일))
  • 구형 Embedding 모델들의 지원 중단 예고 (~24년 1월 4일)

GPT-4 API 일반 사용 공개(GA) 및 구형 모델의 Completion API 지원 중단 예고(GPT-4 API general availability and deprecation of older models in the Completions API)

GPT-4 API 뿐만 아니라 GPT-3.5 Turbo, DALL-E, Whisper API도 일반 사용 가능하며, 2024년 초에 지원 중단되는 구형 완성 API 모델에 대한 지원 중단 계획도 발표합니다.

GPT-3.5 Turbo, DALL·E and Whisper APIs are also generally available, and we are releasing a deprecation plan for older models of the Completions API, which will retire at the beginning of 2024.

오늘부터 모든 유료 API 고객은 GPT-4에 액세스할 수 있습니다. 3월에는 ChatGPT API를 도입했으며, 이달 초에는 채팅 기반 모델에 대한 첫 번째 업데이트를 출시했습니다. 저희는 채팅 기반 모델이 모든 사용 사례를 지원할 수 있는 미래를 꿈꾸고 있습니다. 오늘 저희는 이전 완성 API 모델에 대한 지원 중단 계획을 발표하며, 사용자들에게 채팅 완성 API를 채택할 것을 권장합니다.

Starting today, all paying API customers have access to GPT-4. In March, we introduced the ChatGPT API, and earlier this month we released our first updates to the chat-based models. We envision a future where chat-based models can support any use case. Today we’re announcing a deprecation plan for older models of the Completions API, and recommend that users adopt the Chat Completions API.

GPT-4 API 일반 공개 / GPT-4 API general availability

GPT-4는 가장 성능이 뛰어난 모델입니다. 3월 이후 수백만 명의 개발자가 GPT-4 API에 대한 액세스를 요청했으며, GPT-4를 활용한 혁신적인 제품의 범위가 매일 증가하고 있습니다. 현재 성공적인 결제 이력이 있는 모든 기존 API 개발자는 8K 컨텍스트에서 GPT-4 API에 액세스할 수 있습니다. 이달 말까지 신규 개발자에게도 액세스를 개방하고, 그 이후에는 컴퓨팅 가용성에 따라 속도 제한을 높일 계획입니다.

GPT-4 is our most capable model. Millions of developers have requested access to the GPT-4 API since March, and the range of innovative products leveraging GPT-4 is growing every day. Today all existing API developers with a history of successful payments can access the GPT-4 API with 8K context. We plan to open up access to new developers by the end of this month, and then start raising rate-limits after that depending on compute availability.

이러한 모델의 안정성과 프로덕션 규모에서의 사용 준비가 완료됨에 따라 GPT-3.5 Turbo, DALL-E, Whisper API도 일반에 공개할 예정입니다. GPT-4 및 GPT-3.5 터보에 대한 미세 조정을 안전하게 지원하는 작업을 진행 중이며, 올해 말에는 이 기능을 사용할 수 있을 것으로 예상합니다.

Based on the stability and readiness of these models for production-scale use, we are also making the GPT-3.5 Turbo, DALL·E and Whisper APIs generally available. We are working on safely enabling fine-tuning for GPT-4 and GPT-3.5 Turbo and expect this feature to be available later this year.

Text Completion API에서 Chatting Completion API로 전환하기 / Moving from text completions to chat completions

지난 3월에 Chatting Completion API를 도입했으며, 현재 API GPT 사용량의 97%를 차지하고 있습니다.

We introduced the Chat Completions API in March, and it now accounts for 97% of our API GPT usage.

초기 Completion API는 2020년 6월에 도입되어 언어 모델과 상호 작용할 수 있는 자유형 텍스트 프롬프트를 제공했습니다. 이후 보다 구조화된 프롬프트 인터페이스를 통해 더 나은 결과를 제공할 수 있다는 사실을 알게 되었습니다. 채팅 기반 패러다임은 이전의 사용 사례와 새로운 대화 요구 사항의 대부분을 처리하는 동시에 더 높은 유연성과 구체성을 제공하는 강력한 것으로 입증되었습니다. 특히 Chatting Completion API의 구조화된 인터페이스(예: 시스템 메시지, 함수 호출)와 멀티턴 대화 기능을 통해 개발자는 대화 환경과 광범위한 완료 작업을 구축할 수 있습니다. 또한 사용자가 제공한 콘텐츠를 명령어와 구조적으로 분리할 수 있으므로 프롬프트 인젝션 공격의 위험을 낮추는 데 도움이 됩니다.

The initial Completions API was introduced in June 2020 to provide a freeform text prompt for interacting with our language models. We’ve since learned that we can often provide better results with a more structured prompt interface. The chat-based paradigm has proven to be powerful, handling the vast majority of previous use cases and new conversational needs, while providing higher flexibility and specificity. In particular, the Chat Completions API’s structured interface (e.g., system messages, function calling) and multi-turn conversation capabilities enable developers to build conversational experiences and a broad range of completion tasks. It also helps lower the risk of prompt injection attacks, since user-provided content can be structurally separated from instructions.

원문 / 더 읽어보기

2개의 좋아요

한편으로 Unsafe 모드를 지원하는 유일한 상용 모델이었던 Completion API가 중단되어 아쉽기도 합니다. Unsafe Mode로 동작할 수 있는 Pre-trained Open Source Model들이 있기는 하지만 현실적으로 개인이 실험해 볼 수 있는 것은 그나마 Reduced Precision으로 7B ~ 13B 수준이라서 체감적으로 다양한 재미난 응용을 만들기에는 한계가 있더라구요.

1개의 좋아요

오, 생각 못했던 부분인데 글 남겨주셔서 감사합니다. :star_struck:

대화형 인터페이스(...)로 ChatGPT가 히트를 친 이후로 일단 동일한 방식으로 가져가려는거 같은데,
이렇게 시장이 포화(성숙)되고 나면 다시금 시도들이 이뤄지지 않을까 싶기도 합니다 :smiley: