OpenAI, 새로운 임베딩 모델 및 GPT-3.5, GPT-4 업데이트 발표 (feat. GPT 모델의 게으름 개선)

PyTorchKR​:fire::kr: :thinking::speech_balloon:

  • 기능을 개선하면서 가격을 낮추는 OpenAI의 행보를 보면 AWS가 생각납니다. 과연 OpenAI는 어디까지 갈 수 있을까요? 무엇보다 이번 업데이트에 포함된 laziness 개선도 얼마나 도움이 될지 기대됩니다. :rofl:
  • 이 글은 GPT 모델로 정리한 것으로, 잘못된 부분이 있을 수 있으니 글 아래쪽의 원문도 함께 참고해주세요! 읽으시면서 어색하거나 잘못된 내용을 발견하시면 덧글로 알려주시기를 부탁드립니다. :hugs:

개요

OpenAI는 새로운 임베딩 모델의 도입, GPT-4 Turbo 업데이트, 콘텐츠 심사 모델 개선, 그리고 새로운 API 사용 관리 도구의 출시를 발표했습니다. 또한 GPT-3.5 Turbo의 가격 인하도 함께 발표하였습니다.

주요 내용

새로운 임베딩 모델

임베딩은 자연어 또는 코드와 같은 콘텐츠 내의 개념을 나타내는 일련의 숫자입니다. 임베딩을 사용하면 머신 러닝 모델과 기타 알고리즘이 콘텐츠 간의 관계를 쉽게 이해하고 클러스터링이나 검색과 같은 작업을 수행할 수 있습니다. 임베딩은 ChatGPT와 어시스턴트 API 모두에서 지식 검색과 같은 애플리케이션과 많은 검색 증강 생성(RAG) 개발자 도구를 지원합니다.
(:fire::kr: RAG가 궁금하시다면? :point_right: 대규모 언어 모델을 위한 검색-증강 생성(RAG) 기술 현황 - 1/2편)

임베딩 모델

이번에 OpenAI에서는 새로운 임베딩 모델 2종(text-embedding-3-smalltext-embedding-3-large)이 공개되었습니다. 두 모델 모두 개념적 표현을 잃지 않으면서 임베딩을 단축할 수 있어 성능과 비용 사이의 균형을 맞출 수 있습니다.

  • text-embedding-3-small: 이전 모델인 text-embedding-ada-002보다 효율적이며, 다국어 검색 및 영어 작업 벤치마크에서 성능이 향상되었습니다. 5배 저렴합니다.

  • text-embedding-3-large: 최대 3,072 차원의 임베딩을 생성하는 더 큰 모델로, 동일한 벤치마크에서 뛰어난 성능을 보입니다.

GPT 모델 업데이트 및 가격 인하

  • GPT-4 모델 업데이트: 새로 공개한 gpt-4-0125-preview 모델은 주어진 작업을 완료하지 않는 '게으름(laziness)' 문제 발생을 개선하였으며, 코드 생성과 같은 작업을 더 잘 하게 됩니다. 또한, 영어권이 아닌 UTF-8 글자 생성 관련 문제를 해결하였습니다. 이제 gpt-4-turbo-preview 이라는 모델명(alias)은 최신 GPT-4 Turbo Preview 모델을 가리킵니다.

  • GPT-3.5 모델 업데이트: 업데이트된 gpt-3.5-turbo-0125 모델을 공개하였습니다. 입력 토큰의 가격이 50%, 출력 토큰의 가격을 25% 인하하였습니다. 정확도 향상 및 텍스트 인코딩 문제 등을 해결하였습니다.

그 외 개선 사항들

  • 콘텐츠 검사(moderation) 모델: text-moderation-007은 잠재적으로 해로운 텍스트를 식별하는 데 더욱 강력하게 설계되었습니다.

  • API 사용 관리 도구: 개발자들은 이제 API 키에 대한 권한을 할당하고 API 키 수준에서 사용량 지표를 추적할 수 있어, 더 세밀한 제어 및 가시성을 제공합니다.

더 읽어보기

업데이트 소개 글

임베딩 모델 사용법

https://platform.openai.com/docs/guides/embeddings




:fire:파이토치 한국 사용자 모임:kr:이 정리한 이 글이 유용하셨나요? 회원으로 가입하시면 주요 글들을 이메일:love_letter:로 보내드립니다! (기본은 Weekly지만 Daily로 변경도 가능합니다.)

:gift: 아래:arrow_lower_right:쪽에 좋아요:heart:를 눌러주시면 뉴스 발행에 힘이 됩니다~ :star_struck: