소개
2024년 8월 20일, OpenAI는 GPT-4o의 미세조정 기능을 출시했습니다. 이 기능은 개발자들 사이에서 높은 수요를 받아왔으며, 이를 통해 각 조직은 9월 23일까지 하루에 100만 개의 학습 토큰을 무료로 사용할 수 있습니다.
GPT-4o의 미세조정 기능은 맞춤형 데이터셋으로 모델을 조정해 특정 용도에 맞춘 성능 향상을 가능하게 합니다. 미세조정은 응답의 구조와 톤을 사용자 요구에 맞게 조정하거나 복잡한 도메인별 지침을 따르게 하는 등 다양한 맞춤화가 가능합니다.
시작하기
모든 유료 사용자들은 GPT-4o 미세조정을 바로 사용할 수 있습니다. 시작하려면 미세조정 대시보드를 방문해 'create'를 클릭한 후, 기본 모델 드롭다운에서 'gpt-4o-2024-08-06'을 선택하면 됩니다. GPT-4o 미세조정의 학습 비용은 백만 토큰당 25달러이며, 추론은 입력 토큰 백만 개당 3.75달러, 출력 토큰 백만 개당 15달러입니다.
또한, GPT-4o 미니의 미세조정도 가능하며, 이를 통해 하루에 200만 개의 무료 학습 토큰을 사용할 수 있습니다.
GPT-4o 미세조정의 성과 사례
Cosine의 SWE-bench 벤치마크 결과
Cosine의 Genie는 AI 소프트웨어 엔지니어링 어시스턴트로, 사용자의 요구에 맞춰 버그를 식별하고, 기능을 구축하며, 코드를 리팩토링할 수 있습니다. 이 AI는 복잡한 기술적 문제를 해결하고, 적은 토큰으로도 높은 정확도의 코드를 변경할 수 있는 능력을 갖추고 있습니다. Genie는 실제 소프트웨어 엔지니어의 작업 예제를 학습한 GPT-4o 모델로 구동되며, 특정 형식으로 출력할 수 있도록 훈련되었습니다. 이 모델을 통해 Genie는 SWE-bench의 새로운 Verified 벤치마크에서 43.8%의 최고 성능을 달성했습니다.
Distyl의 BIRD-SQL 벤치마크 결과
Distyl은 Fortune 500 기업의 AI 솔루션 파트너로, 최근 BIRD-SQL 벤치마크에서 1위를 차지했습니다. Distyl의 GPT-4o 미세조정 모델은 71.83%의 실행 정확도를 달성했으며, SQL 생성, 쿼리 재구성, 의도 분류, 사고의 흐름(chain-of-thought), 자가 수정(self-correction) 등 다양한 작업에서 우수한 성과를 보였습니다.
데이터 프라이버시와 안전성
미세조정된 모델은 완전히 사용자의 통제 하에 있으며, 모든 입력 및 출력 데이터를 포함한 비즈니스 데이터에 대한 완전한 소유권을 가집니다. 이는 데이터가 공유되거나 다른 모델의 학습에 사용되지 않음을 보장합니다.
또한, 미세조정된 모델이 오용되지 않도록 다층의 안전 조치를 구현했습니다. 예를 들어, 자동화된 안전 평가를 지속적으로 수행하고, 사용 정책을 준수하는지 모니터링합니다.
더 읽어보기
https://openai.com/index/gpt-4o-fine-tuning/
이 글은 GPT 모델로 정리한 글을 바탕으로 한 것으로, 원문의 내용 또는 의도와 다르게 정리된 내용이 있을 수 있습니다. 관심있는 내용이시라면 원문도 함께 참고해주세요! 읽으시면서 어색하거나 잘못된 내용을 발견하시면 덧글로 알려주시기를 부탁드립니다.
파이토치 한국 사용자 모임이 정리한 이 글이 유용하셨나요? 회원으로 가입하시면 주요 글들을 이메일로 보내드립니다! (기본은 Weekly지만 Daily로 변경도 가능합니다.)
아래쪽에 좋아요를 눌러주시면 새로운 소식들을 정리하고 공유하는데 힘이 됩니다~