OpenAI, Text-to-Video 생성 모델 Sora 정식 출시

9bow · 12월 10, 2024, 8:25오전

Sora 소개

OpenAI가 텍스트를 입력하면 비디오를 생성해주는(Text-to-Video) 모델인 소라(Sora)를 정식으로 출시했습니다. 월 $20 요금제인 ChatGPT Plus 구독자는 최대 50개의 720p 해상도 비디오를 생성할 수 있으며, 월 $200 요금제인 ChatGPT Pro 구독자는 무제한으로 1080p 해상도의 비디오를 생성할 수 있습니다.

Sora 모델은 사용자가 입력한 텍스트 프롬프트를 기반으로 최대 20초 길이의 고해상도 비디오를 생성할 수 있습니다. 소라는 텍스트에서 이미지로 변환하는 기존의 DALL·E 모델을 확장하여 비디오 생성까지 가능하게 한 것으로, 이는 콘텐츠 제작자와 개발자들에게 새로운 창작의 기회를 제공합니다. 사용자는 텍스트 입력으로 비디오를 제작하고, 이미지를 애니메이션화하며, 비디오를 리믹스할 수 있습니다.

Sora는 메타의 Make-A-Video, 구글의 Lumiere 등과 유사한 텍스트-투-비디오 AI 모델들과 경쟁합니다. 그러나 소라는 일반 사용자에게 직접 접근 가능하며, ChatGPT 구독자들은 추가 비용 없이 소라를 활용할 수 있습니다. 이는 기업 플랫폼을 통해서만 이용 가능한 경쟁 모델들과 차별화됩니다:

텍스트 기반 비디오 생성: 사용자가 입력한 텍스트 프롬프트를 기반으로 최대 20초 길이의 비디오를 생성합니다.
이미지 애니메이션화: 정적인 이미지를 애니메이션으로 변환하여 동적인 콘텐츠를 제작할 수 있습니다.
비디오 리믹스 및 블렌드: 기존 비디오를 리믹스하거나 두 개의 장면을 블렌드하여 새로운 비디오 콘텐츠를 생성할 수 있습니다.
스토리보드 기능: 여러 개의 텍스트 프롬프트를 시퀀스로 입력하여 연속적인 장면을 생성할 수 있습니다.

Sora 모델은 현재 ChatGPT Plus 및 Pro 구독자들에게 제공되며, 미국을 포함한 여러 국가에서 이용 가능합니다. 사용자는 텍스트 프롬프트를 입력하여 비디오를 생성할 수 있으며, 생성된 비디오는 워터마크와 C2PA 메타데이터를 포함하여 AI로 생성되었음을 표시합니다. 또한, 업로드하는 이미지나 비디오에 대해 미성년자, 폭력적이거나 저작권이 있는 콘텐츠가 포함되지 않았음을 확인하는 절차를 거칩니다.

OpenAI의 Sora 모델 소개 블로그

https://openai.com/sora/

이 글은 GPT 모델로 정리한 글을 바탕으로 한 것으로, 원문의 내용 또는 의도와 다르게 정리된 내용이 있을 수 있습니다. 관심있는 내용이시라면 원문도 함께 참고해주세요! 읽으시면서 어색하거나 잘못된 내용을 발견하시면 덧글로 알려주시기를 부탁드립니다.

파이토치 한국 사용자 모임이 정리한 이 글이 유용하셨나요? 회원으로 가입하시면 주요 글들을 이메일로 보내드립니다! (기본은 Weekly지만 Daily로 변경도 가능합니다.)

아래쪽에 좋아요를 눌러주시면 새로운 소식들을 정리하고 공유하는데 힘이 됩니다~