[GN] Meta, 음성용 Generative AI 모델 Voicebox 공개

GeekNewsxguru님께 허락을 받고 GN에 올라온 글들 중에 AI 관련된 소식들을 공유하고 있습니다. :smiley_cat:


소개

  • 이미지/텍스트 생성 AI처럼 다양한 스타일로 고품질 오디오 클립을 생성
  • 주어진 오디오 샘플 수정도 가능
  • 6개 언어의 언어를 합성할 뿐만 아니라, 노이즈 제거, 콘텐츠 편집, 스타일 전환, 다양한 샘플 생성
  • 기존 음성용 생성AI는 각 태스크별로 신중하게 준비한 훈련 데이터를 필요로 했음. Voicebox는 새로운 방법을 이용하여 원시 오디오 및 transcription 데이터로 학습
  • 영어, 프랑스어, 스페인어, 독일어, 폴란드어, 포르투칼어로 된 퍼블릭 도메인 오디오북의 5만시간 이상을 이용하여 훈련

원문

소개 글 (Blog)

논문 (Paper)

프로젝트 홈페이지

  • Voicebox 소개 및 데모 음성 들어보기 등

출처 / GeekNews