9bow
(박정환)
1
GeekNews의 xguru님께 허락을 받고 GN에 올라온 글들 중에 AI 관련된 소식들을 공유하고 있습니다.
소개
- 이미지/텍스트 생성 AI처럼 다양한 스타일로 고품질 오디오 클립을 생성
- 주어진 오디오 샘플 수정도 가능
- 6개 언어의 언어를 합성할 뿐만 아니라, 노이즈 제거, 콘텐츠 편집, 스타일 전환, 다양한 샘플 생성
- 기존 음성용 생성AI는 각 태스크별로 신중하게 준비한 훈련 데이터를 필요로 했음. Voicebox는 새로운 방법을 이용하여 원시 오디오 및 transcription 데이터로 학습
- 영어, 프랑스어, 스페인어, 독일어, 폴란드어, 포르투칼어로 된 퍼블릭 도메인 오디오북의 5만시간 이상을 이용하여 훈련
원문
소개 글 (Blog)
논문 (Paper)
프로젝트 홈페이지
- Voicebox 소개 및 데모 음성 들어보기 등