코딩을 인공지능에게 의존하는 일반인임을 감안해서 봐 주시면 감사하겠습니다.
감정 tts라고하면 전 이 애니메이션이 떠오릅니다.
같은 성우인데 감정이 싹 사라지면 무시무시한 음성이 나옵니다.
정글은 언제나 맑은 뒤 흐림
아마 비슷할 겁니다.
이 성우는 지금은 10살 여자아이인데 화를 정말 잘 내고 동생들이 2명이나 있는데 동생들을 괴롭히는 것을 약간 좋아하지만 마음은 따뜻한 모 소녀가 되어서 활동 중이죠?
동생들이 첫째를 받들어 모셔야하는 게 우리나라의 미풍양속이랍니다.
정글은 언제나에서는 구루미였죠.
구루미의 음성은 감정이 없습니다.
마치 tts 같습니다.
웃을 때 약간 소름이 끼치기도 합니다.
windows의 혜미 음성에 하 하 하 를 입력해 보시면 공감이 될 겁니다.
그 애니메이션이 방영되었을 때에도 tts는 있엇습니다.
먗게 써 볼까요?
가라사대라는 시각장애인이 사용하던 음성 카드가 있었습니다.
snl에서 강유미가 연기하던 로봇 같은 음성이었죠.
목소리도 비슷했습니다.
단지 가라사대는 남자 음성이었습니다.
삼성에서도 tts가 나왔었습니다.
매직보이스라는 것이었죠.
남자 여자 아동 음성이었습니다.
마치 구루미가 말을 하는듯한 느낌을 강하게 받았었습니다.
그러다 보이스웨어에서 음성이 나왔습니다.
지혜 준우 수진 등등.
얘네들을 들어보면 약간 감정이 생긴거 같지만 한참 멀었습니다.
사람 목소리와 비슷하지만 아직 멀었습니다.
은행 atm기기 같습니다.
그러다 유미 혜련 초롱 기타 등등이 생겼지만 뭐 거기서 거기입니다.
성별 나이만 다르지 뭐 별차이가 없습니다.
혜련이나 유미나 전 별로 좋아하지 않는데 억지로 듣고 있습니다.
여기서 갑자기 인공지능이 나옵니다.
수아 미미르 연하 기타등등.
여기서 들어 볼 수있습니다.
보이스웨어와 별 차이가 없었습니다.
비명 지르기 화내기 정도 가능하고 흐느낌이나 아픔 등은 표현하기 어려웠습니다.
보이스웨어는 화내기 비명지르기는 안 됩니다.
그러다 구글 검색으로 감정 tts를 검색했습니다.
몇개 건졌지만 저하고는 별 인연이 없는 것들이었습니다.
셀바스에서 만든 것이 있지만 개인이 사용하지는 못하더군요.
pororo라고 카카오에서 만든것이 있었지만 얘는 오류가 많다고합니다.
그 외에는 회원가입을 유도하거나 요금을 내야만 이용 가능한것들이 었습니다.
결론은 한국어 음성에서는 감정 표현이 되는 것이 회사 소유 외에는 없다는 것입니다.
외국인이 만든 bark라는 것을 이용해 봤는데 왠지 교포의 음성 같은 느낌이었습니다.
학습을 시켜보려고해봤지만 데이터 준비 부터 어떻게 학습을 진행하는지 상세하게 나오지 않아 포기했습니다.
tortoise-tts
이 것도 외국인이 만들었죠.
한국어가 되기는 합니다.
ebs의 음성을 가져와 잠시 테스트한 결과는 처참했습니다.
10초 짜리 음성을 3개 정도 넣었고 재생 시켜봤지만 한국인 음성이 외국인 발음으로 바뀌는 문제가 있었습니다.
노래도 된다기에 넣어봤습니다.
되기는 되는데 아시죠?
외국인이 되었습니다.
개발자에게 이 문제를 문의해봣습니다.
결론은 한국어 발음이 되지 않는다였고 다른 개발자가 만든 DL-Art-School 이 프로젝트로 된다고는 하지만 개발 중단되었는지 데이터셋 만드는 것까지는 성공했지만 tortoise-tts에 적용하는데에는 실패했습니다.
Tacotron-2를 배워 보려고했지만 파편화가 너무 심한거 같습니다.
마치 안드로이드 운영체제 같다고 해야할까요?
배우기가 까다로운거 같습니다.
감정이 되는지도 모르겠습니다.
kss와 유인나 목소리를 가지고 주로 이용하는 거 같던데 제가 원하는 것이 맞는지 확신이 들지 않습니다.
전 애니메이션 캐릭터 음성을 만들고있습니다.
vits로 만들고 있죠.
tacotron2가 멀티 스피커를 지원하는지 감정이 되는지 화자를 설정 가능한지 모르겠습니다.
확신이 들지 않습니다.
그 외에 coqui-tts를 다운 받았지만 어느 것이 한국어를 지원하는지 한국어를 지원하지 않는건지 확신이 되지 않습니다.
tacotron2-, Coqui-tts가 전의학습을 지원하는지도 확신하지 못하고있습니다.
제가원하는 것이 지원되려면 한참을 기다려야할까요?
아니면 좋은 프로젝트라도 있을까요?