구글 Universal Speech Model - 모든 언어의 음성인식을 위한 모델

읽을거리&정보공유

9bow (박정환) 4월 2, 2023, 4:01오전 1

GeekNews 의 xguru님께 허락을 받고 GN에 올라온 글들 중에 AI 관련된 소식들을 공유하고 있습니다. ^^

[소개 글]

20억개 파라미터 모델로 1200만 시간의 음성, 280억개의 문장, 300개의 언어로 학습
잘 알려진 언어부터 소수가 사용하는 언어까지 모두 음성인식 수행가능
- 2천만명 이하가 사용하여 훈련 데이터를 찾기가 힘든 언어들 까지
유튜브의 영상들로 평가 결과, Whisper(OpenAI)보다 더 단어 에러율이 작은 것으로 나타남

[원문]

[출처/GeekNews]

2개의 좋아요