구글 Universal Speech Model - 모든 언어의 음성인식을 위한 모델

GeekNews 의 xguru님께 허락을 받고 GN에 올라온 글들 중에 AI 관련된 소식들을 공유하고 있습니다. ^^

[소개 글]

image

  • 20억개 파라미터 모델로 1200만 시간의 음성, 280억개의 문장, 300개의 언어로 학습
  • 잘 알려진 언어부터 소수가 사용하는 언어까지 모두 음성인식 수행가능
    • 2천만명 이하가 사용하여 훈련 데이터를 찾기가 힘든 언어들 까지
  • 유튜브의 영상들로 평가 결과, Whisper(OpenAI)보다 더 단어 에러율이 작은 것으로 나타남

[원문]

[출처/GeekNews]

2개의 좋아요