|
VibeVoice: 60분 장시간 음성 인식(ASR)과 실시간 TTS를 통합한 Microsoft의 오픈소스 음성 AI 모델 패밀리
|
|
0
|
238
|
4월 3, 2026
|
|
KG-Whisper: 키워드 가이드(KG)를 통한 음성 인식(ASR) 최적화 구현 프로젝트 (feat. @hyuk님)
|
|
0
|
177
|
4월 3, 2026
|
|
Cohere, HuggingFace Open ASR 리더보드 1위를 차지한 오픈소스 음성 인식 모델 Transcribe 공개
|
|
0
|
1328
|
3월 31, 2026
|
|
Lightning-SimulWhisper: Apple Silicon용 초고속 실시간 로컬 음성 인식 엔진 (feat. Whisper)
|
|
1
|
672
|
12월 9, 2025
|
|
WhisperLiveKit: 실시간 음성 인식(STT), 번역 및 화자 분리 등을 로컬에서 실행할 수 있는 오픈소스 툴킷
|
|
0
|
4583
|
9월 1, 2025
|
|
SeamlessM4T: Meta AI에서 공개한, 번역을 위한 멀티모달에서의 파운데이션 모델
|
|
0
|
1663
|
8월 23, 2023
|
|
Meta, 1100개 이상의 언어에 대한 음성-텍스트, 텍스트-음성 변환 모델 MMS(Massively Multilingual Speech) 공개
|
|
0
|
2358
|
5월 23, 2023
|