|
VoxCPM2: 2B 파라미터로 30개 언어를 지원하는 토크나이저 없는 고품질 AI 음성 합성 모델
|
|
0
|
164
|
4월 14, 2026
|
|
PersonaPlex: NVIDIA가 공개한, 텍스트 프롬프트와 음성 컨디셔닝으로 페르소나를 제어하는 실시간 양방향 음성 대화 모델
|
|
0
|
160
|
4월 9, 2026
|
|
VibeVoice: 60분 장시간 음성 인식(ASR)과 실시간 TTS를 통합한 Microsoft의 오픈소스 음성 AI 모델 패밀리
|
|
0
|
283
|
4월 3, 2026
|
|
Qwen3-TTS: 500만 시간의 학습 데이터, 12Hz 초저지연 토크나이저로 완성한 오픈소스 Omni-Audio 모델
|
|
0
|
2287
|
1월 25, 2026
|
|
VoxCPM: 토크나이저 없이 작동하는, 0.5B 규모의 고품질 AI 음성 생성 및 복제를 위한 영어/중국어 TTS 모델
|
|
1
|
338
|
1월 11, 2026
|
|
Dia2: Nari Labs가 공개한, 사람처럼 대화하는 초저지연의 오픈소스 TTS 모델 (1B/2B)
|
|
0
|
398
|
12월 4, 2025
|
|
NeuTTS Air: 3초 분량의 음성만으로 음성 복제가 가능한, On-Device TTS(Text-to-Speech) 모델
|
|
0
|
488
|
10월 11, 2025
|
|
Chatterbox: Resemble AI가 공개한 상용 품질의 오픈소스 TTS 모델
|
|
0
|
930
|
5월 29, 2025
|
|
RealtimeVoiceChat: 실시간(~500ms) AI 음성 채팅 오픈소스 프로젝트
|
|
0
|
748
|
5월 6, 2025
|
|
Audibit: 개발자를 위한 오픈소스 TTS 팟캐스트 플랫폼
|
|
0
|
250
|
5월 3, 2025
|
|
Dia: 감정 표현 및 비언어적 요소까지 생성이 가능한 1.6B 규모의 오픈소스 TTS 모델 (feat. Nari Labs)
|
|
2
|
2231
|
4월 25, 2025
|
|
OpenAI, 텍스트를 음성으로 합성(TTS)하는 데모 사이트 OpenAI.fm 공개
|
|
0
|
932
|
4월 17, 2025
|
|
Fish Speech, 한국어를 비롯한 8개 언어를 지원하는 오픈소스 다국어 TTS 모델
|
|
2
|
4415
|
1월 5, 2025
|
|
OuteTTS, 350M 규모의 영문 전용 TTS 모델
|
|
0
|
337
|
11월 10, 2024
|
|
Amphion: 오픈소스 오디오, 음악 및 음성 생성 툴킷 🎤🗣️🛠️
|
|
0
|
309
|
10월 28, 2024
|
|
MARS5: 혁신적인 음성 운율을 지원하는 새로운 음성 모델
|
|
1
|
423
|
6월 16, 2024
|
|
Sonic: 상태-공간 모델(SSM) 기반 실시간 대화 AI를 위한 저지연 음성 모델
|
|
0
|
367
|
6월 4, 2024
|
|
eSpeak NG, 100개 이상의 언어와 방언을 지원하는 오픈소스 음성합성기 eSpeak의 개선 버전(fork)
|
|
0
|
1516
|
5월 4, 2024
|
|
MetaVoice: 인간 수준의 음성 지원을 위한 오픈소스 TTS 모델 (w/ 1.2B 모델 공개, 상업적 이용 가능)
|
|
0
|
1151
|
2월 8, 2024
|
|
OpenVoice: 짧은 오디오 샘플로 음성 복제가 가능한 TTS
|
|
0
|
2256
|
1월 10, 2024
|
|
[GN] 프로젝트 S.A.T.U.R.D.A.Y - 음성으로 동작하는 개인 AI 비서 J.A.R.V.I.S 만들기
|
|
0
|
680
|
7월 19, 2023
|