QuiLLMan: Voice Chat with LLMs
STT + LLM + TTS를 묶은 오픈소스 음성채팅 서비스 데모입니다. STT(Speech-to-Text)는 OpenAI Whisper을 사용하였고, LLM은 Vicuna를, TTS(Text-to-Speech)는 Metavoice Tortoise TTS를 사용하였다고 합니다. 실제 동작하는 데모는 아래 링크에서 사용해보실 수 있습니다.
https://modal-labs--quillman-web.modal.run/
추가로 저장소는 아래 링크에서 보실 수 있으며,
참고 문서는 아래 링크에서 보실 수 있습니다.