GeekNews의 xguru님께 허락을 받고 GN에 올라온 글들 중에 AI 관련된 소식들을 공유하고 있습니다.
소개
- 완전히 오프라인으로 동작하는 자동 자막 생성기
- 리눅스/맥/윈도우
- 다양한 Whisper 구현체 지원 : whisper-timestamped, whisper.cpp, faster-whisper, whisperX
- 서브타이틀 수정 기능
- dl-translate 를 이용한 번역기능 제공 (페이스북 M2M 모델)
- Web-UI + CLI + Python 패키지
- CLI 를 통한 배치프로세싱, 파이썬 패키지로 자신만의 스크립트 개발 가능
- SubRip(SRT), WebVTT, MicroDVD, MPL2, TMP 등의 자막 포맷 지원
원문
GitHub 저장소
API 문서
https://abdeladim-s.github.io/subsai/
예제: VAD
- silero-vad를 사용한 긴 오디오 파일 처리 예제
예제: 번역하기
- 이미 존재하는 자막 파일을 번역하는 예제