Pixelle-Video 프로젝트 소개
콘텐츠 크리에이터라면 누구나 겪는 고민이 있습니다. 흥미로운 주제를 발견했지만 영상으로 만들기까지의 과정, 즉 대본 작성, 이미지 생성, 내레이션 녹음, 배경음악 선택, 최종 편집에 이르는 전 과정이 수 시간의 작업을 요구합니다. AIDC-AI 팀이 공개한 Pixelle-Video는 이 모든 과정을 자동화하는 AI 숏폼 영상 제작 엔진으로, 주제 텍스트 하나만 입력하면 완성된 영상을 출력합니다.
Pixelle-Video는 Apache-2.0 라이선스로 공개된 오픈소스 프로젝트로, GitHub에 공개 이후 3,800개 이상의 스타를 획득했습니다. ComfyUI 아키텍처 위에 구축되어 각 생성 단계를 독립적인 모듈로 구성하며, GPT, Qwen, DeepSeek, Ollama 등 다양한 대형 언어 모델(LLM)과 AI 이미지 생성 모델을 선택적으로 조합할 수 있습니다. Windows 원클릭 패키지를 제공하여 비기술자도 별도의 설정 없이 바로 사용할 수 있고, macOS와 Linux에서는 소스 설치를 통해 실행할 수 있습니다.
Pixelle-Video의 자동화 파이프라인
Pixelle-Video의 영상 생성은 스크립트 생성 → 이미지 계획 → 프레임 처리 → 영상 합성의 4단계로 구성됩니다. 사용자가 주제를 입력하면 LLM이 먼저 내레이션 스크립트를 생성하고, 각 문장에 어울리는 이미지를 AI로 생성합니다. 이후 TTS(Text-to-Speech) 엔진으로 내레이션을 음성으로 변환하고, 배경음악과 함께 최종 영상으로 합성하는 방식입니다. 각 단계는 독립적으로 설정 가능하며, 이미지 생성 모델, TTS 엔진, 영상 템플릿을 자유롭게 교체할 수 있습니다.
지원하는 콘텐츠 형식은 다큐멘터리, 문화 분석, 과학 토론, 자기계발, 역사 서사, 감성 스토리텔링, 소설 낭독, 지식 교육 등 다양합니다. 출력 형식은 세로형(모바일)과 가로형(데스크톱) 모두 지원하며, 최근 업데이트에서는 모션 트랜스퍼 모듈, 디지털 휴먼 스포크스퍼슨, 이미지-투-비디오 파이프라인도 추가되었습니다. TTS 엔진으로는 Edge-TTS, Index-TTS를 기본으로 지원하며 보이스 클로닝 기능도 내장되어 있습니다.
Pixele-Video로 생성한 예시 영상
Motion Transfer - Dancing Kitten
Image-to-Video - Animated Cartoon Video
AI Digital Avatar - Korean-speaking AI Avatar
Side Hustle Money Making - Movie Template
Historical Commentary - Custom Template
Pixelle-Video 설치 및 사용법
Windows 원클릭 패키지 (권장)
GitHub Releases에서 Windows 올인원 패키지를 다운로드한 후 압축을 풀고 start.bat을 실행하면 웹 인터페이스가 자동으로 시작됩니다.
소스 설치 (macOS / Linux)
사전 요구사항:
uv패키지 매니저:pip install uvffmpeg: 영상 처리에 필수
# 저장소 클론
git clone https://github.com/AIDC-AI/Pixelle-Video
cd Pixelle-Video
# 의존성 설치 및 실행
uv sync
uv run main.py
# 브라우저에서 http://localhost:7860 접속
기본 사용 흐름
웹 인터페이스에서 다음 단계로 진행합니다:
- LLM 설정: 스크립트 생성에 사용할 모델 선택 (GPT-4o, Qwen-Max, DeepSeek-V3 등)
- 이미지 설정: AI 이미지 생성 모델 및 스타일 설정
- TTS 설정: 음성 엔진 및 목소리 선택, 보이스 클로닝 사용 시 참조 오디오 업로드
- 영상 템플릿: 가로/세로 형식, 자막 스타일, 배경음악 설정
- 주제 입력 및 생성: 주제 텍스트를 입력하고 생성 시작
# CLI 방식으로 직접 실행
uv run generate.py \
--topic "한국의 전통 발효 식품 김치의 역사" \
--llm qwen-max \
--tts edge-tts \
--output output_video.mp4
라이선스
이 프로젝트는 Apache-2.0 라이선스로 공개되어 있어 개인 및 상업적 목적으로 자유롭게 사용할 수 있습니다.
Pixelle-Video 프로젝트 GitHub 저장소
Pixelle-Video 프로젝트 사용 문서
더 읽어보기
이 글은 GPT 모델로 정리한 글을 바탕으로 한 것으로, 원문의 내용 또는 의도와 다르게 정리된 내용이 있을 수 있습니다. 관심있는 내용이시라면 원문도 함께 참고해주세요! 읽으시면서 어색하거나 잘못된 내용을 발견하시면 덧글로 알려주시기를 부탁드립니다. ![]()
파이토치 한국 사용자 모임
이 정리한 이 글이 유용하셨나요? 회원으로 가입하시면 주요 글들을 이메일
로 보내드립니다! (기본은 Weekly지만 Daily로 변경도 가능합니다.)
아래
쪽에 좋아요
를 눌러주시면 새로운 소식들을 정리하고 공유하는데 힘이 됩니다~ ![]()


