|
Fast Byte Latent Transformer(Fast-BLT): BLT의 바이트 단위 생성을 가속하는 BLT-D/BLT-S/BLT-DV 모델에 대한 연구 (feat. Meta FAIR, Stanford, UW)
|
|
0
|
100
|
5월 13, 2026
|
|
OmniVoice: 600개 이상의 언어를 지원하는 제로샷 음성 복제 및 음성 디자인 TTS 모델
|
|
1
|
2682
|
4월 15, 2026
|
|
VoxCPM2: 2B 파라미터로 30개 언어를 지원하는 토크나이저 없는 고품질 AI 음성 합성 모델
|
|
0
|
1752
|
4월 14, 2026
|
|
dFactory: 쉽고 효율적인 Diffusion LLM의 파인튜닝을 위한 오픈소스 프레임워크
|
|
0
|
225
|
3월 6, 2026
|
|
miniDiffusion: Stable Diffusion 3.5를 순수 PyTorch로 구현한 학습용 프로젝트
|
|
0
|
375
|
6월 20, 2025
|
|
DifuzCam: 카메라 렌즈 대신 Mask와 디퓨전 모델 사용하기
|
|
0
|
272
|
8월 21, 2024
|
|
DMD: MIT와 Adobe가 공개한, 확산 모델을 통한 더 빠른 이미지 생성 (feat. CVPR 2024)
|
|
0
|
639
|
3월 27, 2024
|
|
RotationDrag: 포인트를 조작하여 이미지를 편집 / 변경 (+ 다른 이미지 편집 모델들 소개)
|
|
0
|
275
|
1월 25, 2024
|
|
PhotoMaker: ID 임베딩 스택을 통한 사실적인 사람 사진 생성/커스터마이징 (feat. 텐센트)
|
|
0
|
450
|
1월 18, 2024
|
|
[GN⁺] RealFill: 확산 모델을 사용한 이미지 완성
|
|
0
|
308
|
10월 1, 2023
|
|
Annotate Research Papers: ML/DL 논문을 '쉽게' 읽을 수 있는, 주석이 포함된 논문 :open_book: 저장소
|
|
0
|
422
|
9월 28, 2023
|
|
[GN] Stability AI, 연구용도의 디퓨젼 모델 2개 공개
|
|
0
|
371
|
7월 4, 2023
|
|
[GN] SnapFusion - 모바일 기기에서 2초만에 생성 가능한 Text-to-Image 디퓨전 모델
|
|
0
|
548
|
6월 14, 2023
|