[GN] SnapFusion - 모바일 기기에서 2초만에 생성 가능한 Text-to-Image 디퓨전 모델

GeekNewsxguru님께 허락을 받고 GN에 올라온 글들 중에 AI 관련된 소식들을 공유하고 있습니다. :smiley_cat:


소개

image

  • 효율적인 네트웍 아키텍처와 단계별 distillation을 개선하여 달성
  • 원본 모델의 중복성을 파악하고, 데이터 증류를 통해 이미지 디코더의 계산을 줄인 효율적인 UNet을 제시
  • MS-COCO로 실험결과, 8단계의 노이즈제거 단계만 가진 SnapFusion 모델이 50개 단계인 Stable Diffusion v.15 보다 더 나은 FID 및 CLIP 점수를 달성

원문

데모 영상

프로젝트 홈페이지

https://snap-research.github.io/SnapFusion/

SnapFusion 논문

출처 / GeekNews