[GN] Stability AI, 연구용도의 디퓨젼 모델 2개 공개

GeekNewsxguru님께 허락을 받고 GN에 올라온 글들 중에 AI 관련된 소식들을 공유하고 있습니다. :smiley_cat:


소개

  • SD-XL 0.9-base
    • 1024x1024 의 이미지에 대해 다양한 ratio로 학습
    • 텍스트 인코딩에 OpenCLIP-ViT/G 와 CLIP-ViT/L 을 이용(refiner는 OpenCLIP 모델만 사용)
  • SD-XL 0.9-refiner
    • 고품질 데이터의 작은 노이즈 레벨을 제거하도록 훈련해서 Text-to-Image 모델로는 동작하지 않음
    • Image-to-Image 모델로만 동작

원문

출처