GeekNews 의 xguru 님께 허락을 받고 GN에 올라온 글들 중에 AI 관련된 소식들을 공유하고 있습니다.
소개
- Stability AI 의 새 이미지 모델
- 언어 이해도가 기존 모델에 비해 높고, 포토리얼리즘한 이미지를 생성
- 다양한 이미지 태스크를 지원
- T5 Transformer 기반 Frozen 텍스트 인코더와 3단계 픽셀 디퓨전 모듈의 결합
- 64x64, 256x256, 1024x1024px
- Zero-shot FID 스코어 6.66 (COCO 데이터셋)