|
HiDream-O1-Image: VAE와 분리된 텍스트 인코더 없이 픽셀 위에서 직접 동작하는 8B 통합 이미지 생성 파운데이션 모델
|
|
1
|
269
|
5월 18, 2026
|
|
Awesome GPT Image 2 API & Prompts: GPT-Image-2를 위한 359개 이상의 큐레이션된 프롬프트와 API 워크플로우 모음
|
|
0
|
1726
|
5월 11, 2026
|
|
NextFlow: 대규모 학습의 불안정성 및 추론 속도의 한계를 극복한 멀티모달 생성 모델에 대한 연구 (feat. ByteDance)
|
|
0
|
268
|
1월 12, 2026
|
|
Flux.2 [dev]: World Knowledge를 학습한 32B 규모의 오픈 웨이트 이미지 생성 모델
|
|
0
|
919
|
11월 26, 2025
|
|
Pico-Banana-400K: Apple이 공개한 텍스트 기반 이미지 편집을 위한 대규모 데이터셋
|
|
0
|
376
|
10월 28, 2025
|
|
Gemini 2.5 Flash Image (a.k.a. Nano-Banana): 구글의 차세대 이미지 생성 / 편집 모델
|
|
1
|
2988
|
8월 29, 2025
|
|
OmniGen, 통합 이미지 생성 모델에 대한 연구 (Unified Image Generation)
|
|
0
|
508
|
11월 1, 2024
|
|
Transfusion: 텍스트 및 이미지를 하나의 모델로 생성하는 멀티모달 생성 모델 (feat. Meta)
|
|
0
|
664
|
8월 25, 2024
|
|
MGIE: Apple이 공개한 자연어 명령 기반 이미지 변경 모델 (MLLM-Guided Image Editing)
|
|
0
|
705
|
2월 10, 2024
|
|
RotationDrag: 포인트를 조작하여 이미지를 편집 / 변경 (+ 다른 이미지 편집 모델들 소개)
|
|
0
|
283
|
1월 25, 2024
|