[GN] Midjourney vs. Adobe Firefly 2 vs. DALL-E 3

읽을거리&정보공유

9bow (박정환) 11월 1, 2023, 5:23오전 1

GeekNews의 xguru님께 허락을 받고 GN에 올라온 글들 중에 AI 관련된 소식들을 공유하고 있습니다.

소개

Photography: Humans

현재 사진 촬영 분야에서는 미드저니가 선두를 달리고 있지만, 파이어플라이 2가 근소한 차이로 그 뒤
덜 양식화되고 자연스러운 헤드샷을 원한다면 앞으로 Firefly 2를 고려하는 것이 좋음
사진 용도로는 DALL-E 3를 사용하지 않는 것이 좋음

Photography: Stylistic humans

최근엔 스타일리스틱한 사람 이미지를 많이 만들고 있음
이러한 프롬프트는 미드저니를 위해 특별히 맞춤화되었기 때문에 약간의 편견이 있을 수 있음
하지만 몇 가지 핵심 사항:
- 미드저니는 좀 더 복잡한 프롬프트가 주어질 때 가장 잘 작동하며, 강력한 응집력을 보여줌
- 미드저니는 매체, 구도, 조명의 복잡한 조합을 생성하는 데 탁월
- DALL-E는 유색인종을 위한 조명을 통합하는 데 어려움을 겪어 결과의 정확도가 떨어지는 것으로 보임
- Firefly는 다양성이 명시적으로 요구되지 않을 때 가장 다양한 결과물을 생성
- 보다 창의적인 사진 촬영을 대체할 경우 Firefly와 DALL-E 3 모두 원하는 수준의 품질과 응집력을 달성하는 데 어려움을 겪을 수 있음

Photography: Objects

저자는 미드저니가 전체적으로 가장 사실적인 오브젝트 응집력을 구현한다고 생각
Firefly와 DALL-E가 따라잡고 있지만, 이 모델들의 스타일 선호도는 의심할 여지 없이 결과물에 영향을 미칠 것

Illustration

일러스트레이션 측면에서 모두 상당한 진전이 있었지만 nuanced한 결과물을 얻으려면 여전히 Midjourney가 최고의 선택
하지만 여러 모델을 실험해보고 자신의 고유한 스타일에 맞게 조정하는 것이 좋음

Typography

정확한 단어를 생성할 수 있게 된 것은 최근에야 가능
수행한 모든 테스트 중에서 DALL-E 3만이 단어를 완전한 개체로 충실하게 렌더링
이 특별한 경우의 단어는 "디자인"이었고, 일관성은 모든 실험에서 일관되게 유지

결론

환경은 확실히 변화하고 있지만, 저자가가 강조하는 핵심 사항은 다음과 같음
Adobe는 사진 분야에서 확실히 격차를 좁히고 있으며 강력한 경쟁자가 되어 가는 중
DALL-E 3는 타이포그래피를 합리적으로 잘 생성할 수 있는 유일한 제너레이터(Ideogram 제외)
- DALL-E 3는 일러스트레이션 제작에 탁월하며, 단어 생성 기능과 결합하면 규모와 일반화 된 스타일 측면에서 "클립아트용 이미지 생성기"가 될 가능성이 있다고 생각
- 기본 이미지나 다른 활동 중 이미지 생성(ChatGPT를 통한)에는 적합하지만, 곧 고도로 정교한 디자인 도구가 될 것 같지는 않음
Midjourney는 가장 사실적이고 응집력 있는 사진을 계속 만들어냄.
- 창의적인 제어 기능에 있어서는 Midjourney가 타의 추종을 불허

원문

출처 / GeekNews