Image 생성 AI의 급격한 발전 - ComfyUI가 대세가 된 것 같다.

18NAO · 10월 14, 2025, 6:39오전

최근 중공 개발사들의 이미지 생성 모델들이 새롭게 발표되고 지속 업그레이드 되면서 이미지 생성 AI분야에서는 결국 ComfyUI가 모든 것의 중심이 되고 있습니다.

미국 혹은 서구 이미지 생성 모델들은 Black Forrest Lab의 Flux와 후속 모델들이외에는 큰 Break Through가 없지만 지난 1년 정도의 시간 동안 중공계 회사들의 관련 모델 출시는 숨이 찰 정도로 신속하게 이루어 지고 있습니다. Wan, Qwen 등등이 그렇습니다.

기존의 Stable Diffusion을 플랫폼으로 이용하던 Open Source 이미지 생성 모델들은 Flux가 마지막이며 중국 이미지 모델은 아예 출시때부터 ComfyUI플랫폼으로 배포되고 있습니다. 따라서 Qwen이나 Wan 등은 거의 모두 ComfyUI에서 작동하고 있습니다. 물론 Wan2GP같은 예외도 있지만 대부분 ComfyUI에서 작동하도록 모델 관련 workflow가 공개되고 있는 중입니다.

이건 Stable Diffusion 개발사에서 창업자가 쫓겨나고 뻘 짓을 계속하다가 망하고 있는 것도 한 몫하지만 결국은 이미지 생성AI 앱들은 ComfyUI로 Converging을 하고 있습니다.

최근 중공 개발사들의 생성 모델들이 새롭게 발표되고 지속 업그레이드 되면서 이미지 생성 AI분야에서는 결국 ComfyUI가 모든 것의 중심이 되고 있습니다.

미국 혹은 서구 이미지 생성 모델들은 Black Forrest Lab의 Flux와 후속 모델들이외에는 큰 Break Through가 없지만 지난 1년 정도의 시간 동안 중공계 회사들의 관련 모델 출시는 숨이 찰 정도로 신속하게 이루어 지고 있습니다. Wan, Qwen 등등이 그렇습니다. 세부적으로 들어가면 진짜 다양한 모델들이 공개되고 있습니다. Wan i2v, it2V, animate, Qwen Image, Qwen Image edit 등등 진짜 어지럽습니다.

기존의 Stable Diffusion을 플랫폼으로 이용하던 Open Source 이미지 생성 모델들은 Flux가 거의 마지막이며 중국 이미지 모델은 아예 출시때부터 ComfyUI플랫폼으로 배포되고 있습니다. 따라서 Qwen이나 Wan 등은 거의 모두 ComfyUI에서 작동하고 있습니다. 물론 Wan2GP같은 예외도 있지만 대부분 ComfyUI에서 작동하도록 모델 관련 workflow가 공개되고 있는 중입니다.

이런 모델들 중에서 가장 대표적인 모델이 Qwen Image Edit 2509입니다. 정확하게 구글 Nano Banana의 기능을 local에서 ComfyUI로 구현합니다. Qwen Image Edit를 획기적으로 구현하여 개인용 컴퓨터의 게임용 GPU에서 구동되로록 구현한 모델입니다.

여기서 나노 바나나가 나으냐 Qwen Image Edit 2509가 나으냐를 논쟁하려는 건 아닙니다. 중공이 이렇게 이미지 생성 분야에서 미국 회사들을 갈아마시고 있는 와중에 한국은 뭐하고 있나요? 초기에 저런 중공 이미지 생성 모델들이 출시되고 할 때 그림이 촌스럽다고 외면 하던 일부 유저들도 이제는 지속적으로 최신 모델을 쏟아내는 이들 중공 회사들에 질릴 정도로 이들 모델은 점점 더 빠르게 새로운 개량 모델을 내놓고 있습니다.

또한 양자화를 통하여 작은 용량의 VRAM에서도 작동하도록 수많은 사용자들이 달려들고 있습니다. 몇 달전에는 RTX-A6000에서 돌려야 한다는 모델이 이제는 8G VRAM에서 작동가능하도록 양자화 모델이 쏟아지고 있습니다. 이게 바로 open Source의 힘입니다.

하지만 구독을 비지니스 모델로 삼는 미국 회사들은 사용자가 몰려들자 생성 이미지의 해상도를 떨어뜨리고 이지미 생성횟수를 제한하기 시작하고 있습니다. 거대 AI회사들의 마케팅 미끼로 전락한 이미지 생성 모델이 open source 커뮤너티에서는 새로운 붐을 이루고 있습니다.

상황이 이 지경이 되자 서구 국가들이 이미지 생성 모델들을 금지하고 있습니다. 영국의 Civitai 사이트 접속 금지가 대표적입니다.

곧 미국에서도 이런 사이트 Blocking이 일어날 수도 있을지 모릅니다. 핑계는 백만 개도 넘게 존재합니다. Cititai의 이용자들은 개발사가 공개한 모델을 학습시켜 NSFW모델을 내놓고 이를 이용해 이상한 그림들을 그려서 올려 놓고 있습니다. 한편에서는 ComfyUI커뮤너티에서는 아예 ComfyUI와 Civitai 웹 사이트 모델들과 통합하는 Node를 내놓고 있습니다.

Civitai의 특정 그림 풍을 바로 ComfyUI에서 그릴 수 있도록 필요한 모델들을 찾아 주는 기능을 구현한 것입니다.

그런 와중 이 글을 쓰는 중에 엔비디아가 올해 초 반 comdex에서 발표한 NVIDIA DGX Spark를 AI유튜버들에 사전 배송하여 관련 언박싱 영상들이 유튜브에 쏟아지고 있지만 ComfyUI를 Demo로 보여주는 유튜버는 단 한사람도 없네요.

이건 쉽게 말해 서구 국가와 개발자들은 LLM에 중독되어 이미지 혹은 Computer Vision AI의 중요성을 무시하거나 간과한다는 말입니다. 향후 이미지 혹은 Computer Vision AI는 로보트나 엣지 기기에 탑재될 World Model의 기초가 되는 기술입니다. 삼성전자 갤럭시에서 폰카로 찍은 사진을 배경을 없애고 장애물을 지우고 보정해주는 인공지능이 이런 모델들의 구현이죠. 애플은 중공과 협력한다면서 이런 기능을 제대로 구현 못하고 있습니다.

따라서 LLM으로 선문답하고 있는 서구 AI회사들은 인공지능이 로보트와 기계와 결합하는 월드 모델에서는 중공에게 이미 까였다고 보면 됩니다. 이것이 군사용 무기와 결합한 미래 전쟁에서 이제 중공의 패권이 가장 크게 펼쳐질 가능성이 크다는 것입니다.

이번 영국의 Civitai 접속 금지 조치는 서구 몰락을 상징하는 사건이며 Image 생성 AI분야에서 중공의 독보적인 존재 가치를 확인하는 사건 입니다.

이상 모두 저의 개인 의견입니다.