2026년 2월 25일 · 6 min read
모든 AI 이미지 도구가 무시하는 세 가지 문제
생성 문제는 풀렸다. 워크플로우 문제는 아직 열려 있다. 모든 AI 이미지 도구의 구조적 실패 세 가지 — 그리고 세션이 보여주는 답.

저 폴더, 진짜다
AI로 만든 이미지 60여 장. 파일 이름은 replicate-predicti...wcr4.jpg, out-0 (3).webp, 1-6 copy.jpeg. 프롬프트? 모른다. 히스토리? 없다. 어떤 게 잘 된 건지, 어떻게 여기까지 왔는지도 모른다.
버전 관리 없는 AI 이미지 작업은 전부 이 꼴이다. Midjourney든 ChatGPT든 Stable Diffusion이든, 진지하게 써본 사람이면 이런 폴더 하나쯤은 있을 거다.
aether studio를 만들면서 수십 개 세션을 돌렸는데, 매번 같은 문제 세 가지가 반복됐다.
세 가지 문제
1. 비선형 작업에 선형 도구
채팅은 위에서 아래로 흐른다. 근데 크리에이티브 작업은 갈라진다 — A를 해보고, B를 해보고, 다시 A에서 B 요소를 섞는다.
Git 없던 시절 개발자들은 final_v2_FINAL_진짜최종.js로 파일을 저장했다. 지금 AI 크리에이터들 폴더에는 out-0 (3).webp가 있다. 시대만 다르고 문제는 같다. Git이 한 건 코드를 깔끔하게 만든 게 아니다 — 가능한 것의 범위를 바꿨다. 브랜치가 생기니까 실험에 리스크가 사라졌고, 커밋이 쌓이니까 모든 결정이 기록으로 남았다.
크리에이티브 AI가 지금 정확히 그 지점에 있다. 채팅으로는 브랜칭 탐색을 담을 수 없다. 그래프로는 된다.
2. 프로세스에 기억이 없다
최종 이미지만 보면 거기까지 어떻게 왔는지 알 수가 없다. 프롬프트가 뭐였는지, 파라미터를 뭘 썼는지, 그 전에 뭘 시도했다가 버렸는지. 그래서 out-2 copy.webp 60개짜리 폴더가 생긴다 — 이미지는 남는데 결정은 증발한다.
Spotify 커버를 만든 세션이 있다. 여러 레퍼런스를 조합하고 — 모델, 의상, 고양이, 구도 프레임 — 6단계에 걸쳐 다듬었다. 캐주얼에서 무디로, 줌인, 페이스 스왑, 업스케일까지.
매 단계가 결정이었다. ChatGPT에서는 이 결정들이 증발한다. 프로세스에 기억이 있으면, 매 결정이 돌아갈 수 있는 갈림길이 된다.
3. 탐색에 리스크가 붙는다
Met Gala 드레스를 디자인하는 세션에서 헤어스타일을 바꿔봤다. 볼륨 있는 롱, 리스타일, 소프트 웨이브.
대부분의 도구에서 "소프트 웨이브"를 시도하면 "볼류미너스"는 사라진다. 그러니까 보수적이 될 수밖에 없다 — 잃을 게 있으면 과감한 시도를 안 하게 된다. 근데 모든 방향이 브랜치로 남으면, 탐색에 리스크가 없어진다.
복리
크리에이티브 버전 컨트롤은 과정을 저장하는 데서 끝나지 않는다. 복리로 쌓인다. 세션 하나하나가 검증된 접근법 모음이 된다. Spotify 커버의 무드 전개. 뉴욕에서 서울까지 이어진 21장짜리 룩북. Met Gala 드레스의 반복 다듬기. 전부 재사용 가능한 패턴이다. 사라진 대화가 아니라.
결국 모든 프로젝트가 다음 프로젝트의 밑거름이 된다 — 단, 과정이 보여야 한다. 텍스트는 손실 인터페이스라는 문제의 실전 버전이다 — 도구가 맥락을 기억하면, 설명을 멈추고 디렉팅을 시작하게 된다.
다음은
생성 문제는 풀렸다. 프로세스 문제는 아직 열려 있다.
파일 이름도 모르는 이미지 60개짜리 폴더, 어떻게 거기까지 왔는지 기억도 안 나는 상태. 이러면 안 된다. 대안이 뭔지는 프롬프트에서 룩북까지에서 볼 수 있다.
더 읽기