본문 바로가기
IT트렌드

AI 이미지 생성 가이드 2026, 어떤 도구를 어떻게 써야 할까?

by 넘버픽 2026. 5. 8.

1. 2026년 AI 이미지 생성, 지금 판도는 어떻게 바뀌었나?

IMG_T_1.jpg

솔직히 1년 만에 판이 이렇게 바뀔 줄은 몰랐어요. 지금 2026년 5월 기준으로 살아남은 건 딱 다섯 개예요. Midjourney V8.1, ChatGPT Images 2.0, Google Imagen 4, Stable Diffusion 3.5, 그리고 FLUX. 한때 10명 중 7명이 쓰던 DALL-E 3는요? 5월 12일이면 API가 아예 닫혀요. 끝.

 

더 의외인 건 1위예요. ChatGPT가 먹을 줄 알았는데 찾아보니 FLUX가 약 40% 점유율로 1등이더라고요. 이름도 낯선 Black Forest Labs라는 회사인데, 조용히 다 쓸어가고 있었던 셈이죠. 그래도 일반 사용자가 직접 쓰는 건 여전히 Midjourney랑 ChatGPT가 메인이에요.

 

크게 달라진 점 세 가지만 짚을게요. 첫째, 도구마다 잘하는 게 확실히 갈렸어요. Midjourney는 영화 같은 분위기, ChatGPT Images 2.0은 글자가 들어간 디자인, Stable Diffusion은 무료·로컬·커스텀, Imagen 4는 진짜 사진 같은 사실감. 이제 "하나로 다 한다"는 사라졌어요. 둘째, 한국어 텍스트가 드디어 안 깨져요. ChatGPT Images 2.0 나오고 나서부터요. 이전엔 한글만 넣으면 외계어가 나왔거든요. 셋째, Google Imagen은 SynthID 워터마크가 자동으로 박혀요. 눈에는 안 보이는데 "이거 AI 작품이야" 하고 기계가 알아챌 수 있는 거죠.

 

사용 방식도 많이 바뀌었어요. 작년까지는 Midjourney 쓰려면 Discord에 들어가야 했는데, 지금은 그냥 midjourney.com 웹사이트에서 다 끝나요. ChatGPT도 Plus·Pro 가입자한테는 사이드바에 "Images" 탭이 따로 생겼고요. 프리셋, 트렌딩 프롬프트, 한 번 쓰는 얼굴 업로드(같은 캐릭터 유지하기)까지 클릭 몇 번이면 돼요. 그래서 요즘은 "뭐가 제일 좋아?"보다 "내 작업엔 뭘 조합해야 해?"가 진짜 질문이에요.

 

아래에서 5종을 가격·강점·한국어·상업 사용 네 가지 축으로 정리해 봤어요. 용도별로 어떻게 골라야 돈 안 새는지, 한국어 프롬프트 5단계 템플릿, 저작권 체크리스트까지 다 담았어요. 급하면 바로 표 있는 다섯 번째 섹션부터 봐도 돼요.

 

 

2. 어떤 도구가 내 작업에 맞을까?

IMG_T_2.jpg

간단하게 정리하면 이래요. 예술 작품·블로그 대표 이미지면 Midjourney, 글자 들어간 포스터·인포카드면 ChatGPT Images 2.0, 진짜 사진 같은 인물·풍경이면 Google Imagen 4, 무료로 내 PC에서 마음껏 굴리고 싶으면 Stable Diffusion 3.5. 딱 이렇게 네 갈래예요. 처음엔 다 비슷해 보였는데 써보니 강점이 너무 다르더라고요.

 

Midjourney V8.1은 4월 30일에 막 나온 따끈한 버전이에요. V7 대비 4~5배 빨라졌고, 2K HD가 바로 뽑혀 나와요. 예전엔 업스케일 따로 돌렸는데 그 단계가 사라진 거죠. 풍경, 콘셉트 아트, 패션 화보처럼 "분위기로 먹는" 작업은 아직 Midjourney가 압도적이에요. 근데 약점이 분명해요. 글자. 현수막·로고·UI 목업처럼 한글이든 영어든 글자가 들어가는 순간 무너져요. $10 Basic 플랜으론 200장 정도 뽑고, 상업적으로 쓰려면 $30 Pro부터 가야 해요.

 

ChatGPT Images 2.0은 4월 21일 풀린 버전인데, 이거 한 줄로 정리돼요. 한국어·일본어 글자 박을 거면 무조건 이거. 진짜요. 잡지 표지, 블로그 썸네일, UI 목업, 인포그래픽 — 글자가 화면 안에 들어가야 하는 일이면 다른 거 비교가 안 돼요. ChatGPT Plus($20)나 Pro($200)면 사이드바 "Images" 탭에서 추가 결제 없이 거의 무제한으로 뽑아요. 글쓰기·번역·코딩까지 같은 요금이라 1인 운영자한텐 가성비가 최고예요.

 

Google Imagen 4랑 Imagen 4 Ultra는 "이거 AI야?" 소리 나오는 사진감이 강점이에요. DSLR 카메라로 찍은 것 같은 디테일이 진짜 무섭거든요. Gemini API에서 한 장에 $0.02(Fast)·$0.04(Standard)·$0.06(Ultra) 결제하는 종량제예요. 모든 결과물에 SynthID 워터마크가 자동으로 박혀서 "진짜 사진이냐 AI냐"를 나중에도 가릴 수 있고요. 쇼핑몰 모델 컷, 여행 콘텐츠, B2B 광고처럼 "무조건 사진 같아야" 하는 용도엔 정답이에요.

 

 

3. 무료로 쓰려면 어떤 옵션이 있나?

IMG_T_3.jpg

돈 한 푼 안 쓰고 갈 수 있어요? 네, 가능해요. 정답은 Stable Diffusion 3.5예요. Stability AI가 Community License로 풀어놨거든요. 연 매출 100만 달러 안 넘는 개인·소상공인이면 상업 사용까지 공짜예요. 진짜로요. 내 PC에 NVIDIA RTX 4060 이상이 박혀 있으면, SD 3.5 Medium(VRAM 9.9GB 필요) 깔아서 밤새 무제한으로 돌려도 0원이에요.

 

PC 사양이 안 된다고요? 그럼 GPU 빌리면 돼요. RunPod이나 Vast.ai에서 시간당 $0.3~$0.6(우리 돈 4백~8백 원)이면 빌릴 수 있어요. ComfyUI나 AUTOMATIC1111 같은 무료 UI 깔고 한 시간 돌리면 1024×1024 이미지가 200장 넘게 나와요. "많이 뽑아서 고르는" 스타일이면 이게 제일 가성비 좋아요. 한국 사용자들 사이에서 유명한 LoRA·체크포인트(한국 인물체, 웹툰 스타일 같은)도 Civitai에서 무료로 받을 수 있고요.

 

유료 도구의 "무료 체험" 한도도 챙겨봐야 해요. ChatGPT 무료 플랜은 솔직히 이미지 생성은 거의 막혔어요. 옛날엔 DALL-E 3로 하루 2~3장 됐는데 지금은 그것도 없어졌거든요. Google Gemini 앱은 Imagen Fast로 매일 일정 분량 공짜로 주는데, 결과물에 워터마크가 큼지막하게 박혀요. Microsoft Copilot의 "이미지 만들기"는 OpenAI GPT Image 기반이라 품질이 좋고 하루 15장 정도(부스트 쓰면 더) 무료. 대신 상업 사용은 안 돼요. 이거 놓치고 광고에 썼다가 약관 위반 걸리는 사람 진짜 많아요.

 

한 줄로 끊어드릴게요. 무료 + 상업 OK면 Stable Diffusion 3.5(로컬 또는 GPU 임대). 무료 + 그냥 재미용이면 Microsoft Copilot이나 Gemini 앱. 한글 글자 들어가야 하는데 무료로는 Bing Image Creator(GPT Image 기반)가 그나마 살길이에요.

 

 

4. 한국어 프롬프트, 어떻게 짜야 잘 나오나?

IMG_T_4.jpg

여기서 다들 헷갈려요. 저도 처음엔 "한복 입은 예쁜 여자" 이렇게 막 적었는데, 매번 다른 게 나오더라고요. 써보니 답은 하나예요. 주제 → 스타일 → 구도 → 조명·색감 → 화질·태그 5단계 순서로 짜는 거. 그리고 솔직히 말하면 한국어 + 영어 태그 섞기가 한국어로만 길게 쓰는 것보다 결과가 훨씬 좋아요. AI 학습 데이터가 영어 위주니까요.

 

예를 볼게요. "한복 입은 30대 한국 여성 작가"를 그리고 싶다? 이렇게 쪼개요. (주제) 한복을 입은 30대 한국 여성 작가, (스타일) DSLR 사진 같은 photorealistic, (구도) 무릎 위 medium shot, (조명) golden hour 자연광, (화질) 8K, --ar 4:5. Midjourney면 뒤에 --ar 4:5 --stylize 250 붙이고, Stable Diffusion이면 negative prompt에 "low quality, blurry, deformed hands" 넣어요. ChatGPT Images 2.0은 그냥 자연어로 "세로 4:5 비율로 만들어줘" 해도 알아들어요. 얘는 진짜 똑똑해요.

 

한글이 이미지 안에 들어가야 하면? ChatGPT Images 2.0 한 가지만 쓰세요. 다른 건 아직 안 돼요. 그리고 큰따옴표로 꼭 감싸야 해요. 예: 책 표지 디자인, 가운데 "AI 이미지 생성 가이드 2026" 한국어 제목, 부제 "5가지 도구 완벽 비교", 미니멀한 베이지 배경. Midjourney V8.1이나 SD 3.5도 영문은 깔끔하게 잘 박는데, 한글은 아직도 깨지는 일이 잦아요. 이럴 땐 그냥 글자 없이 배경만 뽑고, Photoshop이나 Canva에서 글자만 따로 얹는 게 마음 편해요.

 

초보가 자주 빠지는 함정 세 가지만 짚을게요. (1) "예쁘게", "멋있게" 같은 두루뭉술한 말만 쓰면 매번 다른 결과 나와요. "자연광·따뜻한 색·소프트 포커스" 같이 구체적으로 바꾸세요. (2) 요소 7개 넘으면 AI가 일부를 그냥 무시해요. 핵심 3~5개만 남기고 빼세요. 더 짧을수록 결과가 정확해요. (3) 손가락이 6개거나 글자가 외계어로 나와요? negative prompt에 "deformed hands, extra fingers, gibberish text" 강하게 걸거나, inpainting으로 그 부분만 다시 그려요. 통째로 다시 뽑지 마세요. 시간 아까워요.

 

 

5. 상업적 사용 가능한가? 저작권은 어떻게 챙기나?

IMG_T_5.jpg

아, 이거 모르고 쓰면 진짜 후회해요. 공식은 단순해요. 유료 플랜 + 약관 한 번 읽기. 딱 두 가지예요. Midjourney는 $30 이상 Pro·Mega 플랜 가입자만 상업 사용 가능. $10 Basic 결과물은 광고에 못 써요. ChatGPT는 Plus($20)·Pro($200)부터 상업 사용 명시 허용이고, 약관에 아예 "OpenAI는 결과물 권리를 사용자에게 양도한다"고 박아놨어요. 이건 마음 편하죠.

 

도구 월 요금 상업 사용 한국어 텍스트 강점
Midjourney V8.1 $10~$60 $30 Pro부터 ⚠️ 약함 예술성·분위기 1위
ChatGPT Images 2.0 $20 Plus ✅ Plus부터 ✅ 한글 OK 텍스트·디자인 1위
Stable Diffusion 3.5 무료 ✅ 매출 1M$ 미만 ⚠️ 약함 오픈소스·LoRA
Google Imagen 4 $0.02~$0.06/장 ✅ API 결제 시 중간 사진감·SynthID
DALL-E 3 2026-05-12 종료 → GPT Image 1 ⚠️ 약함 자동 전환 권장

 

근데 진짜 조심해야 할 지뢰 세 개가 있어요. (1) 실존 K-pop 아이돌·드라마 배우·디즈니/마블 캐릭터·게임 IP를 그대로 따라 그리는 프롬프트는 무조건 침해예요. 도구 가리지 않아요. Midjourney랑 OpenAI는 이미 디즈니·NBC한테 소송 당했고, 결과물을 블로그·SNS에 올리면 업로드한 사람도 책임져요. 진짜로요. (2) 무료 플랜으로 만든 결과물 광고에 쓰면 약관 위반이에요. 위에서도 말했지만 한 번 더 강조. (3) Civitai에서 받은 LoRA는 라이선스가 제각각이라 받기 전에 한 번씩 봐야 해요. 안전선은요? 내가 직접 쓴 프롬프트 + 유료 플랜 + 실존 인물·IP 빼고. 이 셋 지키면 마음 편해요.

 

📌 예산·용도별 추천 조합

블로그·SNS 1인 운영자(월 2만원): ChatGPT Plus 하나로 끝. 글자 박힌 썸네일·인포카드까지 다 돼요.
예술·콘셉트 아트(월 4만원): Midjourney Pro $30 + Stable Diffusion 무료로 보조. 미감은 Midjourney, 양산은 SD.
쇼핑몰·광고 모델(API): Google Imagen 4로 모델 컷 뽑고, 글자는 ChatGPT Images 2.0으로 따로.
완전 무료 + 상업 OK: Stable Diffusion 3.5 로컬 + Civitai 무료 체크포인트. 한 푼도 안 들여도 돼요.

 

 

6. 자주 묻는 질문 (FAQ)

IMG_T_6.jpg

Q1. AI로 만든 이미지를 블로그에 올려도 저작권 문제가 없나요?
A1. 도구별 약관 + 결과물 내용 두 가지를 다 봐야 합니다. Midjourney는 $30 Pro 이상, ChatGPT는 Plus 이상, Stable Diffusion 3.5는 매출 100만 달러 미만이면 상업 사용이 허용됩니다. 다만 결과물에 실존 인물·캐릭터·기업 로고가 들어가면 별도의 퍼블리시티권·상표권 문제가 생기므로 "내가 텍스트로 만든 + 유료 플랜 + 실존 인물 미포함" 3박자를 지켜야 안전합니다.

 

Q2. DALL-E 3가 종료되면 기존에 만든 이미지는 어떻게 되나요?
A2. DALL-E 3는 2026년 5월 12일 API가 공식 종료되지만, 이미 만들어 다운로드한 이미지는 사용자 소유로 그대로 사용 가능합니다. ChatGPT Plus 가입자는 2025년 12월부터 자동으로 GPT Image 1.5(현재 2.0)로 전환됐기 때문에 별도 조치는 필요 없고, API 사용자는 dall-e-3 모델 ID를 gpt-image-1 또는 gpt-image-2로 교체하면 됩니다.

 

Q3. Midjourney와 ChatGPT Images 중 하나만 써야 한다면 무엇을 추천하나요?
A3. 블로그·SNS 1인 운영자에게는 ChatGPT Images 2.0(Plus $20)이 더 합리적입니다. 한국어 텍스트가 들어간 썸네일·인포카드·UI 목업까지 한 도구로 해결되고, ChatGPT 본연의 글쓰기·코딩·번역 기능까지 같은 요금에 같이 쓸 수 있어 가성비가 좋습니다. 반면 풍경·콘셉트 아트·패션 화보 같은 "분위기 작업"이 메인이라면 Midjourney Pro($30)가 미감 면에서 우위입니다.

 

Q4. Stable Diffusion 3.5를 내 PC에서 돌리려면 사양이 어느 정도여야 하나요?
A4. Stable Diffusion 3.5 Medium(2.5B 파라미터)은 VRAM 9.9GB가 필요하므로 NVIDIA RTX 3060 12GB·RTX 4060 8GB(절약 모드)·RTX 4070 12GB부터 안정적으로 돌아갑니다. Large(8.1B)는 VRAM 24GB(RTX 3090·4090·5080 16GB) 이상이 필요해서 일반 사용자에게는 부담이 큽니다. PC 사양이 안 되면 RunPod·Vast.ai 같은 GPU 임대 서비스를 시간당 $0.3~$0.6에 빌리는 게 가성비가 좋습니다.

 

Q5. AI로 만든 이미지를 SynthID 같은 워터마크 없이 사용해도 되나요?
A5. 도구별로 다릅니다. Google Imagen 4·Imagen 4 Ultra는 모든 결과물에 SynthID 워터마크가 자동으로 박히고 제거가 사실상 불가능합니다(육안으로는 안 보임). Midjourney·ChatGPT·Stable Diffusion은 워터마크가 따로 박히지 않지만, 2026년 EU AI Act 시행으로 "AI 생성물임을 표시할 의무"가 생겼습니다. 한국에서도 정보통신망법 개정안이 논의 중이라, 광고·기사·SNS에서는 "AI 생성 이미지" 캡션을 작은 글자로라도 명시해 두는 게 안전합니다.

 

이미지 출처: Midjourney 공식 V7 launch banner (updates.midjourney.com) · Stability AI 공식 SD3.5 hero (stability.ai) · Google Developers Blog Imagen 3 (developers.googleblog.com) · 인포카드 자체 제작 (5개사 공식 가격·약관 기반)