Midjourney V8 — 사진가가 알아야 할 10가지 (2)

프롬프트를 글자 그대로 읽는다

연재: Midjourney V8 — 사진가가 반드시 알아야 할 10가지 (2/10)

V7은 해석했고, V8은 실행한다

1편에서 V8이 "카메라가 되었다"고 말씀드렸습니다. 이번 글에서는 그 변화의 가장 실질적인 부분을 다룹니다. 프롬프트를 읽는 방식이 달라졌다는 것.

V7까지의 미드저니는 프롬프트를 "해석"했습니다. 여러분이 쓴 단어를 읽되, 거기에 모델 자신의 판단을 더해서 결과물을 만들었습니다. 프롬프트에 조명을 안 쓰면 모델이 적당한 조명을 골라 넣었고, 구도를 안 쓰면 모델이 구도를 잡아줬습니다. "abandoned greenhouse, late afternoon"이라고만 써도, V7은 따뜻한 오후 빛의 각도, 유리에 낀 이끼의 질감, 낡은 철골의 녹, 공기 중의 먼지 입자까지 알아서 해석해서 넣어줬습니다.

V8은 그렇게 하지 않습니다. "abandoned greenhouse, late afternoon"이라고 쓰면, V8은 버려진 온실과 늦은 오후의 시간대를 줍니다. 정확하고, 명료하고, 중립적입니다. 이끼도, 녹도, 먼지 입자도 — 쓰지 않았으니 넣지 않습니다. 혹은 모델이 가장 기본적인 수준으로만 반영합니다.

이것을 Literal Interpretation, 문자적 해석이라고 부릅니다. V8의 가장 근본적인 변화입니다.

같은 프롬프트, 다른 결과 — 구체적으로 무엇이 달라지는가?

이해를 돕기 위해, 같은 의도를 V7 방식과 V8 방식으로 각각 프롬프트를 써 보겠습니다.

예시 1: 비 오는 거리의 노인

V7 시대의 프롬프트: old man walking in the rain, lonely mood, cinematic lighting, atmospheric --v 7

V7은 이것을 이렇게 해석합니다: "외로운 분위기를 원하는군. 비가 내리고, 도시 거리이고, 가로등 반사가 있고, 약간 언더노출에 따뜻한 톤을 넣어야겠다." 모델이 알아서 채워줍니다. 결과물은 대체로 분위기 있고, "멋진" 이미지가 됩니다.


V8에서 같은 프롬프트를 쓰면: 비 속의 노인이 나옵니다. 중립적인 톤, 특별한 분위기 없이. "cinematic lighting"과 "atmospheric"는 V8에서 의미가 약합니다. V8은 이런 감정 키워드를 무시하지는 않지만, V7처럼 적극적으로 해석하지 않습니다.


V8에 맞게 다시 쓴 프롬프트: elderly man in a dark wool overcoat, walking alone on a narrow asphalt street, light rain falling at a steep angle, single sodium vapor streetlamp behind him casting long orange shadow forward, wet pavement reflecting the lamp in broken streaks, his shoulders slightly hunched, left hand gripping a folded umbrella he hasn't opened, 85mm lens, shallow depth of field, muted palette with warm sodium spill against cool blue ambient --v 8 --style raw --ar 3:2 --no text, watermark, logo, signature, readable letters

한국어 번역: 짙은 울 오버코트를 입은 노인, 좁은 아스팔트 길을 홀로 걷고 있다, 가파른 각도로 가벼운 비가 내리고, 뒤편 나트륨 가로등 하나가 앞으로 긴 주황색 그림자를 드리우고, 젖은 포장도로가 가로등을 끊긴 줄무늬로 반사하며, 어깨를 약간 움츠리고, 왼손에 접힌 우산을 펴지 않은 채 쥐고 있다, 85mm 렌즈, 얕은 심도, 따뜻한 나트륨 spill과 차가운 파란 ambient의 절제된 팔레트

차이가 보이시나요?

V7 버전: 감정(lonely mood) + 분위기(atmospheric) + 장르(cinematic) = 7단어

V8 버전: 의상의 재질(dark wool overcoat) + 거리의 재질(narrow asphalt) + 비의 각도(steep angle) + 광원의 종류와 위치(single sodium vapor streetlamp behind him) + 반사의 형태(broken streaks) + 신체의 상태(shoulders slightly hunched) + 행동의 구체적 디테일(folded umbrella he hasn't opened) + 렌즈(85mm) + 색조의 물리적 근거(sodium spill vs cool blue ambient) = 구체적인 물리 조건의 서술

V7에서는 "lonely mood"라고 쓰면 모델이 외로움을 시각적으로 해석해줬습니다. V8에서는 외로움을 직접 보여줘야 합니다. 어떻게? "접힌 우산을 펴지 않은 채 비를 맞는" 행동으로. "어깨를 움츠린" 신체 상태로. 감정이 아니라 증거.

예시 2: 부엌의 아침

V7 시대의 프롬프트: cozy morning kitchen, warm light, dreamy atmosphere --v 7

V8에 맞게 다시 쓴 프롬프트: small apartment kitchen, 7am winter morning, weak daylight through frosted single-pane window mixing with warm glow of a standing lamp on the counter, steam rising from a ceramic mug next to an open newspaper, worn linoleum floor with one corner curling up, white refrigerator with yellowed edges, 35mm lens, eye-level perspective from the doorway --v 8 --style raw --ar 4:5 --no text, watermark, logo, signature, readable letters

한국어 번역: 작은 아파트 부엌, 겨울 아침 7시, 성에 낀 단층 유리창으로 들어오는 약한 주광이 카운터 위 스탠드 조명의 따뜻한 빛과 섞이고, 펼쳐진 신문 옆 도자기 머그에서 김이 오르고, 한쪽 모서리가 말려 올라간 낡은 리놀륨 바닥, 가장자리가 누렇게 변한 흰 냉장고, 35mm 렌즈, 문간에서 본 눈높이 시점

V7 버전에서 "cozy"는 감정입니다. V8은 감정을 모릅니다. V8이 아는 것은 물리적 조건입니다. "cozy"를 물리적으로 번역하면: 좁은 공간(small apartment kitchen) + 두 가지 색온도의 빛이 섞이는 상태(frosted window daylight + standing lamp warm glow) + 사용 흔적이 있는 오브젝트(worn linoleum, yellowed refrigerator) + 사람의 존재 흔적(steam from mug, open newspaper).

V8에서 분위기를 만드는 것은 형용사가 아니라, 물리적 조건의 조합입니다.


예시 3: 인물 — 중년 여성

V7 시대의 프롬프트: portrait of a middle-aged woman, beautiful, natural light, emotional --v 7

V8에 맞게 다시 쓴 프롬프트: woman in her late 40s, silver-streaked dark hair pulled back loosely, no makeup, fine lines around her eyes visible, wearing a faded navy linen shirt with top button undone, seated at a bare wooden table, her right hand resting flat on the surface with fingers slightly spread, single large north-facing window behind camera providing even diffused overcast light, no fill, shadow side of face two stops darker, medium format aesthetic, 80mm equivalent, subject fills lower two-thirds of frame, plain off-white plaster wall behind --v 8 --style raw --ar 4:5 --no text, watermark, logo, signature, readable letters

한국어 번역: 40대 후반 여성, 은빛이 섞인 검은 머리를 느슨하게 뒤로 묶고, 화장 없이, 눈가의 잔주름이 보이며, 윗단추를 풀은 바랜 네이비 린넨 셔츠를 입고, 아무것도 없는 나무 테이블에 앉아, 오른손을 테이블 위에 평평하게 놓고 손가락을 약간 벌리고, 카메라 뒤쪽의 큰 북향 창문 하나가 고른 흐린 날 확산광을 제공하고, 보조 조명 없이, 얼굴 그림자 쪽이 2스톱 어둡고, 중형 카메라 감성, 80mm 등가, 피사체가 프레임 아래쪽 2/3를 채우고, 뒤에 평범한 미색 석고 벽

V7 프롬프트에서 "beautiful"은 미드저니에게 "예쁘게 만들어달라"는 요청이었습니다. V8에서 "beautiful"을 쓰면, 모델이 해석하는 "예쁨"의 기본값이 적용됩니다. 그것은 매끈한 피부, 대칭적인 얼굴, 과도한 보정 — 사진가가 원하는 아름다움과는 다른 것입니다.

V8에서 인물의 아름다움을 표현하려면, "beautiful"을 빼고, 대신 그 사람이 누구인지를 써야 합니다. 은빛이 섞인 머리, 눈가의 잔주름, 화장 없는 얼굴, 바랜 린넨 셔츠 — 이것이 V8에서 인물을 만드는 방식입니다. 아름다움은 형용사가 아니라 디테일의 축적에서 나옵니다.

Prompt Token — 프롬프트의 물리적 한계를 알아야 한다

여기서 프롬프트의 기술적 구조를 짚어보겠습니다. 미드저니는 프롬프트를 token 단위로 처리합니다. Token은 단어 하나 또는 단어의 일부에 해당하는 처리 단위입니다.

미드저니의 프롬프트 token 한계:

  • V5까지: 약 75 token

  • V6 이후: 약 150 token으로 2배 확장

  • V8: 공식적으로 발표된 별도의 token 한계 변경은 확인되지 않았습니다. 다만, V8이 긴 프롬프트를 더 정확하게 따른다는 것은 여러 사용자 리포트에서 일관되게 나타납니다.

[확인 필요: V8의 정확한 token 한계는 Midjourney가 공식 발표하지 않았습니다. 아래 내용은 V6 이후 기준(약 150 token)과 V8 사용자 경험에 기반합니다.]

Token과 단어의 관계:

  • 일반적인 영어 단어 1개 = 1 token (예: cat, light, window)

  • 긴 단어나 합성어 = 2 token 이상 (예: fluorescent = 2-3 token)

  • 하이픈 연결어 = 보통 2-3 token (예: north-facing = 2 token)

  • 숫자와 특수문자 = 별도 token

실용적인 기준으로, 약 40~60단어까지가 안전하게 반영되는 범위입니다. 60단어를 넘으면 뒤쪽 단어의 영향력이 약해지기 시작하고, 80단어를 넘으면 거의 무시될 가능성이 높아집니다.

이것은 중요한 의미를 갖습니다. V8이 프롬프트를 정확하게 읽는다 해도, 물리적 한계가 있다는 것. 따라서 모든 것을 프롬프트에 넣을 수는 없습니다. 우선순위를 정해야 합니다.

Token 예산을 어디에 쓸 것인가 — 프롬프트의 우선순위

150 token이라는 예산이 있다면, 어디에 먼저 쓸 것인가. 이것이 V8 시대 프롬프트의 핵심 역량입니다.

사진가에게 권장하는 우선순위는 이렇습니다:

1순위: 주체(subject) — 누가/무엇이 있는가
2순위: 광원(lighting) — 어떤 빛이, 어디에서, 어떻게
3순위: 장소의 물리적 조건(place) — 재질, 크기, 상태
4순위: 카메라/렌즈(camera/lens) — 초점거리, 심도, 시점
5순위: 구성(composition) — 프레이밍, 피사체 위치
6순위: 시간/날씨(proof cues) — 시간대, 계절, 마모 흔적
7순위: 재질 디테일(material details) — 표면, 텍스처
8순위: 색조/팔레트(palette) — 색온도, 채도 방향
9순위: 파라미터 블록 — --v 8, --style raw, --ar, --no

왜 광원이 2순위인가? 사진은 빛의 기록입니다. 같은 피사체도 빛이 달라지면 완전히 다른 이미지가 됩니다. V8은 광원을 물리적으로 처리하기 때문에, 광원을 구체적으로 지정하면 전체 이미지의 톤, 그림자, 반사가 연쇄적으로 결정됩니다. 가장 적은 token으로 가장 큰 효과를 내는 것이 광원입니다.

왜 "분위기(mood)"가 이 목록에 없는가? V8에서 분위기는 결과이지 입력이 아닙니다. 광원 + 재질 + 시간대 + 공간의 크기가 조합되면 분위기는 저절로 생깁니다. "moody"라고 쓰는 대신, 그 분위기를 만드는 물리적 조건을 써야 합니다.


사진가의 언어를 프롬프트로 번역하기 — 핵심 변환표

사진 경험이 있는 분들은 현장에서 특정한 시각적 판단을 합니다. 그 판단을 미드저니가 이해하는 언어로 옮기는 것이 핵심입니다.

여기 실전 변환의 예를 정리합니다.

조명 언어의 변환:

"역광으로 찍고 싶다" → backlit subject, rim lighting from behind, light source at camera's 6 o'clock position

"창문 빛, 부드러운 느낌" → diffused daylight through large frosted window, soft wrapping light, gentle falloff

"형광등 아래의 차가운 느낌" → overhead fluorescent tube casting flat greenish-white light, hard ceiling bounce, no warm fill

"가로등 하나만 있는 밤" → single sodium vapor streetlamp from frame left, warm orange cone of light, deep shadows beyond spill radius

"흐린 날 야외" → overcast sky acting as giant softbox, no directional shadows, even ambient light, flat but luminous

카메라/렌즈 언어의 변환:

"아웃포커스를 많이 주고 싶다" → shallow depth of field, f/1.4, bokeh separation, subject sharp against diffused background

"광각으로 공간감을 넣고 싶다" → 16mm wide angle lens, barrel distortion at edges, exaggerated perspective depth

"망원으로 압축 효과를 내고 싶다" → 200mm telephoto compression, flattened depth planes, stacked background elements

"중형 카메라 느낌" → medium format aesthetic, 80mm equivalent, gradual tonal rolloff, fine grain structure

"필름 느낌" → analog film grain, halide crystal noise, 35mm film texture, slight color shift in shadows

공간/재질 언어의 변환:

"낡은 느낌" → peeling paint, hairline cracks in plaster, dust settled in corners, faded color from sun exposure

"깨끗한 미니멀" → bare white walls, no decoration, single object on empty surface, negative space dominant

"습한 느낌" → condensation on cold glass surface, damp concrete with dark water stains, visible moisture on metal

"차가운 공간" → exposed concrete walls, stainless steel surfaces, fluorescent overhead light, no textile or wood

실전 연습: 하나의 장면을 5단계로 쌓아올리기

하나의 장면을 단계별로 구축하는 과정을 보여드리겠습니다. 프롬프트를 한 번에 완성하는 것이 아니라, 층위를 쌓아가는 방식입니다.


장면: 새벽 어시장의 한 구석


1단계 — 주체와 장소만 (최소 프롬프트): corner of a fish market at dawn

이것만으로도 V8은 이미지를 만들어줍니다. 하지만 모든 세부 사항은 모델의 기본값입니다.

2단계 — 광원 추가: corner of a fish market at dawn, first grey daylight leaking through corrugated metal roof gaps mixed with bare incandescent bulbs hanging on wires

빛이 들어오면 장면의 성격이 바뀝니다. 새벽 주광과 백열전구의 혼합 — 이것만으로 차가운 하늘빛과 따뜻한 인공광의 대비가 생깁니다.

3단계 — 재질과 디테일 추가: corner of a fish market at dawn, first grey daylight leaking through corrugated metal roof gaps mixed with bare incandescent bulbs hanging on wires, wet concrete floor with fish scales scattered, blue plastic crates stacked three high, crushed ice reflecting both light sources

바닥의 재질(wet concrete), 비늘(fish scales), 파란 플라스틱 상자(blue plastic crates), 부서진 얼음(crushed ice) — 각각이 공간의 구체성을 만듭니다.

4단계 — 인물과 동작 추가: corner of a fish market at dawn, first grey daylight leaking through corrugated metal roof gaps mixed with bare incandescent bulbs hanging on wires, wet concrete floor with fish scales scattered, blue plastic crates stacked three high, crushed ice reflecting both light sources, middle-aged man in rubber boots and a stained apron sorting fish with both hands, his breath visible in cold air

인물이 들어오되, 감정이 아니라 행동과 물리적 상태로 묘사합니다. 고무장화, 얼룩진 앞치마, 양손으로 생선을 고르는 동작, 찬 공기에 보이는 입김.

5단계 — 카메라와 파라미터: corner of a fish market at dawn, first grey daylight leaking through corrugated metal roof gaps mixed with bare incandescent bulbs hanging on wires, wet concrete floor with fish scales scattered, blue plastic crates stacked three high, crushed ice reflecting both light sources, middle-aged man in rubber boots and a stained apron sorting fish with both hands, his breath visible in cold air, 35mm lens, slight handheld tilt, eye-level perspective --v 8 --style raw --ar 3:2 --no text, watermark, logo, signature, readable letters

한국어 번역: 새벽 어시장의 한 구석, 골함석 지붕 틈새로 스며드는 첫 회색 주광이 전선에 매달린 맨 백열전구와 섞이고, 생선 비늘이 흩어진 젖은 콘크리트 바닥, 세 단으로 쌓인 파란 플라스틱 상자, 두 광원을 반사하는 부서진 얼음, 고무장화에 얼룩진 앞치마를 두른 중년 남성이 양손으로 생선을 고르고 있으며, 찬 공기에 입김이 보인다, 35mm 렌즈, 약간의 핸드헬드 기울임, 눈높이 시점

이 과정에서 중요한 것: 각 단계를 V8에서 실제로 생성해보면서, 어느 지점에서 이미지가 원하는 방향으로 가는지, 어느 단어가 결정적인 차이를 만드는지를 확인하는 것입니다. V8의 속도(V7 대비 4~5배 빠름)가 이 실험을 가능하게 합니다.

V8에서 절대 쓰지 말아야 할 단어들

V7에서는 효과가 있었지만, V8에서는 의미가 없거나 해로운 단어들이 있습니다. 이 단어들은 V8에서 쓰면 모델이 기본값으로 해석하거나, 과도하게 매끈한(over-polished) 결과를 냅니다.

감정/분위기 형용사: beautiful, stunning, breathtaking, ethereal, dreamy, magical, haunting, mysterious

장르 키워드: cinematic, dramatic, epic, powerful, profound

분위기 조명: dramatic lighting, cinematic lighting, moody atmosphere (광원 특정 없이 사용 시)

이것들 대신 무엇을 쓸 것인가:

"beautiful" 대신 → 인물의 구체적 외모와 상태를 서술
"cinematic lighting" 대신 → 광원의 종류, 위치, 방향을 직접 지정
"dramatic" 대신 → 명암비(contrast ratio), 그림자 깊이, 하이라이트 위치를 서술
"moody atmosphere" 대신 → 시간대 + 날씨 + 광원 + 재질의 조합으로 대체
"ethereal" 대신 → 구체적 기상 조건 (morning mist at knee height, 8am, diffused)


V8은 정직합니다. 구체적으로 쓰면 구체적으로 만들고, 막연하게 쓰면 막연하게 만듭니다.

--no 파라미터 (미드저니 문서에서는 작동된다고 나오나, 아직 alpha 버전이라서 - 실질적으론 error 발생)

V8에서 --no 피하기 → 대신 프롬프트 본문에서 부정적으로 설명하세요.
예:

  • 기존: elderly man walking in the rain --no umbrella

  • V8 추천: elderly man walking in the rain, holding nothing, empty hands, no umbrella visible

텍스트 렌더링 — V8에서 크게 개선된 부분

한 가지 반가운 변화가 있습니다. V8에서 이미지 안의 텍스트 렌더링이 크게 개선되었습니다. 프롬프트에서 텍스트를 큰따옴표로 감싸면 읽을 수 있는 텍스트가 생성될 확률이 높아졌습니다.

예시: a cat sitting next to a small chalkboard reading "OPEN" --v 8

V7에서는 텍스트가 왜곡되거나 읽을 수 없는 경우가 많았지만, V8에서는 간단한 단어의 경우 상당히 정확하게 렌더링됩니다. 100%는 아니지만, 체감할 수 있는 개선입니다.

다만, 우리 작업에서 의도하지 않은 텍스트는 여전히 --no text, readable letters로 제거해야 합니다.


사진가에게 Literal Interpretation이 유리한 이유

이 글의 핵심을 다시 짚겠습니다.

V8이 프롬프트를 글자 그대로 읽는다는 것은, 프롬프트에 물리적 조건을 구체적으로 쓸 수 있는 사람이 유리하다는 뜻입니다.

사진을 10년 이상 하신 분들은 이미 이 능력을 갖고 있습니다.

여러분은 현장에서 이런 것을 봅니다:

  • 이 빛은 북향 창문의 확산광이다

  • 그림자 쪽이 약 2스톱 어둡다

  • 이 벽은 콘크리트라 반사가 차갑다

  • 85mm에서 이 거리면 배경이 이 정도로 흐려진다

  • 이 바닥은 리놀륨이고 20년은 된 것 같다

이 관찰들을 영어로 옮기면 그것이 V8 프롬프트가 됩니다. V7에서는 이 지식이 필요 없었습니다. "atmospheric"와 "cinematic" 몇 단어로 충분했으니까요. V8에서는 이 지식이 프롬프트의 품질을 결정합니다.

미드저니가 감정을 해석하던 시대가 끝났고, 물리를 실행하는 시대가 시작되었습니다. 물리를 아는 사람이 이깁니다. 그것이 사진가입니다.


다음 글에서는 --raw 모드가 V8에서 어떻게 작동하는지, 그리고 V8 기본 모드와 --raw의 실제 차이를 다루겠습니다.

V8 Alpha 관련 사실 확인 사항:

  • V8 Alpha 출시일: 2026년 3월 17일, alpha.midjourney.com

  • Discord: 미지원 (2026년 4월 13일 기준)

  • Token 한계: V6에서 150 token으로 확장 확인. V8 별도 변경은 공식 미확인.

  • V8 프롬프트 해석 방식 변화: 다수 사용자 리포트 및 리뷰 기반 (MindStudio, House of GAI, Blake Crosley 등)

  • 텍스트 렌더링 개선: V8 Alpha 공식 업데이트 노트 + 사용자 리포트



프롬프트 예시

Prompt 1: an open notebook with handwritten text on the left page and a completely blank right page, the notebook resting on a scratched wooden desk, single desk lamp from upper left casting hard shadow of a pen across the blank page, 50mm lens, overhead three-quarter view --v 8 --style raw --ar 3:2 --no text, watermark, logo, signature, readable letters

한국어 번역: 왼쪽 페이지에 손글씨가 있고 오른쪽 페이지는 완전히 빈 열린 노트북, 긁힌 나무 책상 위에 놓여 있고, 왼쪽 위의 책상 스탠드 하나가 빈 페이지 위로 펜의 단단한 그림자를 드리우고, 50mm 렌즈, 위에서 3/4 시점

Prompt 2: two identical white ceramic cups on a concrete countertop, left cup filled with black coffee catching overhead light as a bright oval on the surface, right cup empty with shadow pooling inside, symmetrical composition, straight-on eye-level view, diffused north-facing window light, minimal scene --v 8 --style raw --ar 16:9 --no text, watermark, logo, signature, readable letters

한국어 번역: 콘크리트 카운터탑 위의 동일한 흰 도자기 컵 두 개, 왼쪽 컵은 블랙 커피가 담겨 천장 빛을 밝은 타원으로 잡고, 오른쪽 컵은 비어서 안에 그림자가 고여 있고, 대칭 구성, 눈높이 정면 시점, 북향 창문의 확산광, 최소한의 장면

Prompt 3: a narrow alley between old brick buildings at 5am, no people, first blue light of pre-dawn visible in a thin strip of sky above, ground level puddle reflecting the strip of sky, one warm light leaking from a half-open metal door on the left wall, 28mm lens, low angle camera tilted slightly upward, film grain --v 8 --style raw --ar 9:16 --no text, watermark, logo, signature, readable letters

한국어 번역: 새벽 5시 낡은 벽돌 건물 사이 좁은 골목, 사람 없이, 위쪽 하늘의 얇은 띠에 새벽 전 첫 파란 빛이 보이고, 바닥 웅덩이가 하늘 띠를 반사하고, 왼쪽 벽의 반쯤 열린 철문에서 따뜻한 빛이 새어나오고, 28mm 렌즈, 약간 위를 향한 로우 앵글, 필름 그레인

Previous
Previous

기계가 서투르게 꿈꿀 때 — Joanna Zylinska를 Midjourney 시대에 다시 읽다

Next
Next

Midjourney V8 — 사진가가 알아야 할 10가지 (1)