기계가 서투르게 꿈꿀 때 — Joanna Zylinska를 Midjourney 시대에 다시 읽다

Apr 14

Written By Avocado

이 책을 집은 이유는 칭찬이 필요해서가 아니었다. 반박이 필요했다. 정확히 말하면, Midjourney가 만들어내는 아름다움에 점점 편안해지고 있는 나 자신에게 반론을 제기할 누군가가 필요했다.

카메라 앞에서 2년 반, AI 이미지 앞에서 2년. 그 시간 동안 나는 하나의 확신을 만들어왔다. 도구와 언어 사이의 간극은 의도로 건넌다. Midjourney는 도구이지 언어가 아니다. 내가 거기에 의도의 구조를 얹을 때 비로소 언어가 된다. 그래서 도구를 빼도 같은 이야기를 할 수 있느냐는 것이 검증법이다.

Joanna Zylinska는 이 확신을 부정하지 않는다. 그러나 더 불편한 질문을 던진다. 당신이 타이핑을 시작하기 전에, 기계가 이미 당신의 의도를 포맷하고 있다면?

이 책에 대하여

Joanna Zylinska는 King's College London 교수이며, 미디어 이론, 사진 철학, AI 윤리를 넘나드는 작가이자 아티스트이다.¹ AI Art: Machine Visions and Warped Dreams는 2020년 Open Humanities Press에서 출간되었고, OAPEN을 통해 전문을 무료로 읽을 수 있다.²

2020년이라는 출간 시점이 중요하다. DALL-E 2도, Midjourney도, Stable Diffusion도 존재하지 않던 때이다. Zylinska가 분석한 것은 GAN, style transfer, DeepDream 같은 이전 세대의 AI art이다. 그런데 이 책의 핵심 논점은 2026년 현재, V8 시대에 오히려 더 강하게 울린다. 이것이 진짜 이론의 징표이다. 기술이 아직 묻지 못한 질문을 미리 묻는다.

Zylinska의 도발 — 대부분의 AI art는 나쁘다

Zylinska는 에둘러 말하지 않는다. 오늘날 AI art로 통용되는 것의 대부분은 나쁘다고 단언한다.³ 기술적 신기함을 축하할 뿐, 예술이 응당 마주해야 할 질문들 — 노동, 생태, 권력, 기술 체계 안에서 인간의 위치 — 을 회피한다는 것이다. Zylinska는 이런 작업을 "화려하게 포장된 Candy Crush"에 비유하기까지 한다.⁴

2020년에 이것은 GAN 초상화와 neural style transfer에 대한 진단이었다. 2026년에 이것은 구조적으로 동일하되 규모가 다른 문제를 가리킨다. Midjourney community channel을 열어 보라. 흘러내리는 드레스를 입은 여인, bioluminescent 숲, cyberpunk 도시 풍경. 기술적으로 놀랍고, 미학적으로 교환 가능하다. 도구는 엄청나게 좋아졌다. Zylinska가 던진 핵심 질문은 답을 얻지 못했다. 좋아졌다고 — 무엇을 위해? 누구를 위해?

이것은 내가 수업에서 반복하는 원칙과 정확히 겹친다. cliche는 기술의 실패가 아니라 자기 인식의 실패이다. 수강생이 백 번째 golden hour portrait를 만들면서 자신이 왜 그 빛에 끌리는지 모른다면, 그것은 art가 아니다. 본인보다 먼저 그 알고리즘을 내면화한 기계의 문화적 명령을 실행하고 있을 뿐이다.

언제나 이미 기술적이었다 — 인간/기계 이분법의 붕괴

Zylinska의 가장 중요한 논점은 나쁜 AI art에 대한 비판이 아니라, 창의성 자체에 대한 재정의이다. 인간의 창의성은 "언제나 기술적이었고, 어느 정도는 인공적으로 지능적이었다(always been technical and to some extent artificially intelligent).

이것은 비유가 아니다. Vilem Flusser의 기술적 이미지 철학, Donna Haraway의 cyborg 이론을 경유하면서, Zylinska는 인간적 창의성 대 기계적 생산이라는 대립이 허구적 이분법이라고 주장한다.⁶ 이 대립은 실제로 이미지가 만들어지는 방식을 기술하기보다는, 고독한 천재라는 신화를 보호하는 이데올로기적 기능을 수행한다.

사진작가에게 이 논점은 즉각적으로 인식 가능하다. 카메라는 현실을 향한 투명한 창이 아니다. 선택하고, 프레이밍하고, 노출하고, 압축한다. 모든 사진은 인간의 의도와 기계적 과정의 협업이다 — Flusser가 "apparatus"라고 부른 것과의 협업.⁷ 순수한 저작권을 주장하는 사진가는 shutter speed, lens distortion, 화학적 혹은 알고리즘적 processing을 잊고 있는 것이다.

Zylinska는 이 논리를 AI로 확장한다. 사진이 처음부터 인간-기계 협업이었다면, AI 이미지 생성은 단절이 아니라, 1826년 Nicephore Niepce가 주석판에 빛을 노출한 순간부터 존재했던 조건의 심화이다. 기계가 이미지 제작에 참여하는가가 질문이 아니다 — 참여는 언제나 있었다. 질문은, 그 참여의 조건이 어떻게 변했는가이다.

사진작가가 들어야 할 말

사진작가에게 이 책에서 가장 불편한 대목은 AI art 비판이 아니라, 사진 자체에 대한 고고학이다. 모든 사진에 비인간적 요소가 내재한다면 — Zylinska가 말하는 "기술적, 문화적 알고리즘의 기계적 실행"⁸ — 사진가의 고유한 저자성 주장은 우리가 믿고 싶은 것보다 언제나 더 취약했다.

Roland Barthes는 Camera Lucida에서 사진의 힘을 indexicality에서 찾았다 — "that-has-been(ca-a-ete)," 빛이 한때 표면에 닿아 흔적을 남겼다는 보증.⁹ Zylinska는 2017년 저서 Nonhuman Photography에서 이 특권을 체계적으로 해체했다.¹⁰ camera obscura에서 위성 이미지, 의료 scan, CCTV에 이르기까지, 역사상 대다수의 사진은 인간의 손으로 찍히거나 인간의 눈으로 보인 적이 없다고 그는 주장한다.

이것은 추상적 논점이 아니다. 2026년에 사진을 가르친다는 것의 의미를 재편한다. 내가 기초반 1주차에 "주제 없이 30장을 만들고 3장만 저장하라"고 할 때, 나는 Midjourney를 가르치는 것이 아니다. 자신의 선택 패턴을 알아차리게 하는 것이다 — 도구가 바뀌어도 지속되는 시각적 습관. Zylinska의 프레임워크는 이 교육적 직관에 이론적 무게를 부여한다. 도구가 언제나 비인간적이었다면, 한 사진가를 다른 사진가와 구별하는 유일한 것은 apparatus에 가져오는 의도의 구조이다. 카메라가 아니다. 소프트웨어가 아니다. 바라보는 방식을 드러내거나 감추는 선택의 패턴이다.

AI visual artist가 직면해야 할 것

AI를 주된 도구로 사용하는 우리에게, Zylinska는 다른 종류의 도전을 제기한다. 그는 AI art를 둘러싼 담론 자체에 깊은 회의를 표한다 — "근시안적으로 남성중심적이고, 왜곡되어 있으며, 생태 위기에 둔감한(myopically masculinist, warped and failing, and insensitive to the ecological crisis)" 담론이라고.¹¹ 이것은 미학적 판단이 아니라 구조적 판단이다. 개별 AI artist에게 재능이 없다는 말이 아니다. AI 이미지 생성의 인프라 — 동의 없이 수집된 dataset, 에너지를 태우는 compute cycle, 보이지 않게 처리되는 data annotator의 노동 — 가 예술이 드러내야 할 바로 그 권력 비대칭을 재생산하고 있다는 말이다.

나는 수업에서 도구와 언어의 구별을 이렇게 설명한다. 도구가 언어가 되려면 의도의 구조가 필요하다 — 무엇을 만들었는가뿐 아니라, 왜 다른 이미지가 아닌 이 이미지인가를 말할 수 있어야 한다. 검증법은 단순하다. 그 도구를 빼도 같은 이야기를 할 수 있는가? 할 수 있다면 도구가 당신의 언어를 섬긴 것이다. 할 수 없다면 도구가 당신의 언어였던 것이고, 당신은 스스로 이해하지 못하는 방식으로 그것에 의존하고 있다.

Zylinska는 이 프레임워크를 생산적으로 복잡하게 만든다. AI는 인간의 의도에 의해 언어로 격상되기를 기다리는 단순한 도구가 아니다. 어떤 의미에서 이미 하나의 행위자이다 — training data에 인코딩된 미학적 선호를 가지고, 특정 prompt에 저항하고 다른 것을 증폭하는 체계.¹² 질문은 AI가 co-creator가 될 수 있느냐가 아니다. 질문은, 우리가 주의를 기울이지 않을 때 — 그러니까 대부분의 시간 동안 — AI가 무엇을 만들고 있는지에 대해 정직한가이다.

여기서 내 교육 철학과 Zylinska의 비판이 생산적 긴장 속에서 만난다. 나는 작가가 자기만의 시각적 언어를 발견해야 한다고 주장한다 — 도구와 프로젝트를 넘어 지속되는 바라봄의 심층 문법. Zylinska는 도구가 결코 중립적이지 않다고, 작가가 말하기 시작하기 전에 도구가 이미 문법을 형성하고 있다고 주장한다. 둘 다 맞다. 종합은 이것이라고 생각한다. 시각적 언어의 발견에는 자기 인식뿐 아니라 도구 인식이 필요하다 — 기계가 당신에게 보여주고 싶어 하는 것이 무엇인지, 그리고 왜인지에 대한 정직한 대면.

비인간 사진에서 AI art로 — Zylinska 사유의 궤적

이 책을 온전히 이해하려면, 3년 앞서 나온 Zylinska의 전작 Nonhuman Photography(MIT Press, 2017)를 함께 읽어야 한다. 그 책에서 Zylinska는 사진의 역사 전체를 재편하는 하나의 테제를 제출했다. 사진은 인간의 발명품이 아니라, 인간을 포함하되 인간에 한정되지 않는 이미지 생산 체계의 일부라는 것이다. CCTV, drone, 의료 영상, 위성 사진 — 이것들은 인간의 의도 없이 생산되지만 엄연히 사진이다. Zylinska는 이것을 "nonhuman photography"라고 불렀다.

여기서 AI Art로의 이행은 논리적 필연이다. 비인간적 이미지 생산의 역사가 사진의 탄생부터 존재했다면, AI가 만드는 이미지는 그 역사의 최신 장이지 별개의 현상이 아니다. 그러나 결정적 차이가 있다. 전통적 nonhuman photography — 위성 사진이든 CCTV이든 — 는 여전히 indexical하다. 빛이 센서에 닿았다는 물리적 사실이 남아 있다. AI 이미지에는 이 물리적 흔적이 없다. 카메라 앞에 아무것도 없었다. 카메라 자체가 없었다. 있는 것은 training data라는 거대한 문화적 아카이브와, 그 아카이브에서 통계적으로 추출된 시각적 가능성뿐이다.

Nonhuman Photography에서 AI Art로의 이행은 Zylinska에게 사유의 확장이자 심화이다. 전작에서 "사진은 인간만의 것이 아니다"라고 했다면, 후속작에서는 "그렇다면 AI가 만드는 이미지 앞에서 작가란 무엇인가"로 질문이 깊어진다. 이 궤적을 아는 것은 AI Art를 단독으로 읽는 것보다 훨씬 풍부한 독서를 가능하게 한다.

2020년에서 2026년으로 — 무엇이 변했고, 무엇이 변하지 않았나

Zylinska는 Midjourney가 존재하기 전에 이 책을 썼다. DALL-E 2, Stable Diffusion, text-to-image 생성의 폭발 이전에. 그가 분석한 작품들 — GAN, style transfer, robotic art, net art — 은 이야기의 앞 장에 속한다.

그러나 그의 구조적 논점은 힘만 더했다. 2020년에 진단한 novelty의 축하는 거대하게 확장되었다. 그가 지적한 노동의 비가시성은 이제 전 세계적 논쟁이다 — 작가들이 training data에 대해 소송을 제기하고, 전체 creative industry가 generative AI와의 공존 조건을 논의하고 있다. 그가 언급한 생태적 비용은 diffusion model의 compute 수요와 함께 배가되었다.

변한 것은 접근의 민주화이다. 2020년에 AI art는 기술적 전문성 — Python, TensorFlow, GAN에 대한 이해 — 을 요구했다. 2026년에는 text prompt만 있으면 누구나 기술적으로 놀라운 이미지를 만들 수 있다. 이 민주화는 진정으로 새로운 것이며, Zylinska의 책이 예견할 수 없었던 부분이다. 그러나 시각적 언어의 질문은 이미지 생산의 진입장벽이 제로로 떨어질 때 덜 긴급해지는 것이 아니라 더 긴급해진다. 모든 사람이 아름다운 이미지를 만들 수 있을 때, 아름다움은 구별의 기준이 되기를 멈춘다. 남는 것은 의도, 일관성, 그리고 기계가 당신 자신의 바라봄의 패턴에 대해 드러내는 것과 대면하려는 의지이다.

열린 책, 열린 질문

실용적인 사실 하나를 강조하고 싶다. AI Art: Machine Visions and Warped Dreams는 open-access license로 출간되었고, OAPEN에서 무료로 다운로드할 수 있다. AI art를 가르치거나 배우는 사람에게 이것은 중요한 사실이다. 비용 장벽 없이 읽고, 공유하고, 발췌하고, 토론할 수 있다.

나는 이 책을 Barthes, Flusser, Stiegler와 함께 읽기를 권한다. Zylinska의 모든 주장에 동의하기 때문이 아니라, 편안한 실천가가 피하는 질문을 그가 던지기 때문이다. 왜 당신의 이미지는 다른 모든 사람의 이미지와 비슷해 보이는가? 당신이 결정하기 전에 기계가 무엇을 결정했는가? 그리고 인간의 창의성이 언제나 이미 기술적이었다면, prompt를 타이핑할 때 당신이 기여하는 것은 정확히 무엇인가?

편안한 질문이 아니다. 필요한 질문이다.

그리고 이 질문들은 내가 이 블로그에서 계속 따라가는 하나의 축과 만난다 — 이미지는 어떻게 기억하는가. Zylinska는 AI 이미지가 사건을 기억하지 않는다는 것을 보여준다. dataset을 기억한다. 순간이 아니라, 세계가 이미 촬영되고, captioning되고, 반복된 방식의 통계적 분포를 기억한다. Barthes의 사진이 "그것이 거기 있었다(that has been)"고 말했다면, AI 이미지는 "그것이 보여졌고, 평균화되었고, 재생산되었다"고 말한다. 그 기억은 집합적이고, 알고리즘적이며 — 작가가 진정한 의도를 가지고 개입하지 않는 한 — 익명이다.

개입은 우리의 몫이다.

Notes

Joanna Zylinska, King's College London.
Joanna Zylinska, AI Art: Machine Visions and Warped Dreams (London: Open Humanities Press, 2020). 전문 무료 공개: https://library.oapen.org/handle/20.500.12657/40042
Zylinska, AI Art. "glorified version of Candy Crush"
Vilem Flusser, Towards a Philosophy of Photography, trans. Anthony Mathews (London: Reaktion Books, 2000); Donna Haraway, "A Cyborg Manifesto," in Simians, Cyborgs, and Women: The Reinvention of Nature (New York: Routledge, 1991), 149-181.
Flusser, Towards a Philosophy of Photography.
Roland Barthes, Camera Lucida: Reflections on Photography, trans. Richard Howard (New York: Hill and Wang, 1981). Originally published as La chambre claire: Note sur la photographie (Paris: Cahiers du Cinema / Gallimard / Seuil, 1980).
Joanna Zylinska, Nonhuman Photography (Cambridge, MA: MIT Press, 2017).
Zylinska, AI Art, https://library.oapen.org/handle/20.500.12657/40042

Avocado https://luxlatens.com