다초점 풍경 2. 생성 AI 영상의 발전 속도는 너무 빠르다

하늘을 나는 이순신 장군 동상을 맑은 대낮에 찍은 동상 사진 한 장으로 최근에 이미지 기능이 업데이트된 그록(Grok) 4.1로 만들었다. 잘 보면 아직 많은 헛점이 보이는데 특히 장검을 들었을 때 칼집을 빼지 않고 바로 변하는 이순신 장군의 오른손에 잡은 장검은 중세시대 기사가 쓰던 칼의 형태로 변했다. /조인원 기자

며칠 전 미국 시사 주간지 타임(TIME)이 올해의 인물로 엔비디아의 젠슨 황, 오픈 AI의 샘 올트먼, X의 일론 머스크, 메타의 마크 저커버그 등 AI 기업인 8인을 선정했습니다. AI는 이제 피하거나 돌아갈 수 없는 대세가 되고 있습니다. 저는 챗GPT가 세상을 놀라게 하고 몇 달 후에 ‘대체 뭐기에?’라는 호기심으로 이미지 도구인 DallE2부터 쓰기 시작해보았습니다. 2년 좀 더 된 얘기입니다.

그 후 생성형 AI로 사진을 제작하고 전시한 작가들을 만나서 작업 이야기를 듣고 이곳에 몇 번 기사로 소개하고, 저도 직접 써보면서 이게 어떻게 변할지 고민하고 여러 사진가와 토론도 하고 책도 봤습니다. 하지만 AI는 책이나 강의를 들을 게 아닙니다. 직접 (무료 맛보기가 아닌) 유료 회원이 되어 그 놀라운 지식의 보고를 누려봐야 필요성을 체감할 것입니다. 그렇다고 제가 AI 전문가는 아니지만 자주 쓰다 보니 똑똑한 도우미를 옆에 두고 쓰는 수준이 되어가고 있습니다.

일어서서 만세하는 전봉준 동상. 종각역 앞에 있는 전봉준 동상 사진 한 장으로 그록(Grok) 4.1을 이용해 만든 영상. 마지막 만세 동작의 옷소매가 조선시대 양반 도포처럼 넓게 나와 좁아야 한다고 명령해서 수정된 것이 영상 앞부분 일어서는 동작들이다. /조인원 기자

그중에서도 AI가 만드는 이미지가 얼마나 제대로일까라는 의구심으로 시작한 2년 전의 호기심은 이제 AI의 한계는 어디까지 갈까라는 우려로 바뀌고 있습니다. 이렇게 말씀드리면 혹시 사진기자로서 직업적 위기감이 생기냐고 반문하시겠지만 절대 그건 아닙니다. 실사로 촬영하고 기록하는 사진과 영상은 그대로 가고 더 가치가 돋보일 것입니다. 다만 시각 매체로서 전혀 다른 결과물이 나오는 것에 놀랄 뿐입니다.

서울 성수동에서 지난 5월에 촬영한 사진을 그록(Grok) 4.1에 넣었더니 도로의 차들은 지나가고 건물에 걸린 광고 사진의 모델이 머리를 빗고 있는 영상으로 바뀌었다./조인원 기자

각설하고 오늘 보여드릴 AI 결과물은 미국 내에서 문제의 인물이자 곧 최고의 부자가 될 X의 일론 머스크가 만든 그록(Grok) 4.1입니다. 그전에 미드저니, 런웨이, 클링, 피카나 폴로, 소라 등을 유료로 쓰며 생성 영상을 만들어봤습니다. 불과 1년 전만 해도 대부분 이미지에서 영상을 제작하려면 포인트를 써야 했습니다. 유료 회원이 아니면 가입 때 받은 맛보기로는 영상 제작은 거의 힘들었는데 지난 11월에 업데이트한 그록 4.1은 유료가 아닌 무료 가입 회원들에게도 사진을 움직이는 짧은 동영상으로 만들 수 있게 변경시켰습니다. 물론 이것도 일정한 횟수가 지나면 작동이 안 되거나 느려질 것입니다만 저는 20회 가까이 써보기도 했습니다.

황학동 중고 가구점. 그록(Grok) 4.1로 넣었더니 쏟아지는 영상이 자동으로 생성되었다./조인원 기자

더 놀라운 것은 다른 AI들에 비해 사실적인 움직임과 디테일도 비교적 좋고, 사람이 아닌 사진 속 인물이나 동물, 동물 형상의 도자기, 동상까지 살아 있는 것처럼 묘사한다는 것입니다.

서울 광화문 광장의 이순신 장군 동상, 서울 지하철 종각역 앞의 전봉준 동상, 성수동의 광고판, 황학동의 중고 의자들, 전시회에 나온 고려 시대 용 모양 도자기 등을 그록 AI로 만들어서 올려봅니다. 마찬가지로 최근 부쩍 좋아진 구글의 막강 AI 제미나이(Gemini)에서 쓰는 베오(Veo)3로 써본 ‘짤’(짧은 영상)을 올려봅니다. 사진 설명에 쓰겠지만 베오3도 다른 LLM(거대 언어 모델) AI 영상들보다 좋은 결과물을 내놓습니다.

맑은 날에 갑자기 폭설이 쏟아지는 상황을 가정해서 구글 제미나이의 베오3로 만들었다. /조인원 기자

덧붙여서, AI를 배우는 것을 저는 밥통 매뉴얼에 비유합니다. 밥을 먹어야 사는 우리에게 밥통은 필요한 도구입니다. 그런데 밥통을 매뉴얼을 보며 배워 쓰진 않습니다. 아이들이 장난감을 갖고 놀듯이 이것저것 눌러보고 해보면 금방 압니다. AI가 강의로 배워야 할 거라면 AI가 아닐 것이고, 좀 더 기다리면 영화에 나오는 로봇들처럼 진짜 말로만 명령하면 다 되는 수준까지 될 것입니다. 다만 AI를 써본 몇 가지 경험을 잠깐 정리해 보겠습니다. 특히 생성 이미지를 제작하는 AI에 관해서입니다. 이건 제 경험뿐 아니라 저보다 훨씬 많이 해본 공학자, 교수, 예술가들의 이야기이기도 합니다.

첫째, 한 번에 나오는 건 없다. 여러 번 시도하고 완성도에서 80% 만족해도 20%를 수정하기 위해 수십 번을 더 시도하기도 한다. 그러나 안 나오는 건 별게 아니어도 절대 안 나온다.

둘째, 내가 쓰는 AI는 많이 오래 할수록 결과물이 빨리 나오는데, 내가 AI를 알아가기 때문이기도 하지만 AI가 나의 정보—나의 지식 정도와 취향, 경험치 등을 축적하기 때문이다. 이걸 깨달을 때 편하기도 하지만 한편으로 겁도 난다. AI가 나를 조정할 것 같아서. LLM을 쓸 때 가끔 기계가 아니라 누군가와 소통한다는 느낌은 확실히 든다.

지난 4월에 맑은 날 촬영한 사진을 베오3에 넣어서 갑자기 비바람이 부는 영상으로 변환했다. 같은 프롬프트로 다른 영상 AI들에게 주문했지만 어처구니 없는 그림만 생성되었다. /조인원 기자

셋째, AI 발전 속도가 너무 빨라서 법 개정이 시급한데, 세상이 그걸 못 따라가고 있다고 실감한다.

넷째, AI를 겁내거나 피할 필요가 없다. 새로운 기술을 적극적으로 해보고 잘 쓰면 된다.

맑은 날을 제미나이의 베오3 로 갑자기 안개가 끼는 상황으로 만들었다. /조인원 기자

아날로그 필름 카메라를 배워 입사한 내가 디지털 카메라로 바꾼 후에 한동안 두 개를 같이 갖고 다닌 적이 있다. 10여 년 전쯤 국내 1세대 사진가 김한용 선생의 인터뷰를 마칠 때쯤 디지털 카메라나 휴대폰 사진을 어떻게 생각하시는지 질문했다. 그때 90세이셨던 선생은 자신도 요즘 갤럭시 휴대폰으로 사진을 찍는다며, 폰 사진도 부족함이 없다며 “이렇게 쉽게 찍을 수 있는 훌륭한 기술에 감사하며 열심히 찍으면 되지”라고 했다. 70년 넘게 세상에 나온 전문가용 카메라를 직접 사서 써본 사진가의 대답이었다.

지난 2월 용산 국립중앙박물관에서 열린 고려상감청자전에서 12세기에 제작된 청자 용모양 향로. 그록(Grok) 4.1로 사진을 업로드했더니 마치 둥근 향로가 저절로 돌고 용의 형상이 알아서 머리 부분을 움직였다. /조인원 기자

사진이 아닌 다른 볼거리로 떠들다 보니 좀 길었습니다. 가끔 이곳에 생성 AI 이미지나 딥페이크 영상 등에 관한 이야기들을 가져와 소개해보겠습니다.