김대식 KAIST 교수·뇌과학

아널드 슈워제네거의 대표작인 영화 '터미네이터'의 한 장면이다. 미래에서 온 로봇에 쫓기던 주인공 사라 코너는 부모님도 빨리 도망가야 한다고 집에 전화한다. 그런데 늘 짜증이 섞였던 엄마의 목소리가 무언가 수상하다. 분명히 엄마의 목소리였지만, 갑자기 너무도 상냥하니 말이다. 학습 능력을 가진 인공지능 기계가 엄마의 목소리를 흉내 내고 있었던 것이다.

인간을 흉내 내는 기계. 더 이상 공상과학 영화 속 이야기가 아니다. 최근 기계 학습 분야에서 가장 많은 관심을 받고 있는 GAN(Generative Adversarial Networks·대립적 생성 회로망)이라는 기술이 보여주는 미래 비전이다. 기본 딥러닝 방법들과는 달리 GAN은 두 가지 인공 신경망을 사용한다. 랜덤 상태로부터 시작되는 '생성기'(generator)는 가짜 데이터를 만들어내고, '분류기' 회로망은 생성기가 만들어낸 데이터를 진짜 데이터와 구별할 수 있는지 구별한다. 생성기가 만들어낸 가짜 데이터와 분류기가 알고 있는 진짜 데이터가 더 이상 구별되지 않을 때까지 학습한다면? GAN은 존재하지 않는 새로운(가짜) 데이터를 만들어낼 수 있다. '고양이'를 원한다면 GAN을 통해 무한의 가짜 고양이 사진들을 만들어낼 수 있다는 말이다.

물론 가짜 사진은 시작일 뿐이다. 존재하지 않는 글, 들어보지 못한 목소리까지 생성 가능하다. 더구나 분류기가 사전 학습한 목소리와 글이 특정 인물의 글과 목소리라면? GAN을 통해 특정 인물의 글과 구별하기 어려운 가짜 글을 만들어낼 수도 있겠다.

무엇이 진실이고 무엇이 가짜일까? 이제 우리도 인공지능 기술로 만들어질 가짜 뉴스가 판치는 미래를 대비해야 한다. 마치 튜링 테스트를 통해 사람과 기계를 구별하듯, 팩트와 가짜 뉴스를 구별할 수 있는 자동화된 알고리즘을 개발해야 한다는 말이다. 만약 진실과 가짜 뉴스를 더 이상 구별할 수 없게 된다면, 우리는 환경오염보다 더 혹독한 '진실오염'에 시달리게 될 것이다.