초등 저학년 이상 AI ‘드리머’, 강화학습으로 다이아 캐는 법 알아내
연습한 적 없어도 스스로 공부해 실전 투입
Mojang Studios에서 2009년 출시한 비디오 게임이다. 마인크래프트(Minecraft)란 이름처럼 채광(Mine), 제작(Craft)하는 게임이다. 네모난 블록으로 이루어진 세계에서 건축, 사냥, 농사 등을 즐길 수 있다. 2024년, 역대 가장 많이 팔린 비디오 게임으로 꼽혔다./마인크래프트

마인크래프트 게임 속, 한 플레이어가 열심히 블록을 모아요. 블록을 모으면 땅을 팔 수 있는 삽, 나무를 벨 수 있는 도끼를 만들 수 있기 때문이죠. 도구를 많이 만들수록 탐험할 수 있는 땅은 더 늘어나요.

수많은 블록 가운데 반짝반짝 빛나는 다이아몬드 블록이 있는데요. 다이아몬드 블록은 도구를 만들고, 탐험을 하는 등 여러 과정을 거쳐야만 찾을 수 있어요. 하지만 다이아몬드 블록을 얻기란 어렵고요.

4월 2일(현지 시각), 놀랍게도 마인크래프트 게임에서 다이아몬드 블록을 스스로 찾아내는 AI(인공지능)가 나와 세계가 주목하고 있어요. 영국 구글 딥마인드가 개발한 AI 모델 ‘드리머(Dreamer)’인데요. 재미난 점은, 드리머가 사람의 플레이를 따라 한 적도 없고, 다이아몬드 블록을 어떻게 얻어야 하는지 배운 적도 없다는 거예요. 그럼에도 드리머는 스스로 게임을 플레이하면서 쉽게 다이아몬드 블록을 얻었죠.

드리머가 다이아몬드 블록을 얻을 수 있었던 비결은 ‘강화학습(reinforcement learning)’덕분이었어요. 강화학습이란 AI가 시행착오를 겪으며 스스로 학습하는 방식이에요. 사람이 직접 프로그램을 짜주면 이를 그대로 학습하는 기존 AI와 다르죠. 나무 캐기, 곡괭이 만들기 등 다이아몬드를 얻기까지 필요한 행동을 할 때마다 드리머는 나무 블록, 곡괭이 도구 등의 보상을 받아요. 이에 드리머는 어떻게 해야 다이아몬드 블록을 얻는지 스스로 학습할 수 있었답니다.

한 플레이어가 마인크래프트 게임 속에서 다이아몬드 블록을 찾아 캐내고 있다. 다이아몬드 블록은 도구를 만들고, 탐험을 하는 등 여러 과정을 거쳐야만 찾을 수 있다./유튜브 ‘동동TV’

강화학습(reinforcement learning): AI가 시행착오를 겪으며 스스로 학습하는 방식으로, 보상을 받는 행동을 하는 게 특징이다. 이는 동물의 학습 방식에서 따왔다. 예컨대 고양이가 사냥할 때 발소리를 안 낼수록 사냥 성공 확률이 높다면, 먹이라는 보상을 얻기 위해 고양이는 발소리를 줄인다.

1.마인크래프트 게임 속 다이아몬드 블록은 어떻게 해야 얻을 수 있나요?

2.AI ‘드리머’는 어떻게 다이아몬드 블록을 얻을 수 있었는지 단어 ‘강화학습’을 넣어 적어보세요.