인공지능(AI) 프로그램이 바둑과 체스에 이어 포커 게임에서도 ‘인간 고수’를 압도했다.

12일 국제학술지 ‘사이언스’는 미국 연구진이 포커 게임에서 프로 도박사를 능가하는 AI ‘플루리버스’를 개발했다고 소개했다. 노암 브라운 페이스북 AI리서치 연구원과 투오마스 샌드홀름 미국 피츠버그 카네기멜론대 교수 연구진은 플루리버스와 프로 도박사 12명이 12일 동안 6인용 노리밋(No limit·무제한) 텍사스 홀덤 포커 게임을 진행한 결과 플루리버스가 승리했다고 밝혔다.

‘알파고’ 등 빅데이터 기반의 ‘딥러닝(deep learning)을 바탕으로 하는 AI 프로그램은 그동안 바둑과 체스 등에서 ‘인간 최고수’들을 여러차례 꺾었다. 하지만 바둑과 체스의 경우 정해진 규칙에 따라 대국자들이 판을 한 눈에 들여다보며 진행하기 때문에 ‘최적화 도구’인 AI에 유리할 수밖에 없다는 의견이 많았다.

AI 프로그램이 2인 포커 게임에서는 ‘인간 고수’에 승리한 적은 이전에도 있었지만, 여러명을 동시에 상대해 승리한 것은 이번이 처음이다. 구글의 AI ‘알파고’는 이세돌 9단과 세계 바둑 랭킹 1위인 커제를 연이어 제쳤고, 미국 알버타대 AI ‘딥스택’과 카네기멜론대 AI ‘리브라투스’도 프로 도박사와의 포커 게임에서 승리했지만 모두 1대 1 게임이었다.

하지만 여러 명을 상대로 두뇌싸움과 고도의 심리전(?) 벌이는 포커 게임에서 AI가 인간을 이겼다는 건 의미가 다르다. 전문가들은 포커 게임에 적용된 AI 기술(다수를 상대로 숨겨진 정보를 파악하고 고도의 전략을 짜는)이 사이버보안과 사기 방지, 금융 협상 등에 폭 넓게 적용 가능할 것으로 기대하고 있다.

12일 국제학술지 ‘사이언스’는 미국 연구진이 포커 게임에서 프로 도박사를 능가하는 AI ‘플루리버스’를 개발했다고 소개했다.

‘텍사스 홀덤’ 포커 게임은 참가자들이 2장의 카드를 각각 받은 뒤 3장·1장·1장의 순서로 공용(共用)카드 5장을 제시하면 카드 조합을 만들어 승부를 겨룬다. 4인이 게임을 하면 경우의 수가 32조(兆)개가 생길 정도로 복잡하다. 그 중에서 ‘노리밋’은 칩을 한도 내에서 무제한으로 걸 수 있는 베팅 방식이다.

연구진은 플루리버스 1개와 프로 도박사 5명, 플루리버스 5개와 프로 도박사 1명 등 각각 두 형태로 1만번의 포커 게임을 진행했다. 그 결과 플루리버스는 평균 시간당 겨우 1달러를 베팅해 1000달러를 벌어들이며 프로 도박사들을 제압했다.

6번 연속 월드 시리즈 포커 챔피언을 거머쥔 크리스 퍼거슨은 플루리버스에 대해 "매우 상대하기 어려운 적수"라며 "어떤 판에서도 플루리버스를 제압하기 어려웠다"고 했다. 플루리버스 개발자인 브라운 연구원은 "플루리버스는 초인적인(superhuman)인 수준에 있으며 이는 앞으로도 변함 없을 것"이라고 했다. 과학자들은 플루리버스의 승리를 "AI연구의 중대한 성과"라고 평했다.

연구진은 플루리버스가 여러명을 상대할 수도 있도록 하기 위해 몇 가지 훈련을 시행했다. 연구진은 플루리버스가 상대가 경기 끝까지 어떻게 플레이하는지 장기 예측을 하려고 하기보다는 2~3라운드 까지만 예측해 다양한 상황에 즉각 대처하도록 했다. 이 같은 과정을 거친 플루리버스는 흔히 ‘뻥카’로 불리는 ‘블러핑(속임수)’도 자유자재로 사용할 수 있다는 설명이다.

블러핑은 인간 만이 할 수 있는 행동으로 여겨지지만 AI는 이를 거짓말을 하거나 숨기는 행위가 아닌 수학적으로 계산된 최선의 전략으로 여긴다고 연구진은 덧붙였다.

플루리버스에 적용된 기술은 포커 게임뿐만 아니라 다른 상황에도 적용될 수 있을 것으로 기대된다. 여러 명을 상대하며 숨겨진 정보를 파악하고 수많은 윈윈 전략을 고안해내는 기술은 사이버보안, 사기 방지, 금융 협상 등에 적용될 수 있다고 연구진은 설명했다.