대량살상 수학무기

캐시 오닐 지음|김정혜 옮김|흐름출판|392쪽|1만6000원

서가의 한 칸은 온통 큐브(Cube)였다. 정육면체 퍼즐. 3×3×3 기본형은 물론, 5×5×5 심화형, 심지어 조각 크기가 제각각인 불규칙 변형 큐브까지. 서가 반대편은 악기들의 방이다. 낡은 스타인웨이 피아노와 바이올린, 비올라에 기타…. 길 건너 컬럼비아 대학이 내려다보이는 미국 뉴욕 맨해튼의 고급 맨션 11층. 구글과 페이스북과 월가의 투자회사들이 '위험인물'로 분류했다는 데이터 과학자 캐시 오닐(O'Neil·45)의 집은 빅데이터의 위험을 경고하는 시민운동가라기보다, 차라리 퍼즐과 음악을 즐기는 예술가의 공간이었다.

이 낭만적 공간이 낯설었던 까닭이 있다. 21일 번역 출간된 오닐 박사의 책 제목은 '대량살상 수학무기'(Weapons of Math Destruction). 핵이나 생화학 폭탄 같은 가공할 대량살상 무기(Weapons of Mass Destruction)를 빗댄 작명이다. 수학(math)을 오용하고 남용한 빅데이터 알고리즘이 민주주의를 위협하고 불평등을 심화시킨다는 고발이었다. 2016년 미국에서 출간된 이 책은 그해 뉴욕타임스를 포함한 11개 매체의 올해의 책으로 꼽혔고, '사피엔스'를 쓴 유발 하라리 히브리대 교수가 조선일보 Books에 강력하게 추천하기도 했다. "실리콘 밸리가 해주지 않는 이야기. 우리 삶을 규제하는 빅데이터와 알고리즘의 이중성을 노련하게 풀어냈다"는 이유였다.

수많은 학자가 경고했지만, 캐시 오닐이 더 주목받은 이유가 있다. 대학과 월가와 빅데이터 신생기업들을 모두 경험한 예외적 경력 때문이다. 그는 하버드대 수학과에서 박사 학위를 받았고, '헤지펀드의 하버드'로 불리는 디이 쇼(D.E. Shaw)에서 실세인 퀀트(Quant·분석가)로 일했다. 사람들의 인터넷 클릭을 예측하고 통제하는 빅데이터 기업 인텐트 미디어에서 알고리즘을 설계하기도 했다. 그런 엘리트 내부자의 육성이니, 파장이 클 수밖에. 아름다운 큐빅과 가공할 살상무기 사이의 격차가 아득하다. 우선 큐브 시절 이야기부터.

수학 천재 큐브 소녀는 이제 빅데이터 알고리즘의 위험을 경고하는 내부 고발자가 됐다. 잘못된 알고리즘이 어떻게 눈덩이처럼 큰 피해를 몰고 오는가. 뉴욕 맨해튼의 자택에서 데이터 과학자 캐시 오닐은 ‘대량살상 수학무기’의 위험성을 경고했다.

―하버드대 수학 박사라니. 천재 소녀였던 모양이다.

"어렸을 때 지나가는 자동차 번호판을 보면 소인수분해를 하곤 했다. 가령 45=3×3×5, 이런 식으로. 즐거운 놀이였다. 열네 살 때 수학 캠프에 참가했다가 가슴에 큐브를 꼭 끌어안고 집으로 돌아왔다. 내게 수학은 복잡한 현실 세계에서 벗어날 수 있는 질서정연한 도피처였다."

―수학 박사가 헤지펀드 운용사에는 왜.

"(창문 넘어 보이는 컬럼비아대를 가리키며) 박사 학위를 받은 후 이곳 컬럼비아대 버나드 칼리지의 수학과 종신 교수로 임용됐다. 하지만 상아탑에서는 학문의 진전이 고통스러울 만큼 느렸다. 숨 가쁘게 돌아가는 현실 세계의 일부가 되고 싶었다. 보통 헤지펀드에서는 거래를 주도하는 트레이더가 주연이다. 하지만 '헤지펀드의 하버드'라 불리는 디이 쇼에서는 수학자들이 최고 실세였다."

―무슨 일을 했나.

"퀀트. 고도의 수학 지식을 이용해서 투자 법칙을 찾아내고 컴퓨터로 적합한 프로그램을 구축해서 이를 토대로 투자를 이끄는 역할이다. 나는 열 명으로 구성된 선물(先物) 그룹을 이끌었다. 헤지펀드 비즈니스의 핵심은 퀀트의 아이디어와 알고리즘이다. 디이 쇼에는 50명의 퀀트가 있었고, 처음에는 내가 홍일점이었다."

'홍일점 퀀트'는 버나드 칼리지 수학 교수 시절의 세 배 연봉을 받았다고 했다. 2007년의 일이다. 하지만 2008년 미국 금융 위기가 밀어닥치며, 오닐은 그 이듬해 디이 쇼를 나온다.

―구조조정의 여파였나.

"잘린 게 아니라, 스스로 그만뒀다. 내가 하는 일들을 견딜 수 없었기 때문이다. 투자자들은 보통 수학자를 오해한다. 뛰어난 수학자들이 위험을 관리하는 프로그램을 만들어 줄 거라고 믿지 않나. 하지만 실제로는 그렇지 않다. 수학의 목적은 오직 판매자의 단기이익을 최적화하는 데 있다. 금융 위기 당시 문제가 된 주택담보대출 증권이 대표적이다. 수학은 쓰레기 같은 대출 증권의 가치를 몇 배로 부풀릴 수는 있지만, 그것을 해석할 능력은 없었다. 재앙의 현장에서 나는 알고리즘의 반대편에 있는 사람들을 봤다. 절망에 빠진 집주인과 일자리를 잃은 수백만 명의 미국인들."

오닐이 선택한 다음 직장은 인텐트 미디어였다. 빅데이터로 실제 여행 상품을 구매할 의사가 있는 소비자를 가려내는 알고리즘을 설계하는 게 그의 역할이었다. 가령 상품 검색 전에 회원 가입을 하는 소비자, 미국인들이 보통 여름휴가 계획을 세우는 5월 말 연휴에 해당 사이트를 검색하는 실소비자에게 가중치를 둔 뒤 총점 높은 이들을 분류하는 식이다.

―빅데이터 알고리즘이 뭐가 문제길래.

"데이터 과학자로 일하면서, 이 분야에서도 금융 세상에서 목격했던 것과 같은 패턴이 일어나고 있음을 깨달았다. 알고리즘 모형은 일반인이 알 수 없게 불투명하고, 신용 불량 위험 등으로 한번 낙인찍히면 악화일로, 확대재생산된다는 것이다."

―구체적으로.

"가령 피닉스 대학교처럼 영리만을 추구하는 미국 온라인 대학의 마케팅 전략, 뉴욕 경찰이 채택한 범죄 예측 모형, 고금리 단기 소액대출 광고의 알고리즘 등이다."

책에서 심층적으로 등장하는 이 사례들을 요약해보자. 피닉스 대학은 신분 상승을 미끼로 빈곤층을 공략하는 알고리즘을 설계했다. 자녀가 있고 복지수당을 수령하는 싱글맘, 임신한 미혼 여성, 최근 이혼한 20~40대 등의 빅데이터를 교묘하게 수집했다는 것. 푸드 스탬프(정부의 저소득층 식료품 지원) 정보 안내를 내세워 휴대폰 번호를 입력하게 하는 식이다. 이 대학 학생 1인당 교육비는 892달러에 불과했지만, 1인당 마케팅 비용은 2275달러를 썼다고 한다. 이런 식으로 6만 명의 신입생을 등록시켜 올린 2014년 '매출액'이 무려 6억달러다.

뉴욕 경찰의 범죄자 예측 모형 알고리즘도 마찬가지. 기본 원리는 과거 범죄 통계 데이터를 토대로, 범죄 발생 가능성이 가장 큰 지역에 경찰력을 집중 투입하는 방식이다. 얼핏 공정해 보인다. 하지만 이 알고리즘의 약점은 금융인이나 부자의 중범죄는 거의 잡아내지 못하고 가난한 자의 경범죄만 확대재생산한다는 것. 소량의 마약 판매나 노숙인의 구걸, 미성년자의 음주까지 시시콜콜 잡아내면서, 특정 지역만 점점 더 우범 지역으로 낙인찍는다. 가령 14~24세 흑인·라틴계 젊은이들은 뉴욕 전체 인구의 4.7%지만, 경찰의 불심검문을 받은 피검문자의 40.6%를 차지했다. 물론 이들 중 90%는 죄가 없었다. 오닐 박사는 "경찰 활동 자체가 새로운 데이터를 생산시키고, 이런 데이터가 다시 더 많은 경찰 활동을 정당화한다"면서 "가난과 인종적 차별을 코드화해 소수 계층에게 합법적으로 더 많은 형벌을 내리는 데 빅데이터가 악용되고 있다"고 했다.

뉴욕=사진작가 이현우

―빅데이터로 우리는 많은 도움을 받기도 한다. 어두운 면만 강조하는 것은 아닌가.

“데이터 그 자체로는 수많은 좋은 일을 할 수 있다고 생각한다. 하지만 그러려면 우리 스스로 편향되지 말고 과학적이 되어야 한다. 지금은 그냥 데이터를 쓰레기 버리듯 던지면서, 결과만 좋기를 바라고 있다. 알고리즘은 태생적으로 엘리트주의자다. 빅데이터 알고리즘을 만들고 진행시키려면 특별한 훈련을 받고 공부를 해야 하니까. 알고리즘은 인간을 닮는다. 우리가 엘리트를 우선하고 성(性)과 인종을 차별하면, 알고리즘도 그렇게 된다.”

―구글과 페이스북은 우리의 빅데이터를 닥치는 대로 긁어모으고 있다. 개인들이 할 수 있는 일은 뭐가 있을까.

“데이터는 본질상 개인이 할 수 있는 역할이 별로 없다. 데이터 알고리즘을 처음 설계하고 진행시키는 사람들이 가진 힘에 비해 역부족이다. 불공정하고 비밀로 가득 찬 법률로부터 개인을 보호해야 하는 역할은 우선 정부의 몫이다.”

인터뷰 말미, 개인적인 질문을 던졌다. 실리콘 밸리나 월가에서 두 팔 벌려 환영할 경력과 학력 아닌가. 대학교수 시절의 3배였다는 디이 쇼 연봉은 차치하고라도. 왜 스스로 장미를 사양하고 가시밭길을 걸어가는가.

“믿을지 모르겠지만, 난 한 번도 돈 그 자체를 사랑한 적은 없다. 운 좋게, 평생 돈 걱정을 해 본 적도 없다. 엄청난 부자라는 뜻이 아니라, 먹고사는 데 지장이 없었다는 뜻이다. 지금 이 맨션은 남편 덕이다. 컬럼비아대 수학과 종신교수라 학교의 혜택을 받고 있다. 돈을 유용한 도구라고 생각하지만, 거기까지다. 헤지펀드 같은 투자회사는 연말 보너스를 자신의 가치와 동일시하는 분위기가 있다. 나는 그런 분위기에 휩쓸리지 않았다. 그때 이미 두 아이의 엄마였다는 게 내 양심을 지켜준 것 같기도 하다. 돈은 도구일 뿐. 인생에서 중요한 것은 어떤 가치를 위해 사는가다.”

빅데이터 그 자체는 천사도 악마도 아닐 것이다. 이를 벽돌 삼아 유토피아를 건설할지, 아니면 대량살상무기 난무하는 디스토피아의 파국으로 이끌지 여부도 결국 인간의 몫. 꽃길과 가시밭길을 선택하는 주체 역시 인간인 것처럼. 오닐 박사가 다시 5×5×5 큐브를 꺼내 들었다. 큐브의 색과 무늬를 맞추는 것도 결국 알고리즘의 활용. 순식간에 조화를 완성한 정육면체가 아름답다. 원칙을 지킨다면, 큐브도 예술. 빅데이터도 그렇다.

[핵만큼 위험한 살상무기, 빅데이터]

빅데이터는 편견에 사로잡힌 인간보다 공정하며, 개인의 권리와 이익을 보호한다는 것이 보편적 믿음이다. 하지만 데이터 과학자 캐시 오닐은 “그렇지 않다”고 주장한다. 미국 워싱턴시가 실시한 교사 평가기법(IMPACT), 시사 잡지 ‘유에스 뉴스 & 월드 리포트’의 미국 대학교 평가 모형, 개인들의 신용평가점수 측정 모형 등이 오닐이 예로 들고 있는 왜곡 사례들이다. 그는 이 빅데이터 알고리즘을 ‘대량살상 수학무기’라고 부른다. 핵폭탄이나 생화학무기처럼, 수학을 이용한 가공할 무기라는 것. 인종차별, 빈부 격차, 지역 차별 등 인간의 불평등을 확대하고 민주주의를 위협하지 않도록 미리 대비해야 한다는 경고다.

캐시 오닐

1972
미국 뉴욕 출생
1999 하버드대 수학과 박사
2000 버나드 대학 수학과 종신교수
2007 헤지펀드 디이 쇼(D.E. Shaw)에서 퀀트(금융분석가)로 근무
2011 빅데이터 스타트업 인텐트 미디어에서 알고리즘 설계
2016 '대량살상 수학무기' 미국 출간.
2017 같은 책 국내 번역 출간