미국이 부당하게 복지 혜택을 받고 있는 '부정 수급자'들을 잡아내기 위해 '빅데이터(big data)' 활용에 팔을 걷어붙였다. '데이터마이닝(data mining·정보 수집 및 분석)' 프로그램을 이용하고 사설 업체의 방대한 데이터베이스까지 동원해 실제 재산 규모를 파악하고 있는 것인데, 뉴욕타임스(NYT)는 지난 20일 이런 시도가 큰 성과를 내고 있다고 전했다.

최근 뉴욕시의 빅데이터 전문가들은 수급자들의 혜택 내역을 프로그램에 입력해 패턴화하는 작업을 벌였다. 이를 통해 브롱스에 거주하는 수급자 라구난단의 가족이 10년간 5만달러(약 5500만원) 상당의 건강보험 혜택을 받아왔음을 발견했는데, 다른 수급자들이 현금 지원이나 음식 배급 등 좀 더 직접적인 혜택을 받는 것과 달리 라구난단 가족은 오로지 건강보험 혜택만을 받아 의심을 샀다. 사설 정보 수집 업체인 렉시스넥시스(LexisNexis)의 빅데이터를 받아 분석하자 정부 신고 목록에는 없던 라구난단의 자산들이 나왔다. 라구난단은 뉴욕에만 세 건의 부동산을 가지고 있는 것으로 드러났다.

이러한 방식으로 지난해 뉴욕시 정부가 3만건을 적발해 4650만달러를 회수했다. 빅데이터를 이용하기 전인 2009년 4만8000건, 2900만달러에 비해 더 적은 건수로 더 많은 금액을 회수한 셈이다.

IBM과 SAS 등 빅데이터 전문 업체에서 내놓은 분석 프로그램은 미국 각 주에서 활발히 활용되고 있는데, IBM 프로그램은 아이를 어린이집에 보내고 있다고 거짓 신고한 부정 수급자를 적발해내기도 했다. 어린이집에서 아이 어머니가 다니는 직장까지의 거리가 하루 안에 아이를 맡기러 들를 수 없는 거리라는 것을 프로그램이 자동으로 찾아냈기 때문이다.