컴퓨터가 마치 사람처럼 이미지(사진)나 소리를 인식해 작동하는 AI(인공지능) 기술은 자율주행차와 스마트 스피커, 동영상이나 기사 추천 서비스처럼 일상의 일부가 됐다. 하지만 AI가 처음부터 똑똑한 것은 아니다. 막대한 양의 데이터를 사람이 일일이 입력해 학습을 시키는 ‘훈련’의 과정이 필요하다.

/일러스트=안병현

예컨대 자율주행 AI를 개발하려면 어떤 게 자동차고, 어떤 게 차선인지 일일이 알려줘야 한다. 이를 위해 사람이 사진과 동영상 위에 차량과 차선, 중앙분리대의 바깥 선을 따라 점을 찍어가며 구획을 지은 다음, 각각의 이름을 적어 넣는 단순 작업을 수없이 반복한다. 이른바 ‘라벨링(labeling)’이라고 부르는 과정이다.

AI의 최첨단 이미지와는 동떨어진 노동집약적이고, 어찌 보면 비효율적인 일이다. 이런 AI의 학습 초기 과정을 최대한 쉽고 빠르게 끝낼 수 있게 도와주는 기술이 있다. 국내 스타트업 슈퍼브에이아이가 만든 ‘스위트’ 플랫폼(기반 기술)이다. 이 회사 김현수(30) 대표는 “AI를 학습시키는 과정은 부모가 아기에게 모든 사물의 이름을 하나하나 가르쳐주는 것과 비슷하다”면서 “우리는 이를 AI로 자동화한, 바꿔 말해 ‘AI를 가르치는 AI’를 개발한 셈”이라고 했다.

◇시간 낭비 큰 ‘데이터 라벨링’

자율주행 AI의 경우, 보통 수천만 장의 사진과 동영상을 라벨링해 입력해 준다. 그제야 AI가 도로 위의 사물을 분별할 수 있게 된다. 슈퍼브에이아이 측은 “이렇게 준비 작업이 이뤄진 AI를 대상으로, 도로 위 상황을 이해하고 판단을 내릴 수 있도록 인공지능 학습을 시키는 것이 AI 개발의 주요 단계”라고 했다.

이때 라벨링에 소요되는 시간이 전체 AI 개발 시간의 60~70%에 달한다. 사람이 일일이 손으로 하는 노동집약적 업무나 속도를 끌어올리기가 어렵다. AI 산업이 커지면서 이 작업을 대신해주는 외주 업체들이 등장했고, 이로 인해 AI 개발사의 부담은 줄었지만 작업 시간은 크게 줄지 않았다.

슈퍼브에이아이의 스위트는 바로 이 라벨링 작업을 사람 대신 AI가 하게 했다. 쉽게 말해 AI를 가르치는 AI인 셈이다. 김 대표는 “스위트를 쓰면 100여종의 주요 사물에 대한 라벨링 작업을 자동으로 할 수 있다”면서 “사람에 비해 작업 속도가 최대 10배 빠르다”고 했다. 자체 조사 결과 자율주행 AI의 경우 전체 작업 시간이 7.6분의 1 정도로 줄어든다고 한다.

슈퍼브에이아이 직원이 이 회사의 ‘스위트’ 기술을 이용해 사진에 ‘데이터 라벨링’ 작업을 하는 모습(왼쪽). 사진 속의 신호등과 트럭, 사람 등을 AI(인공지능)가 자동으로 인식해 라벨링(이름 붙이기)을 해준다. / 슈퍼브에이아이 제공

◇개발 시간은 아끼고 완성도 높여

스위트 역시 개발 초기 지난한 라벨링 작업을 통해 만들어졌다. 특히 다른 AI를 학습시킬 수 있을 만큼 높은 정확성을 갖출 수 있도록 더 풍부하고 다양한 이미지를 학습시켰다. 김 대표는 “정확하게 찍힌 이미지만 보여준 것이 아니라, 흔들리거나 기울어진 이미지 등 불확실한 모습들을 다양하게 학습시켰기 때문에 (일반 AI보다) 인지 수준이 훨씬 높다”고 했다.

특히 AI 기반 라벨링의 정확도를 스스로 평가하고, 사람의 도움이 필요한 부분을 정확히 짚어내는 기술은 독보적인 것으로 알려졌다. 김 대표는 “경쟁사에 비해 자동 인지 사물의 수, 인지 정확도, 구획 작업의 정교도 등이 훨씬 뛰어나다”며 “이 때문에 삼성과 현대차, LG, SK, 카카오 등 국내 주요 대기업이 스위트를 이용하고 있다”고 했다.

스위트에는 AI 학습의 질을 높이기 위해 라벨링 상황을 실시간으로 분석해 알려주는 기능도 있다. 김 대표는 “예컨대 데이터 라벨링 도중에 ‘덤프트럭 인식이나 차선 변경 판단에 필요한 데이터가 부족하다’는 것을 알려줄 수 있다”고 했다. 기존에는 라벨링 작업 후 모델 학습에 들어가서야 이런 문제를 발견해 부족한 데이터를 보충 학습해야 했기 때문에 시간을 허비해야 했다.

◇스타트업·중소기업 AI 개발 돕는다

김현수 대표는 미국 듀크대에서 전자공학과 생명공학을 전공하고, 같은 대학 대학원에서 컴퓨터공학 박사과정을 밟다 2016년 SK텔레콤에 입사했다. 김 대표는 “당시 자율주행, 게임 분야 등의 AI 개발을 하면서 데이터 라벨링 작업의 비효율을 뼈저리게 느껴 창업을 결심했다”고 했다. 김 대표의 직장 동료 4명도 김 대표와 뜻을 같이했다.

2018년 4월에 창업, 1년여 만에 24억원의 초기 투자를 받았다. 2019년 손익분기점을 넘기고, 지난해에는 매출이 전년 대비 3배 이상 증가했다. 5명으로 시작한 회사는 현재 30여명으로 커졌고, 미국 실리콘밸리에도 사무실을 냈다. 이달 초 에이티넘인베스트먼트를 비롯해 스톤브릿지벤처스, 미국 듀크 대학 등 국내외 기관투자자로부터 110억원 규모의 투자를 받았다.

김 대표는 “돈과 인력이 부족한 AI 스타트업이나 중소기업이 스위트를 활용하면 AI 개발이 더 쉬워질 것”이라고 했다. “도움이 되는 기술을 계속 내놓고 싶다”면서 “올해는 스케일, 라벨박스 등 해외 라벨링 업체들과 기술력으로 승부해 글로벌 시장을 본격적으로 개척하는 것이 목표”라고 했다.