정부가 추진하는 국가대표 인공지능(AI) 선발 프로젝트에서 최근 2단계에 진출한 SK텔레콤이 멀티모달 AI(글·음성·이미지 등을 모두 이해하는 AI) 개발에 나선다고 밝혔다.
SK텔레콤은 1차 평가에 국내 처음으로 매개변수(파라미터) 5000억개를 넘긴 ’519B급' 초거대 AI 모델 ‘A.X K1(에이닷엑스 케이원)’을 공개해 주목받았다. 이 기술은 지난 7일 오픈소스 플랫폼 허깅페이스에 해당 모델이 공개된 이후 1만건이 넘는 다운로드 수를 기록하며 국내외 개발자들의 관심을 받았다.
SK텔레콤은 2단계 평가부터 이미지 데이터를 시작으로 멀티모달을 순차적으로 적용할 예정이다. 논문이나 문서 이미지를 인식하고 이를 텍스트로 요약하는 작업을 처리할 수 있게 되는 것이다. 올해 하반기 이후부터는 음성과 영상 데이터 처리도 가능하도록 멀티모달 모델을 고도화한다.
SK텔레콤 관계자는 “AI 모델 성능을 높이기 위해 학습 데이터 규모를 1단계 대비 확대하고 학습 언어도 5개 국어(한국어·영어·중국어·일본어·스페인어)로 확대한다”고 말했다. SK텔레콤 컨소시엄에는 최근 카이스트(KAIST) 인공지능대학원 서민준 교수 연구실, 서울대학교 수리과학부 서인석 교수 연구실이 새로 참여했다.