국내에서 ‘소버린(주권) AI’에 근접한 모델로 네이버와 LG AI연구원의 AI가 있다.
국내 대표 인터넷 기업 네이버는 2021년 9월에 국산 AI 모델 ‘하이퍼클로바’를 내놓았다. 국내 기업 최초로 자체 개발한 LLM(거대언어모델)이다. 하이퍼클로바는 오픈AI의 GPT-3가 학습한 한국어 대비 6500배 많은 한국어 데이터를 학습시켰다. 한국어 차지 비율로 보면 GPT-3가 0.1%미만, 하이퍼클로바가 97%였다. 네이버는 지난 4월 최신 경량화 모델인 ‘하이퍼클로바X 시드’를 오픈소스(개방형)로 공개했다.
LG AI연구원은 2023년 특허와 논문 등 전문 문헌 4500만건과 이미지 3억5000만장을 학습시켜 전문성뿐 아니라 이미지 인식 기능도 갖춘 LLM ‘엑사원 2.0’을 선보였다. LG AI 연구원은 아직 엑사원을 챗GPT나 제미나이처럼 일반인이 쓰는 챗봇 형태로 공개하고 있지 않다.
이 밖에 KT가 국내 최초로 1조 토큰(말뭉치)이 넘는 막대한 데이터를 학습시켜 개발한 ‘믿음’, 삼성전자가 업무 지원과 스마트폰 탑재용으로 개발한 ‘가우스’, 엔씨소프트가 국내 게임 기업 최초로 내놓은 ‘바르코’ 등 다양한 국산 LLM이 속속 개발됐다. 국내 AI 스타트업 업스테이지도 자체 개발 모델 ‘솔라’를 공개했다.