인공지능(AI) 스타트업 업스테이지가 개발한 AI 파운데이션 모델이 중국 모델을 사실상 베낀 것이라는 주장이 나왔다. 이에 대해 업스테이지는 사실과 다른 주장이라며 공개 검증회를 열겠다고 밝혔다. 업스테이지는 지난해 8월 ‘국가대표 AI’에 선발됐다.
1일 인공지능 스타트업 사이오닉AI의 고석현 CEO(최고경영자)는 링크드인에 “국민의 세금이 투입된 프로젝트에서 중국 모델을 복사하여 미세 조정한 결과물로 추정되는 모델이 제출된 것은 상당히 큰 유감”이라는 글을 올렸다. 고 CEO는 업스테이지가 국대 AI 1차 평가에 제출한 모델과 중국 AI 모델(GLM 4.5 에어)을 성능을 비교 분석한 깃허브 리포트를 함께 공개했다.
해당 자료에는 업스테이지의 ‘솔라 오픈 100B’ 모델의 AI 모델 신경망 중 특정 부분(LayerNorm)이 중국 모델과 96.8% 동일하다고 나와 있다. 사람으로 치면 지문이나 DNA가 거의 일치하는 수준이라는 뜻이라 우연히 비슷하게 만들어졌을 확률이 거의 없다는 주장이다.
또한 이 자료에 따르면 두 모델은 MoE 구조도 동일한데 이는 AI 모델 설계도가 중국 모델과 똑같다는 뜻이다. 이 자료에는 “이 ‘선택적 보존’이 파생의 결정적 증거”라고도 나와 있다. 핵심적인 뼈대는 그대로 두고 겉으로 드러나는 부분만 다시 학습시켜서 마치 새 모델인 것처럼 위장했다는 뜻이다.
이에 대해 김성훈 업스테이지 대표는 곧바로 댓글을 달고 공개 검증에 참여해 달라고 요청했다. 김 대표는 “솔라 모델에 대한 관심에 감사드린다”면서 “내일 저희 사무실에서 대표님과 업계 전문가들을 초청해 전체 학습 과정을 설명드리고 말씀하신 의혹에 대해 상세히 설명 드리겠다”고 말했다.
김 대표는 자신의 페이스북에도 글을 올려 2일 오후 3시 공개 검증회를 열겠다고 밝혔다. 김 대표는 “솔라 100B가 중국 모델을 복사하여 미세 조정을 한 것으로 추정된다는 글에 대해 사실과 다름을 알려드린다”라며 “업스테이지는 명백히 ‘프롬 스크래치’로 학습을 했고, 학습에 사용한 체크포인트들과 WandB(실험 로그)를 모두 공개할 예정”이라고 말했다.
한편 깃허브에는 이날 ‘솔라 오픈 100B는 GLM-4.5-Air에서 파생되지 않았습니다’라는 제목의 리포트도 올라왔다. 해당 리포트는 ‘이번 사안과 전혀 상관 없는 마이크로소프트의 Phi 모델을 가져와서 앞선 리포트와 똑같은 방식으로 비교해본 결과 Phi도 GLM 모델과 비교하면 90% 이상 비슷하다’며 ‘Layernorm 수치가 비슷하다고 해서 베꼈다고 주장하는 것 자체가 잘못된 계산법’이라고 밝혔다. 키가 같다고 쌍둥이라고 주장하면 안 되며 얼굴까지 닮았는지 확인해보니 확실히 다른 사람이라는 것이다.