윤석진 前 한국과학기술연구원(KIST) 원장

최근 공개된 평가에서 글로벌 AI 모델들은 수능 수학 영역에서 인간 최상위권에 해당하는 성적을 기록했다. 구글의 제미나이 3 프로는 100점 만점 기준 92점을 받았다. 앤트로픽의 클로드 오푸스 4.5는 84점, xAI의 그록 4.1은 82점이었다. 모두 안정적인 1등급 수준이다. 반면 국내 AI 모델들은 최고 점수가 50점대에 그쳤고, 다수는 20점대에 머물렀다. 계산 도구를 활용했음에도 격차는 거의 줄지 않았다.

인공지능(AI) 모델 성능 비교를 둘러싼 논쟁은 단순한 기술 경쟁을 넘어선다. 즉 문제를 해석하고 접근 경로를 설계하는 능력이다. ‘어떻게 풀 것인가’보다 ‘무엇을 왜 풀 것인가’를 설정하는 힘의 차이다. 복합적 추론이 필요한 고난도 문항에서 정답률이 크게 벌어진 이유도 여기에 있다. AI 성능 격차는 사고의 깊이와 문제 설정 능력의 격차를 그대로 반영한다. 데이터의 양이나 연산 능력만으로 설명할 수 없는 이 차이는 한국 연구 생태계의 구조적 한계를 드러내는 신호이기도 하다.

한국 R&D의 현실과 정확히 겹친다. 한국은 세계 최고 수준의 R&D 투자국이다. GDP 대비 R&D 투자 비율은 약 5%로 세계 1~2위를 다툰다. 빠르게 배우고 정확히 구현하는 능력에서도 한국은 강점을 보여왔다. 주어진 목표를 달성하는 데 탁월했다. 그러나 성과의 질은 다른 질문을 던진다. 최근 10여 년간 피인용 상위 1% 논문 비율에서 한국은 세계 10위권 밖에 머물렀다. 투자 규모에 비해 질적 성과는 제한적이다. ‘공부를 잘하는 연구’에는 강했지만, ‘방향을 설정하는 연구’에는 취약한 탓이다.

원인은 R&D 구조에 있다. 한국 연구개발비의 60% 이상이 개발 연구에 집중돼 있다. 기초 연구 비율은 15% 안팎에 머문다. 응용 연구도 충분하지 않다. ‘무엇을 탐구할 것인가’보다 ‘어떻게 빨리 만들 것인가’에 자원이 쏠린 구조다. 이 구조에서는 새로운 질문이 자라기 어렵다. 이 문제는 자율성과 실패를 감내하는 문화도 부족해 연구 인재 육성의 어려움마저 초래한다. 특히 한국의 AI 인재는 순유출 상태다. 국내 AI 전문가의 임금 프리미엄은 평균 6% 수준이다. 미국은 25%다. 캐나다와 유럽 주요국도 두 자릿수를 기록한다. 인재가 떠나는 이유는 분명하다.

교육 역시 같은 궤적을 그린다. 한국 학생들은 국제 학업성취도 평가에서 최상위 성적을 기록한다. 창의적 사고력 평가에서도 높은 점수를 받는다. 그러나 이는 주어진 틀 안에서의 문제 해결 능력에 가깝다. 스스로 문제를 정의하고 질문을 설계하는 역량과는 거리가 있다. 성인이 된 이후 실제 문제 해결 역량이 기대에 미치지 못하는 이유다. AI는 이미 정답을 가장 잘 찾는 존재가 됐다. 이제 경쟁의 본질은 바뀌었다. 기술 격차는 구현 속도가 아니라 문제 선택에서 발생한다. 글로벌 선도국들은 성공 가능성이 낮은 고위험 과제에도 과감히 투자한다. 질문을 선점하기 위해서다.

더 이상 전환을 늦출 순 없다. 교육은 정답 중심에서 질문 중심으로 바뀌어야 한다. 연구 평가는 논문 수와 특허 수보다 문제 설정의 독창성과 도전성을 봐야 한다. 국가 R&D 전략은 추격형 과제의 나열에서 벗어나야 한다. 우리가 풀어야 할 국가적·인류적 과제를 스스로 정의해야 한다. 수능 문제를 푸는 AI는 ‘잘 따라가는 연구의 시대는 끝났다’는 분명한 메시지를 던진다. 문제를 정의하지 못하는 국가는 기술 주권을 가질 수 없다. 이제는 정답을 푸는 나라에서 문제를 내는 나라로 이동해야 한다.