인공지능 혼자 논문 작성하고 심사까지 통과

'AI(인공지능) 과학자'가 스스로 가설을 세우고 실험을 진행하는 장면을 묘사한 상상도. /DALL·E 생성

인공지능(AI)이 연구 주제를 정하고 실험을 설계한 뒤, 논문까지 작성해 학술대회 심사를 통과한 사례가 공개됐다. 연구 보조 수준을 넘어 스스로 연구를 진행하는 ‘AI 과학자’가 현실로 다가왔다는 평가가 나온다.

일본 스타트업 ‘사카나 AI’는 자체 개발한 AI가 연구 주제 탐색부터 가설 설정, 코드 작성, 실험, 논문 작성까지 모든 과정을 자동으로 수행했다고 국제학술지 ‘네이처’에 최근 발표했다. 이 회사가 공개한 ‘AI 사이언티스트’는 논문 3편을 작성해 국제 머신러닝 학회(ICLR) 워크숍에 제출했고, 이 중 1편은 심사를 통과했다. 회사 측은 AI가 쓴 논문이 심사를 통과한 첫 사례라고 주장한다. AI가 쓴 논문이 인간 저자 논문과 구별되지 않을 정도였다는 것이다. 다만 사카나 AI는 이 논문을 실제 게재 전에 철회했다.

AI 사이언티스트는 여러 AI 에이전트를 결합한 구조다. 대규모 언어모델(LLM)을 기반으로 기존 연구를 탐색하고 새로운 가설을 제시한다. 이어 실험 코드를 작성해 실행하고, 결과를 분석해 논문 형태로 정리하는 과정까지 스스로 수행한다. 기존에는 AI가 문헌 검색, 데이터 분석 등 일부 과정을 지원하는 데 그치는 수준이었다.

연구진이 별도로 구축한 자동 리뷰어 시스템도 학회 워크숍 기준으로 게재 가능한 수준에 근접한 것으로 평가됐다. 실제로 ICLR에 제출된 AI 사이언티스트의 논문은 1차 리뷰에서 평균 6.33을 기록해 기준을 충족했다. 이는 인간 연구자가 작성한 논문 중 상위 55% 수준에 해당한다.

AI 사이언티스트와 비슷한 시도는 다른 연구기관에서도 이어지고 있다. 영국 케임브리지대 연구진도 AI가 수행한 연구로 국제 학회의 AI 생성 논문 부문에서 수상하기도 했다. 이처럼 AI가 연구를 수행하는 기술이 확산되면, 연구자 1명이 수행할 수 있는 연구 범위가 크게 넓어질 수 있다는 분석이 나온다.

이에 대한 우려의 목소리도 적지 않다. AI가 생성한 논문이 급증할 경우 기존 동료 평가 시스템이 과부하에 걸릴 수 있다는 지적이다. 연구의 ‘새로움’을 어떻게 정의하고 평가할 것인지도 논란거리다. 학계에서는 ‘논문의 양’보다 ‘질’을 검증하는 기준이 더 중요해질 것이라는 전망도 제기된다.

아직은 기술력 한계가 분명하다. AI 사이언티스트는 데이터 분석과 시뮬레이션 중심의 연구 분야에 국한된다. 세포 배양이나 동물 실험 등 실제 실험이 필요한 연구에는 적용이 쉽지 않다.

이 때문에 연구진도 AI 역할을 ‘대체자’보다는 ‘협력자’로 규정한다. 사카나 AI 공동창업자 데이비드 하는 “AI는 인간 과학자를 대체하는 존재가 아니라 함께 연구하는 도구가 될 것”이라고 했다.