AI 생성 논문 / midjourney

디지털 헬스케어 기업에서 근무 중인 박병준씨는 지난 1월 인도과학원(IISc)에서 뜻밖의 이메일을 받았다. KAIST 전기전자공학부 박사과정 때 작성한 논문의 주요 방법론을 일본의 인공지능(AI) ‘AI 사이언티스트’가 출처를 밝히지 않고 사용한 것을 알고 있느냐는 질문이었다. 이 AI는 박씨 논문을 차용해 생성한 논문을 온라인에 게시했고, 이를 인도과학원 연구자들이 찾아낸 것이다. 박씨는 “AI가 작성한 논문을 확인해 보니, 실제로 내 연구와 핵심 방법론이 매우 흡사해 놀랐다”고 했다.

네이처는 20일(현지 시각) 이 사례를 전하며 “AI가 새로 써낸 과학 논문 중 최소 4분의 1은 기존에 발표된 연구의 아이디어를 무단으로 차용한 것이라는 분석이 나왔다”고 보도했다. 인도과학원 연구팀이 작년부터 올해 초까지 발표된 AI 생성 과학 논문을 집중적으로 검증·분석한 이번 연구 결과는 지난달 오스트리아 빈에서 열린 ACL(전산 언어학 학회) 학술대회에서 우수 논문상을 받았다.

연구팀에 따르면, 이들이 검증한 AI 생성 논문의 약 24~36%는 기존 논문 두세 편의 아이디어와 방법론을 그대로 가져와 새로운 연구처럼 작성한 것으로 조사됐다. 사실상 표절이었다는 것이다. 연구팀은 AI가 쓴 논문을 기존 연구와 상세 비교하고 해당 논문 저자에게도 연락해 표절 여부를 확인했다. 이후 ‘완전히 똑같음’(5점), ‘논문 2~3건 짜깁기’(4점), ‘많이 겹침’(3점), ‘조금 겹침’(2점), ‘겹치지 않음’(1점) 등으로 점수를 매겼다. 분석 결과, 베낀 정도가 4~5점에 해당하는 논문이 전체의 24%로 집계됐다. 기존 논문의 원저자가 응답하지 않았지만, 논문 구성상 남의 아이디어를 도용한 것이 분명한 경우까지 포함하면 36%나 됐다. 연구팀은 “이젠 AI가 문장 몇 개를 복사해서 붙이는 수준을 넘어서서, 다른 연구자의 아이디어나 주요 방법론을 가져다 쓰는 수준에까지 이르렀다”면서 “현재 널리 사용되고 있는 표절 탐지 프로그램으로는 이 논문들의 표절 여부를 한 건도 가려낼 수 없었다”고 했다.

연구팀은 AI가 남의 연구를 도용해 작성한 논문 중 일부가 권위 있는 학회 검증을 통과한 경우도 있었다고 했다. AI가 생성한 논문이 세계 최고 권위를 자랑하는 AI 학회인 ICLR에서 동료 평가를 통과했다는 것이다. 연구팀은 “이 논문이 AI가 작성한 것이고, 기존 연구 아이디어와 방법론을 도용한 것이란 사실이 알려져 발표하지 않기로 했지만, 학회 검증을 일단 통과했다는 것은 심각한 문제”라고 했다.

‘AI 사이언티스트’ 측은 “인도과학원 연구팀의 이번 논문 결과를 받아들일 수 없다”며 “AI 사이언티스트가 생성한 논문이 표절이라는 주장에 동의하지 않는다”고 밝혔다.