지난 2일 대전 한국과학기술정보연구원(KISTI) 데이터센터. 656.76㎡(약 200평) 규모의 데이터센터 내에는 1000개가 넘는 서버가 모여 있었다. 현재 데이터 센터에서 저장할 수 있는 메모리는 166테라바이트(TB) 수준이다. 이곳에는 국가과학기술연구망을 통해 수집된 연구·개발(R&D) 데이터들이 수많은 서버, 즉 클라우드에 저장된다. 국내 학술 논문이나 특허, R&D 사업 공고 등 수천만 건의 정보이다. 이혁로 과학기술디지털융합본부 본부장은 “전국 각 지역에서 모인 연구 데이터를 안전하게 모아 인공지능(AI)으로 다시 가공해 연구자들에게 제공한다”고 말했다.
KISTI가 디지털 전환 시대를 맞아 연구 현장에서 발생한 데이터를 최적화하는 서비스를 제공하고 있다. 이는 데이터 수집과 저장, 가공, 유통을 하나로 통합하는 서비스이다. 이를 위해 역할에 따라 흩어져 있던 부서를 모아 지난해 8월 과학기술디지털융합본부를 신설했다. 과학기술디지털융합본부는 3센터, 3연구단, 1실, 1팀으로 구성됐다. KISTI는 “일명 ‘DNA(Data-Network-AI)’ 역량을 효율적으로 결집해 우수한 연구 성과 창출을 지원하고 있다”고 밝혔다.
◇데이터 댐에 대용량 연구 데이터 저장
먼저 KISTI는 데이터 수집과 저장 서비스를 개선하고 있다. KISTI는 1988년부터 국가과학기술연구망을 운영하고 있다. 국가과학기술연구망은 일반 인터넷망과 달리 국내·외 연구 현장에서 발생하는 데이터가 오가는 통로 역할을 한다. 국내 거점 지역 17곳과 시애틀·시카고·홍콩·암스테르담 해외 4곳을 100기가급 연구망으로 연결하여 200개가 넘는 연구기관·대학이 대용량 데이터를 빠르게 전송하고 있다. KISTI는 연구망을 테라급으로 높이는 작업을 진행 중이다. 이 본부장은 “여객 터미널로 비유하면 대형 화물을 운반할 수 있는 터미널을 준비하는 셈”이라고 말했다.
이렇게 모인 데이터들은 KISTI의 클라우드로 모인다. 일종의 ‘데이터 댐’이다. 데이터센터는 연구망과 마찬가지로 365일 24시간 운영된다. 클라우드를 구성하는 서버들은 온도와 습도가 조절되는 곳에서 관리되며, 혹시 모를 정전에 대비해 비상 발전 시스템도 구축돼 있다. KISTI는 “데이터 백업 및 복구율은 100%”라고 밝혔다.
◇AI로 연구자 맞춤형 데이터 제공
데이터 댐에 모인 데이터는 AI로 재가공된다. 기존에는 연구자들이 수많은 데이터 안에서 원하는 정보를 하나씩 찾으려면 시간이 오래 걸렸지만, 이젠 AI가 분야별로 정보를 정리해 연구자에게 맞춤형 정보를 제공한다. 예를 들면 다양한 논문에서 연구자가 관심 있는 용어나 문장 등을 정확하면서도 쉽고 빠르게 검색할 수 있게 하는 것이다. 이 본부장은 “휴대전화에서 네이버 앱을 실행하듯이 바이오·항공우주·천문 같은 원하는 분야의 앱을 개발해 연구자들이 특화된 연구를 할 수 있도록 하는 것이 목표”라고 말했다.
데이터 수집·전달 과정에서 일어날 수 있는 사이버 위협에 대응할 수 있는 시스템도 작동하고 있다. 본부 내 과학기술보안연구센터에서는 실시간으로 사이버 보안 관제, 분석, 대응을 하고 있다. 수많은 데이터를 한꺼번에 보내서 서버를 과부하시키는 디도스 공격이나 홈페이지 조작 등을 탐지한다. KISTI는 “사람을 대신해 AI를 통해 사이버 공격을 빠르게 탐지할 수 있다”며 “하루에 3000만 건이 넘는 이상 신호를 확인해 실제 위협이 발생하면 각 기관에 알린다”고 설명했다. 이 밖에 KISTI는 인재 양성을 위한 데이터 교육도 진행하고 있다.
이런 데이터 통합 시스템은 과학기술 데이터의 생산지와 수요지를 빠르고 안전하게 연결한다. 이를 통해 사회 문제를 해결하고 더 나아가 산업 성장을 주도하는 핵심 연구 기술을 발전시킨다는 구상이다. 이 본부장은 “연구자들이 현장에서 바로 활용하는 데 최적화된 데이터를 선별해 맞춤형으로 제공하는 게 디지털 전환의 핵심”이라며 “사용자 중심의 과학기술 서비스 혁신과 변화에 이바지하는 것이 목표”라고 말했다.