마이크로소프트 로고/로이터 연합뉴스

마이크로소프트(MS) ‘애저’에서 29일(현지 시각) 오류가 발생해 한때 전 세계 서비스와 앱 수천 개가 마비됐다. 애저는 아마존웹서비스(AWS)에 이은 세계 2위 클라우드 서비스다. 최근 AWS에서 대규모 장애가 발생한 데 이어 애저에서도 장애가 발생하자 클라우드 서비스에 과도하게 의존하는 것을 두고 우려가 커지고 있다.

MS에 따르면, 이날 오전 11시부터 애저에서 서비스 장애가 발생했다. 클라우드 서비스에 장애가 생기자 이 서버를 이용하는 MS 산하 서비스가 동시에 영향을 받았다. 또 애저를 사용하는 알래스카항공, 스타벅스, 코스트코 등 여러 기업이 체크인이나 결제 처리에 차질을 빚었다. 낮 12시쯤엔 장애 발생 범위가 더 넓어지며 애저의 경우 최대 2만여 건의 접속 장애가 보고되기도 했다.

애저 측은 이후 업데이트 공지에서 “의도치 않은 구성(시스템 설정값) 변경이 이뤄져 문제가 생긴 것 같다”며 “현재 애저 프런트 도어(AFD) 서비스에 대한 모든 변경을 차단하고 정상 상태로 되돌리는 조치를 하고 있다”고 말했다. ‘애저 프런트 도어’는 전 세계로 트래픽을 분산시키는 네트워크의 관문이다. 클라우드 시스템 설정을 잘못 건드려 전 세계 트래픽이 꼬여 오류가 발생했다는 것이다.

이번 사태는 특정 클라우드 인프라에 크게 의존할 때 발생할 수 있는 구조적인 문제를 다시 한번 보여줬다. 지난 20일 세계 1위 클라우드 서비스 업체인 AWS에서도 장애가 발생하며 한국을 비롯한 전 세계 공공기관과 기업들이 피해를 봤다. 불과 10일 만에 세계 2위 업체인 애저에서 비슷한 문제가 발생했다. 로이터통신은 “이번 장애는 전 세계 디지털 인프라의 취약성과 클라우드 서비스 과의존을 여실히 보여줬다”고 보도했다.

특히 사소한 오류의 파급력이 전 세계로 미칠 수 있다는 점이 우려를 키우고 있다. 이번 애저 서비스 오류 원인은 ‘비의도적 구성 변경’이다. 큰 정전이나 자연재해가 아닌, 설정값을 잘못 입력하는 직원의 실수만으로도 전 세계 주요 서비스가 마비될 수 있다는 뜻이다. 지난 AWS 서버 장애 역시 미 버지니아주의 ‘US-EAST-1’ 리전(데이터센터 묶음 단위)에서 발생했다.