“The sliced raw fish shoes it wishes. Google green onion thing!”
2004년, 구글 본사에서 열린 한 회의에서 창립자 세르게이 브린은 한국의 구글 팬이 보낸 전자우편 메시지를 자사가 이용하는 자동번역기에 넣고 돌렸다.
도대체 어떤 한글 메시지를 자동'번역'했길래, 도저히 뜻 파악이 안 되는 황당한 영어 문장이 나왔을까. 아마 raw fish는 '회', shoes는 '신'이었을 법하다. green onion은 '파'였을 것이다. thing은 '팅.' 결국 '회신 바랍니다. 구글 파이팅"쯤 됐을 법하다.
당시 ’구글이라면 더 잘할 수 있었을 텐데’라고 생각했던 브린은 이후 번역 서비스를 정교화하는 작업에 착수했고, 현재 구글은 무려 52개 언어를 번역할 수 있는 서비스를 무료로 제공한다. 이용자만 전 세계 수억명에 달한다.
뉴욕타임스(NYT) 인터넷판은 이처럼 사소한 사건에서 번역서비스 개발의 필요성을 절감한 구글이 업종의 특성을 최대한 활용, 자동번역기 시장에서 1인자로 올라서는 과정을 8일 소개했다.
과거의 기계 번역은 두 언어의 규칙을 컴퓨터에 숙지시켜 그에 대응하는 번역문을 만들도록 하는 방식이었다. 그러나 1990년대 중반 이후에는 수많은 문장과 그 번역문을 시스템에 입력, 번역기가 새로운 문장의 의미를 정확히 추론토록 하는 ’통계적 접근’ 방식이 주를 이뤘다.
엄청난 양의 텍스트 자료를 늘 처리하는 데다, 그만큼의 자료량을 감당할 만큼 뛰어난 전산처리 능력을 보유한 구글은 통계적 접근 방식을 이용한 번역시스템 개발에서 더할 나위 없이 유리한 위치에 있었다.
여기에다 구글은 6개국어로 번역된 유엔 회의록과 23개국어로 번역된 유럽의회 회의록을 번역엔진에 입력, 이를 숙지한 번역시스템이 해당 언어의 가장 일반적인 표현을 구사하도록 했다. 또 사용자가 ’번역 도구 모음’ 기능을 이용해 적절한 번역 표현을 데이터베이스에서 찾고, 필요하면 여기에 새 표현을 추가할 수도 있는 환경을 제공했다.
이런 노력 끝에 구글의 자동번역 서비스는 아직 완벽한 수준까지는 아니더라도, 최소한 뉴스기사의 핵심 내용 전달이나 대략적인 번역 등에는 충분하다는 평가를 받는다고 NYT는 보도했다.
고 있다.
2004년부터 구글 번역시스템 개발에 참여하는 프란츠 오흐 박사는 “이같은 기술은 언어장벽을 걷어내 모든 이들이 서로 소통할 수 있게 한다”면서 현재 번역의 수준이 매우 빠른 속도로 좋아지고 있어 전망은 밝다고 말했다.