선천적 질병 또는 후천적 사고로 목소리를 잃은 농인들의 목소리를 찾아주는 기술이 등장했다. KT는 26일 ‘목소리 찾기’ 프로젝트로 탄생한 농인의 목소리를 활용해 음성 소통을 돕는 전용 모바일 앱(응용프로그램) ‘마음톡’을 개발했다고 밝혔다.
◇가족의 목소리로 만들어낸 ‘특별한 목소리’
KT는 앞서 지난 4월 ‘목소리 찾기’ 프로젝트 참가자 20명을 선발해 목소리 구현에 들어갔다. 이 프로젝트에는 AI(인공지능) 딥러닝 기술로 농인 가족의 목소리를 합쳐 새로운 목소리를 만드는 ‘개인화 음성합성기술’이 활용됐다. 농인 본인의 목소리 데이터 없이 새로운 목소리를 만들어냈다는 것이다. KT측은 “참가자 가족의 목소리 데이터와 참가자 성별, 나이, 구강구조 등 개인의 특성을 AI로 분석해 하나뿐인 목소리를 만들어냈다”고 설명했다.
KT에 따르면 각 참가자의 동성 가족 구성원들은 참가자의 특성 있는 목소리를 만들기 위해 1000문장을 녹음했다. 녹음에는 1인당 평균 6시간이 소요됐다. 구강 구조가 유사한 형제·자매가 녹음을 진행한 경우엔 구현된 목소리 값의 오차가 적었지만, 부모님이 목소리를 진행한 경우엔 오차가 컸고, 억양 차이를 보정 하는 등 추가 작업이 필요했다.
◇문자→음성 전환해주는 ‘마음톡’
KT는 이런 방법으로 구현된 목소리로 음성 소통을 할 수 있는 앱 ‘마음톡’도 개발했다. 이 앱은 이번 프로젝트 참가자와 가족·지인만 이용할 수 있다. 농인 사용자가 텍스트를 입력하면 KT의 GPU(그래픽 처리장치) 클라우드 시스템이 이를 목소리로 바꾼다. 수천만번의 연산을 통해 1초 내외에 문자 데이터를 음성 데이터로 전환하는 것이다. 농인은 문자를 하는 방식으로 소통하고, 상대방은 일반 음성통화를 하는 것 처럼 대화를 나눌 수 있는 것이다.
KT측은 “앞으로 2년 동안 참가자들의 ‘마음톡’ 사용을 지원하고, 불편한 점을 지속적으로 업데이트 해나갈 예정”이라고 밝혔다.