최근 인공지능(AI) 기반의 딥페이크 기술로 가족·친지나 지인의 목소리를 복제·위조한 뒤 이를 보이스피싱이나 스미싱에 악용하는 사례들이 늘고 있다. 특히 텍스트를 음성으로 변환해주는 TTS(Text to Speech) 기술의 고도화로, 이를 우려하는 목소리도 커지는 상황이다.
LG유플러스는 AI 기술을 악용한 보이스피싱이나 스미싱 피해를 예방하기 위해 ‘안티딥보이스(Anti-DeepVoice)’ 기술을 개발했다. AI 기술을 악용해 위조한 음성을 AI로 판별하는 기술을 만든 셈이다. LG유플러스는 진짜 사람의 목소리와 AI가 위조한 목소리를 학습시켜 AI가 기계가 만든 목소리 내 발음의 미세한 부자연스러움과 음성 주파수 영역에서 비정상적 패턴 등을 탐지할 수 있도록 기술을 구현했다. 자체 테스트한 결과, 안티딥보이스 분석 정확도는 약 95%를 기록했다.
LG유플러스는 고객들이 이 기술을 편하게 쓸 수 있도록 경량화에도 집중했다. 성능이 뛰어난 AI 엔진이라도 서비스에 접목해 사용할 수 없으면 고객이 실제 효용을 체감할 수 없기 때문이다. 이에 LG유플러스는 안티딥보이스 기능을 온디바이스(On-Device) 환경에서도 원활히 작동하도록 AI 모델의 크기를 최적화했다. LG유플러스는 경량화된 AI 모델을 자사 AI 에이전트 서비스 ‘익시오’에 탑재될 예정이다. 안티딥보이스 기능을 통해 익시오 이용 고객은 통화 중 지인의 목소리를 본뜬 딥페이크 목소리를 탐지할 수 있게 되는 것이다. 또 탐지시 고객에게 팝업 메시지로 알려준다.
LG유플러스는 자체 개발한 ‘sLM(small Language Model) 기술’ 및 ‘화자·음성 인식 기술’도 함께 활용해 보이스피싱·스미싱 등을 차단한다는 계획이다. 음성 인식을 통해 음성을 텍스트로 바꾸고 텍스트 기반의 sLM 기반의 실시간 보이스피싱 탐지 기술로 보이스피싱 위험성이 있는지 판단하는 한편, 안티딥보이스 기술로 걸려온 전화 속 인물이 진짜 사람인지 여부를 파악하겠다는 것이다.
앞서 LG유플러스는 2021년 음성 내용을 텍스트로 바꾸는 ‘음성인식’ 기술을 개발했고, 2023년에는 말하는 사람의 목소리를 구분·식별할 수 있는 ‘화자 인식’ 기술을 완성했다. 화자 인식 기술은 개인이 말할 때 표출되는 특징, 속도, 억양 등 차이를 AI를 통해 비교한 뒤 그 차이점을 학습함으로써 발화자의 특징을 추출할 수 있다. 앞으로 LG유플러스는 보이스피싱범들의 목소리 정보를 온디바이스로 기기에 저장해 AI가 실시간으로 ‘보이스피싱 이력 목소리’ 여부를 파악할 뿐 아니라, 통화 중 대화 문맥에 기반해 보이스피싱 여부를 더 정확히 판단하도록 한다는 할 계획이다.
‘안전한 AI’ 기술을 기반으로 한 ‘미래 AI 경쟁력 확보’가 LG유플러스의 전략이다. 회사 관계자는 “모두가 AI의 편의에 집중할 때, 자칫 소홀해질 수 있는 기본인 ‘안전’부터 다지겠다는 것”이라며 “그 위에 편의 기능을 더하고 글로벌 기업과 파트너십으로 AI 경쟁력을 확보하겠다”고 했다. 또 LG유플러스는 양자암호 기술을 소프트웨어(SW) 형태로 구축하고, 데이터가 서버에 저장되지 않은 채 단말기에서 모두 처리되는 온디바이스 sLM 기술 도입 등도 계획하고 있다.