
[한국뉴스투데이] 인공지능(AI)이 대표적인 민생침해범죄인 보이스피싱을 만나면서 딜레마에 빠졌다. 통신사들이 AI를 기반으로 보이스피싱을 필터링하고 미끼문자 특성을 탐지하는 AI를 개발하는 등 보이스피싱 탐지를 본격화하는 가운데 짧은 음성만으로도 목소리를 합성하는 딥보이스를 활용한 보이스피싱이 늘어나고 있다.
통신사들 AI 활용, 보이스피싱 탐지
SKT와 KT, LG유플러스 등 국내 이동통신3사는 AI를 활용한 보이스피싱 탐지를 본격화하고 있다. 먼저 SKT는 한국인터넷진흥원(KISA)과 협업해 SKT의 AI가 신고된 메시지를 분석·판단하고 학습하도록 하고 있다. 이를 통해 사전에 지정된 보이스피싱 미끼 문자 자체의 언어적 문맥과 특성을 이해하고, 변화하는 보이스피싱 미끼 문자 특징을 탐지해 분류할 수 있는 전용 AI 모델을 고도화하는 중이다.
또 서울경찰청과의 협력을 통해 경찰에 피해 신고가 접수된 보이스피싱 번호를 제공받고, 고객이 해당 번호로 전화를 걸거나 받을 수 없도록 차단하는 시스템도 제공하고 있다. 지난 2018년에 해당 서비스에 AI를 적용한 SKT은 2021년에는 발신차단 기능을 도입하는 등 지속적으로 서비스를 고도화하며 고객 피해를 예방하고 있다. SKT의 On-device AI 기술을 활용해 통화 중 실시간으로 보이스피싱을 탐지해 대응 중이다.
LG유플러스도 AI를 활용해 보이스피싱 위험으로부터 고객을 보호하고 있다. LG유플러스의 고객피해방지 분석시스템은 고객의 피해대응 정보와 경찰청, KISA 등의 정보를 종합 분석하는 시스템이다. 또 고객을 속여 피해를 유발하는 악성 URL 분석 솔루션과 악성 앱 분석 솔루션을 고객피해방지 분석시스템과 연동해 보이스피싱 예방 효과를 극대화하고 있다. 리다이렉티드 URL 트레이스 도입을 통해 스팸문자 발송 서버를 추적해 원천 차단도 실시 중이다.
KT는 경찰청과 협력해 서킷브레이커 도입을 추진 중이다. 서킷브레이커는 보이스피싱 범죄자의 전화 발신과 피해자의 수신을 즉각적으로 차단하는 시스템이다. 기존에 보이스피싱 범죄와 관련된 번호정지 절차가 하루 이상 소요된 반면 해당 시스템은 경찰의 요청에 따라 즉시 차단이 가능하다. 또 스팸 필터링에 사용하는 자체 AI 언어모델 믿음을 경량화했다. 이에 스팸 여부를 35ms(밀리초·1ms는 1000분의 1초)만에 판단한다.
통신사들이 보이스피싱을 방지하기 위해 AI를 적극 활용 중인 가운데 정부도 통신사들을 지원하고 나섰다. 지난 6월 3일 과기정통부와 금융감독원, 개인정보보호위원회 등은 이동통신3사와 AI·데이터 기반 보이스피싱 예방을 위한 상호 업무협약을 체결했다. 정부는 해당 업무협약으로 보이스피싱 피해자의 신고로 금감원이 수집한 통화 데이터를 통신사 등 민간 기업에 제공하고 있다.

딥보이스로 진화하는 보이스피싱
정부와 통신사들이 AI를 활용해 보이스피싱을 방지하고 나선 가운데 한쪽에서는 AI를 활용해서 보이스피싱에 사용하고 있다. 보이스피싱에 활용되고 있는 AI 기술 중 하나는 딥보이스다. 딥보이스는 '딥러닝(Deep Learning)'과 '목소리(Voice)'의 합성어로 특정 인물의 목소리를 복제하고 해당 인물이 하지도 않은 말을 실제로 한 것처럼 만들어내는 것으로 AI기반 음성 합성 기술이다.
지난해 마이크로소프트(MS)가 공개한 음성합성 AI 발리(VALL-E)는 3초 가량의 목소리 샘풀만 가지고 그 사람의 목소리와 같은 음성을 합성해 냈고 감정과 어조까지 유사하게 구사해 냈다. 발리는 목소리 뿐만 아니라 목소리 주변 환경까지 구현해낸다. 즉, 목소리 샘플이 화장실과 같은 울리는 공간에 있으면 합성된 AI 음성도 화장실에서 통화하는 것처럼 만들 수 있다.
발리와 같은 AI 음성 합성 서비스는 실제 상용화돼 누구나 손쉽게 이용할 수 있고 음성 복제는 공공연히 벌어지고 있다. 지난 5월 부산에서 AI로 조작하고 합성된 목소리에 속은 보이스피싱 사건이 발생했다. 피해자인 60대 할머니는 딸의 목소리로 돈이 필요하다는 전화를 받고 2000만원을 송금하려다 이를 수상하게 여긴 신고로 다행히 피해를 모면했다. 조사 결과 딸의 목소리는 AI기술로 조작, 합성된 목소리였다.
유튜브 등에서도 딥보이스 기술을 쉽게 만날 수 있다. AI커버 영상이라고 검색을 하면 실제 가수의 목소리와 똑같은 목소리로 노래를 부르는 AI 영상을 만날 수 있다. 아직까지 AI 합성 음성과 실제 음성과의 일치도는 80~90%로 100%에는 못미치지만 전화로 한 문장이나 길어야 두 문장 정도를 듣고 가려내기란 사실상 어렵다. 특히나 노인들의 경우 AI 음성을 걸러내기가 쉽지 않다는 우려의 목소리가 나온다.
특히, 실제 음성이 아니라 전화 목소리나 SNS 영상에서 나오는 목소리만으로도 AI 음성 합성이 가능하다는 점은 주의가 필요하다. 이에 지난 5월 경찰청은 "딥보이스는 억양과 호흡, 침묵까지 표현할 수 있어 실제 음성과 구분이 어려워지고 있다"면서 "SNS에 음성이 포함된 게시물을 올릴 때는 주의하고 조금이라도 의심스러운 요청은 반드시 사실 여부를 확인해야 한다"고 당부한 바 있다.

경찰, 딥페이크·딥보이스 탐지 기술 개발
보이스피싱 범죄는 대표적인 민생침해범죄다. 경찰청은 AI 기술을 이용한 보이스피싱을 대비하기 위해 오는 2025년부터 딥페이크와 딥보이스 등 허위조작 콘텐츠를 탐지할 수 있는 딥러닝 기술 개발을 예고했다. 이에 경찰청은 내년 예산을 올해 대비 4.2%(5457억원) 증액한 13조5364억원 규모로 확대 편성했다. 그중 주요사업비는 올해 대비 1.9%(494억원) 증액된 2조6067억원 규모다.
경찰청에 따르면 허위영상물 범죄에 대응하기 위해 딥페이크 방식의 허위영상물과 최신 AI 기법을 활용한 허위영상물까지 탐지하는 소프트웨어 고도화에 5억원이 투자된다. 딥페이크와 딥보이스 등 진화하는 허위콘텐츠 범죄에 대응하기 위해 딥러닝에 기반한 허위조작 콘텐츠 복합 탐지 기술에는 내년에만 27억원이 투자되는 등 오는 2027년까지 총 91억원이 투입될 예정이다.
또 점진적으로 조직화되고 지능화하고 있는 투자리딩방, 피싱 등 악성사기, 온라인, 홀덤펍 등 도박 등 민생침해범죄에 대응해 범죄조직의 균열을 유도하고 제보를 활성화하기 위해 건당 최대 1억원까지 지급하는 조직범죄 특별신고보상금을 신설해 신고를 유도할 방침이다. 마약범죄 추적 중 가상자산 믹싱 등 지능화된 수법 대응을 위한 가상자산 전문가 분석기술에 대한 지원과 가상자산 추적을 위한 간편조회 시스템도 도입된다.
한편, 경찰청은 AI피싱 사기 예방법에서 SNS 계정 내 개인정보를 최소화하고 특히 자신의 목소리가 포함된 게시글 업뎃을 주의하라고 당부했다. 의심스러운 전화나 영상에 대한 사실 확인 여부도 중요하다. 그럼에도 AI피싱이 발생하면 경찰청 112나 금감원 1332, 해당 금융사 콜센터 등에 피해 신고 및 계좌 지급 정지를 요청해야 한다. 또 금감원 개인정보 노출 사고예방시스템에서 피해 여부를 등록해야 한다.
