Pindrop의 Chris Halaschek: 스마트 스피커의 인기가 높아짐에 따라 합성 음성 및 음성 합성은 우리가 준비해야 할 사항입니다.

게시 됨: 2019-01-12

거대한 연례 CES(Consumer Electronics Show)가 오늘 막을 내렸고 Amazon의 Alexa 및 Google의 Assistant와 같은 음성 비서가 있는 스마트 장치가 2년 연속으로 쇼의 주제였던 것 같습니다. 말장난이 의도한 것입니다. Amazon은 최근 1억 대 이상의 Echo 기기를 판매했다고 발표했고 분석가는 Google이 Google Home 기기의 절반 정도를 판매했다고 추정하면서 우리가 스마트 기기와 상호 작용하는 데 상당히 익숙해지고 있음을 쉽게 알 수 있습니다. 그러나 사람들이 이러한 장치를 사용하여 개인적으로나 직업적으로나 보다 민감한 상호 작용 및 서비스를 처리하는 데 충분히 편안함을 느끼려면 외부의 악의적인 행위자로부터 데이터를 보호하기 위해 훨씬 더 나은 보안이 필요합니다.

음성 사기 방지 및 인증 분야의 선구적인 회사인 Pindrop 의 IoT 담당 부사장인 Chris Halaschek 은 나를 회사의 애틀랜타 본사로 초대하여 이러한 종류의 장치에 대한 보안을 갖춘 오늘날 우리의 위치와 무엇을 할 수 있는지에 대해 이야기했습니다. 널리 사용되는 장치를 사용하여 더 많은 작업을 더 안전하게 수행할 수 있습니다.

아래는 우리의 대화 내용을 편집한 것입니다. 전체 인터뷰를 보고 음성 식별이 귀하가 아닌 사람들이 Alexa에게 은행 정보를 요청하는 것을 차단하는 방법에 대한 데모를 보려면 아래 비디오를 확인하거나 내장된 SoundCloud 플레이어를 클릭하십시오.

스마트 스피커 사용이 증가함에 따라 음성 도우미 보안 문제도 발생합니다.

Small Business Trends : 좋습니다. 저는 Small Business Trends입니다. 저는 Pindrop의 본사에 앉아 있습니다. 여기 애틀랜타에 있는 정말 멋진 회사입니다. 종종 나는 애틀랜타에서 더 많은 일을 할 수 있기를 바랍니다. 이 회사는 음성 및 생체 인식과 관련하여 정말 흥미로운 일을 하고 있습니다. 여기 Chris Halaschek과 함께 앉아 있습니다. 크리스, 오늘 함께해주셔서 감사합니다.

Chris Halaschek : 네, 감사합니다. 브렌트. 와주셔서 감사합니다.

Small Business Trends : 자 , 여기서 당신이 하는 일과 Pindrop에 대해 조금 알려주세요.

Chris Halaschek : 저는 애틀랜타 출신입니다. 저는 애틀랜타에서 자랐고 노스로 이사한 메릴랜드 대학교에서 컴퓨터 공학 박사 학위를 받았습니다. 나는 DC 지역에서 시간을 보냈습니다. 그런 다음 나는 서부 해안으로 나가 기술을 파헤쳤습니다. 저는 소수의 초기 단계 기술 회사의 CTO였습니다. 나는 모든 시간을 제품을 만들고, 제품을 시장에 출시하고, 그 비즈니스를 성장시키고 확장하는 데 보냈습니다.

저는 현재 약 3년 반 동안 Pindrop에서 근무했습니다. 우리의 초점은 항상 모든 음성 상호 작용에 실시간 ID, 보안 및 신뢰를 제공하는 것이었습니다. 우리는 일반적으로 음성이 주로 사용되는 엔터프라이즈 콜 센터에 중점을 두었지만 이제는 음성이 전화 채널을 넘어 스마트 스피커, 자동차 등과 같은 흥미로운 장치로 이동하고 있다는 사실을 알게 되실 것입니다.

Small Business Trends : 이러한 새로운 장치에 관해서, 음성 비서가 내장된 이러한 스마트 스피커, 현재 보안 상태는 무엇이며, 우리보다 더 높은 수준에서 채택되기 위해 어디로 가야 하는지' 오늘 다시 봅니까?

크리스 할라첵 : 네. 좋은 질문입니다. 그것은 우리가 물어야 할 것입니다, 브렌트. 보안은 일반적으로 나중에 생각하기 때문에 이 대화에 관심을 갖게 된 이유 중 하나입니다. 우리는 이러한 유형의 장치로 달성할 수 있는 유형의 상호 작용이 훨씬 더 풍부해지고 훨씬 더 민감한 데이터를 노출하기 시작하는 시점에 와 있습니다. 단순히 음악을 듣거나 불을 켜는 것이 아닙니다.

따라서 현재의 최신 기술은 아마도 가장 좋은 경우일 것입니다. 우리가 스마트 스피커를 말하는 것이라면 음성 4자리 핀을 사용하는 것입니다. 비밀번호를 큰 소리로 말하는 것은 바람직하지 않다는 사실을 우리 중 누구라도 이해할 수 있을 것입니다. 따라서 이러한 다양한 종류의 음성 환경에 더 강력한 형태의 ID 및 인증을 가져올 기회가 많이 있다고 생각합니다. 차 안에서 또는 사무실 환경에서 말하는 경우 차량 내부의 스마트 스피커도 마찬가지입니다. 이것으로. 적절한 보안, 신원 및 신뢰를 제공할 수 있다는 가정 하에 비즈니스 정보에 액세스할 수 있는 기회가 있습니다.

Small Business Trends : 내가 생각하고 많은 사람들이 생각하고 있는 것 중 하나는 영업사원과 같은 사람들이 CRM을 더 많이 사용하도록 하는 방법입니다. 목소리는 그것에 대해 분명한 것 같습니다. 그러나 개인 정보 보호 및 보안의 관점에서 영업 사원과 비즈니스 엔터프라이즈 애플리케이션을 사용하는 사람들이 올바른 사람이 애플리케이션을 사용하고 데이터를 입력하고 데이터에 액세스하는지 확인하려면 어떻게 해야 할까요? 음성 생체 인식 관점에서 기업이 편안하게 느낄 수 있도록 하려면 어떻게 해야 할까요?

Chris Halaschek : 음성 지원 장치가 있는 회의실에 들어가려고 하는 경우에도 마찬가지입니다. CRM 관련 일부 계정과 관련된 데이터가 있으므로 해당 정보에 실제로 액세스할 수 있는 권한이 있는 공유 장치인지 확인해야 합니다. 우리가 보는 기회, 그리고 다시 한 번 우리는 역사적으로 사기 탐지 및 인증 솔루션을 모두 갖춘 콜 센터에 집중해 왔습니다. 우리가 거기에 접근한 방식은 다른 음성 채널에서도 접근할 수 있는 유사한 방식이라고 생각합니다.

Chris Halaschek : 오늘날 우리가 콜센터에서 하는 일을 보면, 다시 말하지만 이것이 다른 채널인 Brent 와도 병행할 것이라고 생각합니다. 음성 채널. 일반적으로 수행되는 방식은 지식 기반 인증 질문이라는 것을 사용하는 것입니다. 일반적으로 인증 또는 보안 용어로 알고 있는 것입니다. 그래서 그것은 제 어머니의 결혼 전 이름, 제 사회보장번호(SSN)의 마지막 4자리, 아마도 핀이나 비밀번호일 것입니다.

다시 말하지만, 우리는 스마트 스피커에서 4자리 핀을 사용하고 있다는 대화의 앞부분에서 언급했습니다. 유사한 유형의 접근 방식이 콜 센터에서 사용되었습니다. 불행한 현실은 그것이 끔찍하게 불안정하다는 것입니다. 이러한 유형의 데이터는 2차 시장 또는 암시장에서 사용할 수 있습니다. 그것이 바로 많은 수의 위반으로 이어졌습니다. 기업 콜센터의 음성 채널은 해당 채널의 음성 사기 손실 측면에서 오늘날 사실상 140억 달러 문제로 이어지는 것입니다.

우리는 기회를 봅니다. 그리고 Pindrop이 하는 일은 음성 생체 인식 기술을 사용하여 해당 핀과 비밀번호를 사용자의 음성으로 바꾸는 것입니다. 우리는 그러한 유형의 음성 상호 작용에서 실제로 활성화된 장치를 매우 독특하고 정확하게 식별하는 기술을 보유하고 있습니다. 그래서 우리는 마찰 없이 올바른 음성, 올바른 장치, 올바른 행동을 확인할 수 있는 기술을 보유하고 있습니다.

스마트 스피커와 제가 회의실 중 한 곳에 들어가서 음성 지원 장치 중 하나와 상호 작용하는 것과 같은 것을 보면 동일한 음성 생체 인식 기술을 사용하여 내가 올바른 스피커인지 확인할 수 있는 엄청난 기회가 있습니다. 그 특정 거래에서. Salesforce를 사용하고 "이봐, Salesforce 또는 Hey Einstein, X, Y, Z 기회에 대한 최신 상태를 알려주세요."라고 말하면 내가 확인된 연사이기 때문에 나에게만 제공될 것입니다. 해당 정보에 액세스할 수 있습니다.

소규모 비즈니스 동향 : 이제 음성이 진짜인지 아닌지 또는 유기적이거나 유기적이지 않다는 것을 사용자에게 경고하는 작업도 수행합니다. 그것에 대해 조금 이야기하십시오.

Chris Halaschek : 음성 식별 및 음성 생체 인식 기술을 보고 있다면 존재하고 해당 유형의 인증 자격 증명을 사용하는 다양한 위협 벡터에 탄력적이어야 한다는 것을 알고 있습니다. 현실은 나쁜 행위자가 매우 영리하며 이러한 유형의 방어를 우회하기 위해 많은 노력을 기울이고 있다는 것입니다. 따라서 음성 생체 인식을 살펴보면 악의적인 사용자가 시도할 다양한 음성 스푸핑 공격 벡터가 있습니다. 어떤 유형의 상호 작용을 수행하는 것을 실제로 녹음한 재생 공격과 같은 것입니다. 다시 돌아가서 이러한 유형의 시스템 또는 데이터에 액세스하기 위해 해당 녹음을 활용하려고 합니다.


다른 병합 공격 벡터는 합성 음성 생성 또는 음성 합성이라고 하는 것입니다. 최근 Google I/O 컨퍼런스에서 Google Duplex 데모를 보셨는지 모르겠습니다.

중소기업 동향 : 예. 나는 그것을 보았고 "와우, 알았어. 이것은 흥미 롭다."

Chris Halaschek : 정말 멋지고 동시에 조금 무섭죠 ?

중소기업 동향 : 네.

Chris Halaschek : 최종 사용자의 관점에서 볼 때 효율성을 많이 높일 수 있다고 생각하지만, 다른 쪽 끝에 있는 봇은 모두 합성 음성으로 실시간으로 수행되었기 때문에 합성 음성 생성으로 갈 수 있는 곳을 보여줍니다. . 우리는 몇 가지 데모를 가지고 있으며 오늘 그 중 일부를 보여드리게 되어 기쁩니다. YouTube와 같이 우리가 가져온 몇 분의 오디오로 얼마나 많은 일을 할 수 있는지 보여줍니다. 우리 연구팀은 주로 이러한 유형의 위협의 현실과 위협으로부터 보호해야 하는 이유를 보여주기 위해 자체 음성 합성 엔진을 내부적으로 구축했습니다.

우리는 음성 왜곡과 같은 것을 봅니다. 우리는 사물, 음성 변형을 봅니다. 누군가의 은행 계좌를 도용하려는 나쁜 배우가 있을 것이고, 그들은 아마도 그것이 여성 또는 남성 계좌일 수 있다는 것을 알고 있으므로 남성 또는 여성처럼 들리도록 목소리의 높낮이를 조정할 것입니다.

중소기업 동향 : 네.

Chris Halaschek : 합성 음성 및 음성 합성은 우리가 준비해야 할 다가오는 것입니다.

소규모 비즈니스 동향 : 엔터프라이즈 애플리케이션, 소프트웨어 애플리케이션, 심지어 콜센터 상담원도 사용하는 것들에 대해 생각할 때 이것은 사람들이 합법적으로 우려하는 보안 고비를 극복하는 데 정말 중요합니다.

Chris Halaschek : 맞습니다. 전화 채널에서 나오는 음성을 듣는 것을 본다면 - 집에서 문을 여는 것과 같은 기능에 액세스할 수 있게 해주는 이 스마트 스피커에 더 가깝습니다. 위협 유형 및 이에 대한 보호.

소규모 비즈니스 동향 : 이러한 스마트 장치와 보안이 필요한 이 전체 상황의 성숙도는 현재 어디에 있습니까?

Chris Halaschek: 저는 우리가 아직 초기 단계라고 생각합니다. 이는 좋은 일이며, 우리가 이러한 장치와의 상호 작용 유형에 대해 표면을 긁고 있다는 의미에서 초기 단계라고 생각합니다. 내가 좋다고 생각하는 또 다른 이유는 사람들이 미리 생각하기 시작하기 때문입니다. 우리는 일부 기업 고객과 이야기를 나눴고, 그들은 2019년에 다양한 플랫폼에 음성 기술을 도입하는 방안을 모색하고 있습니다. 그들은 특정 채널과 환경에 더 풍부한 경험을 제공하기를 원하지만 안전한 환경에서 이를 수행해야 합니다. 방법.

이제 기술적인 관점에서 기술이 존재한다고 생각합니다. 우리는 그것을 밖으로 꺼내 당신이 그것을 적용하는 방법에 대해 생각해야합니다. 내 말은, 내년을 바라보면서 점점 더 많은 기업이 이러한 유형의 경험을 이러한 채널로 가져오는 것을 보게 될 것이라고 생각합니다. 나는 우리가 여전히 아주 기본적인 일을 할 것이라고 생각합니다. 일부 보안 및 ID 관련 솔루션이 이러한 채널을 통해 시장에 출시됨에 따라 의미가 있는 경우 데이터에서 훨씬 더 흥미로운 사용 사례를 노출하기 시작할 것입니다.

소규모 비즈니스 동향 : 소비자의 스마트 장치 채택이 기업에서 일어나는 일에 어떤 영향을 미칩니까? 우리 모두는 소비자라는 것을 알고 있습니다. 우리는 집에 물건을 가져옵니다. 우리는 그것들을 사용하기 시작합니다. 그들은 정말 편리해집니다. 그런 다음 우리는 생각하기 시작합니다. "오, 이런, 우리가 기업을 사용하는 방식은 왜 안 되는 겁니까 ... 왜 집에서 하는 것만큼 편리하지 못할까요?"

Chris Halaschek : 소비자와 기업의 경계가 모호해지는 것 같습니다. 결국 우리는 모두 소비자이기 때문에 기업의 관점과 소비자의 관점 모두에서 매력적인 고객 경험을 기대하는 것이 현실입니다. 엔터프라이즈 소프트웨어 회사라면 비즈니스 소비자에게도 즐거운 사용자 경험을 제공해야 한다고 생각합니다. 그것이 바로 제 철학입니다. 그 흐름이 조금 전에 바뀌었다고 생각합니다. 실제로 이러한 비즈니스 응용 프로그램을 살펴보는 것이 중요하며 많은 경우 이러한 유형의 응용 프로그램에 대해 노출되는 데이터는 훨씬 더 민감한 것으로 볼 수 있습니다.

이러한 음성 비서의 많은 가정 사용은 여전히 ​​기본적인 종류이지만 지불 및 관리, 지불 또는 구매와 관련된 것으로 경향이 시작되었습니다. 따라서 더 민감한 사용 사례에 접근하기 시작할 것입니다. 우리는 또한 금융 거래와 같은 것이 어디에 있는지 상상했습니다. 음성 비서를 사용하여 주식 거래와 같은 일을 하고 싶어하는 소매 소비자인 저에게는 이러한 것들이 시장에 나오기 시작할 것이라고 생각합니다.

그것은 바로 데이터의 민감도에 관한 것입니다. 일반적으로 비즈니스 측면에서는 해당 정보를 노출하고 잠그는 방법을 평가하는 보안 팀이 있다고 생각합니다. 반면 소비자 측면에서는 최소한 스마트 스피커 또는 이러한 음성 지원 분야에서 시작했다고 생각합니다. . 그것은 당신 자신의 집의 한계에 있으며, 조금 더 신뢰할 수있는 시나리오입니다. 그러나 더 풍부한 거래를 가져오면 분명히 강력한 형식의 인증 및 ID가 있어야 합니다.

이것은 사상가들과의 일대일 인터뷰 시리즈의 일부입니다. 번역본은 출판을 위해 편집되었습니다. 오디오 또는 비디오 인터뷰인 경우 위의 내장 플레이어를 클릭하거나 iTunes 또는 Stitcher를 통해 구독하십시오.