Pindrop의 Chris Halaschek: 스마트 스피커의 인기가 높아짐에 따라 합성 음성 및 음성 합성은 우리가 준비해야 할 사항입니다.
게시 됨: 2019-01-12거대한 연례 CES(Consumer Electronics Show)가 오늘 막을 내렸고 Amazon의 Alexa 및 Google의 Assistant와 같은 음성 비서가 있는 스마트 장치가 2년 연속으로 쇼의 주제였던 것 같습니다. 말장난이 의도한 것입니다. Amazon은 최근 1억 대 이상의 Echo 기기를 판매했다고 발표했고 분석가는 Google이 Google Home 기기의 절반 정도를 판매했다고 추정하면서 우리가 스마트 기기와 상호 작용하는 데 상당히 익숙해지고 있음을 쉽게 알 수 있습니다. 그러나 사람들이 이러한 장치를 사용하여 개인적으로나 직업적으로나 보다 민감한 상호 작용 및 서비스를 처리하는 데 충분히 편안함을 느끼려면 외부의 악의적인 행위자로부터 데이터를 보호하기 위해 훨씬 더 나은 보안이 필요합니다.
음성 사기 방지 및 인증 분야의 선구적인 회사인 Pindrop 의 IoT 담당 부사장인 Chris Halaschek 은 나를 회사의 애틀랜타 본사로 초대하여 이러한 종류의 장치에 대한 보안을 갖춘 오늘날 우리의 위치와 무엇을 할 수 있는지에 대해 이야기했습니다. 널리 사용되는 장치를 사용하여 더 많은 작업을 더 안전하게 수행할 수 있습니다.
아래는 우리의 대화 내용을 편집한 것입니다. 전체 인터뷰를 보고 음성 식별이 귀하가 아닌 사람들이 Alexa에게 은행 정보를 요청하는 것을 차단하는 방법에 대한 데모를 보려면 아래 비디오를 확인하거나 내장된 SoundCloud 플레이어를 클릭하십시오.
Small Business Trends : 좋습니다. 저는 Small Business Trends입니다. 저는 Pindrop의 본사에 앉아 있습니다. 여기 애틀랜타에 있는 정말 멋진 회사입니다. 종종 나는 애틀랜타에서 더 많은 일을 할 수 있기를 바랍니다. 이 회사는 음성 및 생체 인식과 관련하여 정말 흥미로운 일을 하고 있습니다. 여기 Chris Halaschek과 함께 앉아 있습니다. 크리스, 오늘 함께해주셔서 감사합니다.
Chris Halaschek : 네, 감사합니다. 브렌트. 와주셔서 감사합니다.
Small Business Trends : 자 , 여기서 당신이 하는 일과 Pindrop에 대해 조금 알려주세요.
Chris Halaschek : 저는 애틀랜타 출신입니다. 저는 애틀랜타에서 자랐고 노스로 이사한 메릴랜드 대학교에서 컴퓨터 공학 박사 학위를 받았습니다. 나는 DC 지역에서 시간을 보냈습니다. 그런 다음 나는 서부 해안으로 나가 기술을 파헤쳤습니다. 저는 소수의 초기 단계 기술 회사의 CTO였습니다. 나는 모든 시간을 제품을 만들고, 제품을 시장에 출시하고, 그 비즈니스를 성장시키고 확장하는 데 보냈습니다.
저는 현재 약 3년 반 동안 Pindrop에서 근무했습니다. 우리의 초점은 항상 모든 음성 상호 작용에 실시간 ID, 보안 및 신뢰를 제공하는 것이었습니다. 우리는 일반적으로 음성이 주로 사용되는 엔터프라이즈 콜 센터에 중점을 두었지만 이제는 음성이 전화 채널을 넘어 스마트 스피커, 자동차 등과 같은 흥미로운 장치로 이동하고 있다는 사실을 알게 되실 것입니다.
Small Business Trends : 이러한 새로운 장치에 관해서, 음성 비서가 내장된 이러한 스마트 스피커, 현재 보안 상태는 무엇이며, 우리보다 더 높은 수준에서 채택되기 위해 어디로 가야 하는지' 오늘 다시 봅니까?
크리스 할라첵 : 네. 좋은 질문입니다. 그것은 우리가 물어야 할 것입니다, 브렌트. 보안은 일반적으로 나중에 생각하기 때문에 이 대화에 관심을 갖게 된 이유 중 하나입니다. 우리는 이러한 유형의 장치로 달성할 수 있는 유형의 상호 작용이 훨씬 더 풍부해지고 훨씬 더 민감한 데이터를 노출하기 시작하는 시점에 와 있습니다. 단순히 음악을 듣거나 불을 켜는 것이 아닙니다.
따라서 현재의 최신 기술은 아마도 가장 좋은 경우일 것입니다. 우리가 스마트 스피커를 말하는 것이라면 음성 4자리 핀을 사용하는 것입니다. 비밀번호를 큰 소리로 말하는 것은 바람직하지 않다는 사실을 우리 중 누구라도 이해할 수 있을 것입니다. 따라서 이러한 다양한 종류의 음성 환경에 더 강력한 형태의 ID 및 인증을 가져올 기회가 많이 있다고 생각합니다. 차 안에서 또는 사무실 환경에서 말하는 경우 차량 내부의 스마트 스피커도 마찬가지입니다. 이것으로. 적절한 보안, 신원 및 신뢰를 제공할 수 있다는 가정 하에 비즈니스 정보에 액세스할 수 있는 기회가 있습니다.
Small Business Trends : 내가 생각하고 많은 사람들이 생각하고 있는 것 중 하나는 영업사원과 같은 사람들이 CRM을 더 많이 사용하도록 하는 방법입니다. 목소리는 그것에 대해 분명한 것 같습니다. 그러나 개인 정보 보호 및 보안의 관점에서 영업 사원과 비즈니스 엔터프라이즈 애플리케이션을 사용하는 사람들이 올바른 사람이 애플리케이션을 사용하고 데이터를 입력하고 데이터에 액세스하는지 확인하려면 어떻게 해야 할까요? 음성 생체 인식 관점에서 기업이 편안하게 느낄 수 있도록 하려면 어떻게 해야 할까요?
Chris Halaschek : 음성 지원 장치가 있는 회의실에 들어가려고 하는 경우에도 마찬가지입니다. CRM 관련 일부 계정과 관련된 데이터가 있으므로 해당 정보에 실제로 액세스할 수 있는 권한이 있는 공유 장치인지 확인해야 합니다. 우리가 보는 기회, 그리고 다시 한 번 우리는 역사적으로 사기 탐지 및 인증 솔루션을 모두 갖춘 콜 센터에 집중해 왔습니다. 우리가 거기에 접근한 방식은 다른 음성 채널에서도 접근할 수 있는 유사한 방식이라고 생각합니다.
Chris Halaschek : 오늘날 우리가 콜센터에서 하는 일을 보면, 다시 말하지만 이것이 다른 채널인 Brent 와도 병행할 것이라고 생각합니다. 음성 채널. 일반적으로 수행되는 방식은 지식 기반 인증 질문이라는 것을 사용하는 것입니다. 일반적으로 인증 또는 보안 용어로 알고 있는 것입니다. 그래서 그것은 제 어머니의 결혼 전 이름, 제 사회보장번호(SSN)의 마지막 4자리, 아마도 핀이나 비밀번호일 것입니다.
다시 말하지만, 우리는 스마트 스피커에서 4자리 핀을 사용하고 있다는 대화의 앞부분에서 언급했습니다. 유사한 유형의 접근 방식이 콜 센터에서 사용되었습니다. 불행한 현실은 그것이 끔찍하게 불안정하다는 것입니다. 이러한 유형의 데이터는 2차 시장 또는 암시장에서 사용할 수 있습니다. 그것이 바로 많은 수의 위반으로 이어졌습니다. 기업 콜센터의 음성 채널은 해당 채널의 음성 사기 손실 측면에서 오늘날 사실상 140억 달러 문제로 이어지는 것입니다.
우리는 기회를 봅니다. 그리고 Pindrop이 하는 일은 음성 생체 인식 기술을 사용하여 해당 핀과 비밀번호를 사용자의 음성으로 바꾸는 것입니다. 우리는 그러한 유형의 음성 상호 작용에서 실제로 활성화된 장치를 매우 독특하고 정확하게 식별하는 기술을 보유하고 있습니다. 그래서 우리는 마찰 없이 올바른 음성, 올바른 장치, 올바른 행동을 확인할 수 있는 기술을 보유하고 있습니다.
스마트 스피커와 제가 회의실 중 한 곳에 들어가서 음성 지원 장치 중 하나와 상호 작용하는 것과 같은 것을 보면 동일한 음성 생체 인식 기술을 사용하여 내가 올바른 스피커인지 확인할 수 있는 엄청난 기회가 있습니다. 그 특정 거래에서. Salesforce를 사용하고 "이봐, Salesforce 또는 Hey Einstein, X, Y, Z 기회에 대한 최신 상태를 알려주세요."라고 말하면 내가 확인된 연사이기 때문에 나에게만 제공될 것입니다. 해당 정보에 액세스할 수 있습니다.
소규모 비즈니스 동향 : 이제 음성이 진짜인지 아닌지 또는 유기적이거나 유기적이지 않다는 것을 사용자에게 경고하는 작업도 수행합니다. 그것에 대해 조금 이야기하십시오.
Chris Halaschek : 음성 식별 및 음성 생체 인식 기술을 보고 있다면 존재하고 해당 유형의 인증 자격 증명을 사용하는 다양한 위협 벡터에 탄력적이어야 한다는 것을 알고 있습니다. 현실은 나쁜 행위자가 매우 영리하며 이러한 유형의 방어를 우회하기 위해 많은 노력을 기울이고 있다는 것입니다. 따라서 음성 생체 인식을 살펴보면 악의적인 사용자가 시도할 다양한 음성 스푸핑 공격 벡터가 있습니다. 어떤 유형의 상호 작용을 수행하는 것을 실제로 녹음한 재생 공격과 같은 것입니다. 다시 돌아가서 이러한 유형의 시스템 또는 데이터에 액세스하기 위해 해당 녹음을 활용하려고 합니다.