Chris Halaschek da Pindrop: À medida que os alto-falantes inteligentes aumentam em popularidade, a fala sintética e a síntese de voz são algo para o qual precisamos estar prontos

Publicados: 2019-01-12

A enorme Consumer Electronics Show (CES) anual está terminando hoje, e parece que pelo segundo ano consecutivo dispositivos inteligentes com assistentes de voz como Alexa da Amazon e Assistente do Google foram o assunto do show… trocadilhos. Com a Amazon anunciando recentemente que vendeu mais de 100 milhões de dispositivos Echo e os analistas estimam que o Google vendeu cerca de metade dessa quantidade de dispositivos Google Home, é fácil ver que estamos nos acostumando a interagir com dispositivos inteligentes. Mas, para que as pessoas se sintam confortáveis ​​o suficiente para usar esses dispositivos para lidar com certos tipos de interações e serviços mais confidenciais – tanto pessoal quanto profissionalmente – elas precisarão de segurança ainda melhor para proteger seus dados de agentes mal-intencionados por aí.

Chris Halaschek, vice-presidente de IoT da Pindrop , uma empresa pioneira em prevenção e autenticação de fraudes de voz, me convidou para a sede da empresa em Atlanta para falar sobre onde estamos hoje com segurança para esses tipos de dispositivos e o que pode ser feito para tornar mais seguro usar os dispositivos populares para fazer mais coisas.

Abaixo está uma transcrição editada da nossa conversa. Para ver toda a entrevista – e para ver uma demonstração de como a identificação por voz pode impedir que pessoas que não são você peçam ao Alexa suas informações bancárias, confira o vídeo abaixo ou clique no player incorporado do SoundCloud.

À medida que o uso de alto-falante inteligente aumenta, as preocupações de segurança do assistente de voz também aumentam

Small Business Trends : Ok, ei, esta é a Small Business Trends, e estou sentado na sede da Pindrop, e esta é uma empresa muito legal aqui em Atlanta. Freqüentemente eu gostaria de poder fazer mais em Atlanta. Esta empresa está fazendo algumas coisas realmente interessantes em torno de voz e biometria. Estou sentado aqui com Chris Halaschek. Chris, obrigado por se juntar a mim hoje.

Chris Halaschek : Sim, eu agradeço Brent. Obrigado por entrar.

Small Business Trends : Então me fale um pouco sobre você e também um pouco sobre Pindrop, o que vocês fazem aqui.

Chris Halaschek : Eu sou um nativo de Atlanta. Cresci em Atlanta e depois me mudei para o norte para a Universidade de Maryland, onde fiz meu doutorado em Ciência da Computação. Passei algum tempo na área de DC. Fui então para a Costa Oeste e mergulhei na tecnologia. Fui CTO de um punhado de empresas de tecnologia em estágio inicial. Passei todo o meu tempo construindo produtos, trazendo esses produtos para o mercado e, em seguida, crescendo e escalando esses negócios.

Estou na Pindrop há cerca de três anos e meio. Nosso foco sempre foi trazer identidade, segurança e confiança em tempo real para todas as interações de voz. Normalmente focamos no call center corporativo, que é predominantemente onde a voz esteve, mas acho que você apreciará que a voz agora está se movendo muito além do canal telefônico para dispositivos interessantes como alto-falantes inteligentes, automotivos e assim por diante.

Tendências para pequenas empresas : Quando se trata desses novos dispositivos, esses alto-falantes inteligentes que possuem assistentes de voz, qual é o estado atual de segurança e onde é necessário ir para que seja adotado em um nível ainda mais alto do que nós ' está vendo hoje?

Chris Halaschek : Sim. É uma boa pergunta. É algo que precisamos perguntar, Brent. Essa é uma das razões pelas quais eu estava tão interessado em ter essa conversa, porque a segurança geralmente é uma reflexão tardia. Estamos em um ponto em que os tipos de interações que serão meio alcançáveis ​​com esses tipos de dispositivos serão muito mais ricos e começarão a expor dados muito mais confidenciais. Não será apenas ouvir música ou acender as luzes.

Portanto, o estado da arte agora é provavelmente o melhor caso, se estamos falando apenas de alto-falantes inteligentes, usando um pino falado de quatro dígitos. Acho que qualquer um de nós provavelmente apreciará que dizer sua senha em voz alta não é realmente aconselhável. Então, acho que há muitas oportunidades para trazer formas mais fortes de identidade e autenticação para esses vários tipos de ambientes de voz, seja um alto-falante inteligente dentro de um veículo, se você estiver falando dentro de seu carro, ou mesmo no escritório, como como este. Há a oportunidade de obter acesso a informações comerciais, supondo que você possa trazer segurança, identidade e confiança adequadas.

Tendências para Pequenas Empresas : Uma das coisas que penso e que muitos de nós estamos pensando, de sua própria perspectiva é como você consegue que pessoas como vendedores usem mais o CRM? A voz parece uma coisa óbvia para isso. Mas, do ponto de vista da privacidade e da segurança, o que precisa acontecer para que os vendedores e apenas as pessoas que usam aplicativos corporativos de negócios tenham certeza de que a pessoa certa está usando e inserindo os dados e acessando os dados. O que precisa acontecer do ponto de vista da biometria de voz para torná-la algo que as empresas vão se sentir à vontade para fazer?

Chris Halaschek : Eu vejo isso como, digamos, mesmo para mim, se eu entrar em uma de nossas salas de conferência onde temos um dispositivo habilitado para voz, e digamos que eu queira ter acesso a talvez alguns de nossos CRMs relacionados dados relacionados a algumas de nossas contas, preciso ter certeza de que, por ser um dispositivo compartilhado, tenho a autorização certa para acessar essas informações. A oportunidade como a vemos e, mais uma vez, focamos historicamente no call center com soluções de detecção de fraude e autenticação. A maneira como abordamos isso lá, acho que é uma maneira semelhante de abordá-lo nesses outros canais de voz.

Chris Halaschek : Se você olhar para o que fazemos no call center hoje, e, novamente, acho que isso será paralelo a esses outros canais, Brent, é que estamos tentando substituir as formas tradicionais de autenticação de alguém que está falando neste canal de voz. A maneira como isso é feito normalmente é usando algo chamado perguntas de autenticação baseadas em conhecimento. Geralmente é na linguagem de autenticação ou segurança algo que você conhece. Então é o nome de solteira da minha mãe, meus últimos quatro dígitos do meu SSN, talvez um alfinete ou uma senha.

Novamente, mencionamos anteriormente na conversa sobre o uso de pinos de quatro dígitos em alto-falantes inteligentes. Tipos semelhantes de abordagens têm sido usados ​​no call center. A triste realidade é que isso é terrivelmente inseguro. Este tipo de dados está disponível em mercados secundários ou mercados negros. Isso é o que levou a um grande número de violações. No canal de voz nos call centers corporativos, isso leva ao que é efetivamente hoje um problema de 14 bilhões de dólares em termos de perda de fraude de voz nesse canal.

Vemos uma oportunidade. E o que o Pindrop faz é substituir esses pins e senhas por sua voz, usando nossa tecnologia de biometria de voz, sobre a qual podemos falar com mais profundidade. Temos tecnologia para identificar de forma única e precisa o dispositivo que está realmente ativo nesse tipo de interação por voz. Portanto, temos tecnologias que nos permitem verificar sem atritos a voz certa, o dispositivo certo, o comportamento certo.

Se você olhar para coisas como alto-falantes inteligentes e eu entrando em talvez uma de nossas salas de conferência e interagindo com um dos dispositivos habilitados para voz lá, vemos uma grande oportunidade em usar a mesma tecnologia de biometria de voz para garantir que eu seja o orador certo nessa transação específica. Digamos que usemos o Salesforce e digamos "Ei, Salesforce ou Ei Einstein, deixe-me saber o status mais recente da oportunidade X, Y, Z", ele só me dará porque fui o orador identificado e ter acesso a essas informações.

Tendências para pequenas empresas : agora você também faz coisas para alertar o usuário de que a voz é autêntica ou não autêntica, orgânica ou não orgânica. Fale um pouco sobre isso.

Chris Halaschek : Se você está analisando a identidade de voz e a tecnologia de biometria de voz, sabe que precisa ser resiliente aos vários vetores de ameaças existentes e que estão usando esse tipo de credencial de autenticação. A realidade é que os maus atores são muito espertos e fazem de tudo para superar esses tipos de defesas. Portanto, se você estiver analisando a biometria de voz, terá uma variedade de diferentes vetores de ataque de falsificação de voz que os maus atores tentarão. São coisas como ataques de repetição em que eles realmente obtêm uma gravação de você fazendo algum tipo de interação, e eles voltam e tentam aproveitar essa gravação para obter acesso a esse tipo de sistema ou dados.


Outros vetores de ataque mais mesclados são algo chamado geração de fala sintética ou síntese de voz. Não sei se você viu talvez a demonstração do Google Duplex na recente conferência do Google I/O.

Tendências para pequenas empresas : Sim. Eu vi e estava entre as pessoas que estavam tipo, “Uau, tudo bem. Isto é interessante."

Chris Halaschek : Muito legal e ao mesmo tempo um pouco assustador, certo?

Tendências para pequenas empresas : Sim.

Chris Halaschek : Eu acho que do ponto de vista do usuário final, isso pode gerar muitas eficiências, mas meio que mostra onde você pode ir com a geração de fala sintética porque o bot do outro lado, tudo isso foi feito em tempo real com fala sintética . Temos algumas demos, e estou feliz em mostrar algumas delas hoje, que mostram o quanto você pode fazer com apenas alguns minutos de áudio que extraímos, digamos, de algo como o YouTube. Nossa equipe de pesquisa construiu internamente nosso próprio mecanismo de síntese de voz principalmente para mostrar as realidades desse tipo de ameaça e por que você precisa se proteger contra ela.

Vemos coisas como distorção de voz. Nós vemos coisas, voz se transformando. Você terá um ator ruim tentando comprometer a conta bancária de alguém, e eles sabem que talvez seja uma conta feminina ou masculina, então eles ajustarão o tom de sua voz para que soem como um homem ou uma mulher.

Tendências para pequenas empresas : Sim.

Chris Halaschek : Então, fala sintética e síntese de voz é algo que está por vir para o qual temos que estar prontos.

Tendências para pequenas empresas : quando você pensa em aplicativos corporativos, aplicativos de software, coisas que até mesmo os agentes de call center estão usando – isso se torna realmente crítico para superar esse problema de segurança com o qual as pessoas estão legitimamente preocupadas.

Chris Halaschek : Isso é exatamente certo. Se você ouvir uma voz à medida que ela sai do canal telefônico - mais para esses alto-falantes inteligentes, dando acesso a coisas como destrancar portas em sua casa, que agora está meio que lá fora - você deve estar pensando sobre isso tipos de ameaças e proteção contra elas.

Tendências para Pequenas Empresas : Onde estamos atualmente na maturidade de toda essa situação com esses dispositivos inteligentes e precisando de segurança?

Chris Halaschek: Acho que ainda estamos no início, o que é bom, e no início no sentido de que estamos apenas arranhando a superfície sobre os tipos de interações que temos com esses dispositivos. Outra razão pela qual eu acho isso bom é porque as pessoas estão começando a pensar no futuro. Conversamos com alguns de nossos clientes corporativos e eles estão pensando em trazer habilidades de voz para as várias plataformas em 2019. Eles querem trazer experiências mais ricas para esses canais e ambientes específicos, mas precisam fazê-lo em um ambiente seguro caminho.

Agora, do ponto de vista da tecnologia, acho que a tecnologia está lá. Nós apenas temos que divulgá-lo e ser cuidadosos sobre como você o aplica. Quero dizer, ao olhar para o próximo ano, acho que você verá mais e mais empresas trazendo esses tipos de experiências para esses canais. Acho que ainda vamos fazer coisas bem básicas. À medida que algumas das soluções relacionadas à segurança e identidade chegam ao mercado nesses canais, começaremos a expor casos de uso muito mais interessantes em dados, se isso fizer sentido.

Tendências para pequenas empresas : como a adoção de dispositivos inteligentes pelo consumidor afeta o que acontece na empresa? Todos sabemos que todos somos consumidores. Trazemos coisas para dentro de casa. Começamos a usá-los. Eles se tornam muito convenientes. Então começamos a pensar: “Oh, Deus, por que a maneira como usamos a empresa não pode ser tão conveniente quanto o que fazemos em casa?”

Chris Halaschek : Acho que vemos uma confusão entre consumidor e empresa. Acho que a realidade é que todos esperamos experiências atraentes para os clientes, tanto do ponto de vista da empresa quanto do consumidor, porque, no final das contas, você está certo, somos todos consumidores. Acho que, se você é uma empresa de software empresarial, ainda precisa trazer experiências de usuário agradáveis, mesmo para seus consumidores de negócios. Essa é apenas a minha filosofia. Acho que essa maré meio que mudou um tempo atrás. É realmente uma questão de observar esses aplicativos de negócios, e os dados expostos para esses tipos de aplicativos em muitos casos podem ser vistos como muito mais confidenciais.

Muito do uso doméstico desses assistentes de voz ainda é meio básico, mas está começando a se tornar algo como pagamentos e gerenciamento, coisas relacionadas a pagamentos ou compras. Então você vai começar a chegar a casos de uso mais sensíveis. Também imaginamos coisas como negociação financeira... Para mim, como consumidor de varejo que pode querer fazer coisas como negociar ações usando um assistente de voz, achamos que elas começarão a chegar ao mercado.

É realmente sobre a sensibilidade dos dados. Acho que normalmente no lado comercial você tem equipes de segurança que estão avaliando como você vai expor e bloquear essas informações, enquanto no lado do consumidor acho que pelo menos começamos no alto-falante inteligente ou em alguns desses espaços de assistente de voz . Está nos limites da sua própria casa, um cenário um pouco mais confiável. Mas à medida que você traz transações mais ricas para lá, obviamente você terá que ter formas fortes de autenticação e identidade.

Isso faz parte da série de entrevistas individuais com líderes de pensamento. A transcrição foi editada para publicação. Se for uma entrevista em áudio ou vídeo, clique no player incorporado acima ou assine via iTunes ou via Stitcher.