Chris Halaschek de Pindrop: A medida que los parlantes inteligentes aumentan en popularidad, el habla sintética y la síntesis de voz son algo para lo que debemos estar preparados

Publicado: 2019-01-12

El gran Consumer Electronics Show (CES) anual está terminando hoy, y parece que por segundo año consecutivo los dispositivos inteligentes con asistentes de voz como Alexa de Amazon y el Asistente de Google fueron la comidilla del espectáculo... juego de palabras intencionado. Con Amazon anunciando recientemente que han vendido más de 100 millones de dispositivos Echo, y los analistas estiman que Google ha vendido aproximadamente la mitad de esa cantidad de dispositivos Google Home, es fácil ver que nos estamos acostumbrando bastante a interactuar con dispositivos inteligentes. Pero para que las personas se sientan lo suficientemente cómodas para usar estos dispositivos para manejar ciertos tipos de interacciones y servicios más sensibles, tanto personal como profesionalmente, necesitarán una seguridad aún mejor para proteger sus datos de los malos actores.

Chris Halaschek, vicepresidente de IoT en Pindrop , una empresa pionera en prevención y autenticación de fraude de voz, me invitó a la sede de la empresa en Atlanta para hablar sobre dónde estamos hoy con la seguridad para este tipo de dispositivos y qué se puede hacer. para que sea más seguro usar los dispositivos populares para hacer más cosas.

A continuación se muestra una transcripción editada de nuestra conversación. Para ver la entrevista completa y ver una demostración de cómo la identificación de voz puede impedir que personas que no son usted le pidan a Alexa su información bancaria, vea el video a continuación o haga clic en el reproductor de SoundCloud incorporado.

A medida que aumenta el uso de altavoces inteligentes, las preocupaciones de seguridad del asistente de voz también aumentan

Small Business Trends : Bien, oye, esto es Small Business Trends, y estoy sentado en la sede de Pindrop, y esta es una empresa realmente genial aquí en Atlanta. Frecuentemente desearía poder hacer más en Atlanta. Esta empresa está haciendo cosas muy interesantes en torno a la voz y la biometría. Estoy sentado aquí con Chris Halaschek. Chris, gracias por acompañarme hoy.

Chris Halaschek : Sí, te lo agradezco Brent. Gracias por entrar

Tendencias de las pequeñas empresas : cuénteme un poco sobre usted y también un poco sobre Pindrop, qué hacen aquí.

Chris Halaschek : Soy nativo de Atlanta. Crecí en Atlanta y luego me mudé al norte a la Universidad de Maryland, donde hice mi doctorado en Ciencias de la Computación. Pasé algún tiempo en el área de DC. Luego me dirigí a la costa oeste y profundicé en la tecnología. Fui CTO para un puñado de empresas de tecnología en etapa inicial. Pasé todo mi tiempo creando productos, llevándolos al mercado y luego creciendo y escalando esos negocios.

He estado en Pindrop ahora durante los últimos tres años y medio más o menos. Nuestro enfoque siempre ha sido brindar identidad, seguridad y confianza en tiempo real a todas las interacciones de voz. Por lo general, nos enfocamos en el centro de llamadas empresarial, que es predominantemente donde ha estado la voz, pero creo que apreciará que la voz ahora se está moviendo mucho más allá del canal telefónico hacia dispositivos interesantes como parlantes inteligentes, automóviles, etc.

Tendencias de las pequeñas empresas : cuando se trata de estos nuevos dispositivos, estos parlantes inteligentes que tienen asistentes de voz, cuál es el estado actual de la seguridad y hacia dónde debe ir para que se adopte a un nivel aún más alto que nosotros. estás viendo hoy?

Chris Halaschek : Sí. Es una buena pregunta. Es algo que debemos preguntar, Brent. Esa es una de las razones por las que estaba tan interesado en que tuviéramos esta conversación porque la seguridad suele ser una idea de último momento. Estamos en un punto en el que los tipos de interacciones que se podrán lograr con este tipo de dispositivos serán mucho más ricos y comenzarán a exponer datos mucho más confidenciales. No se trata solo de escuchar música o encender las luces.

Entonces, lo más avanzado en este momento es probablemente el mejor de los casos, si solo estamos hablando de altavoces inteligentes, es usar un pin hablado de cuatro dígitos. Creo que cualquiera de nosotros probablemente apreciará que decir tu contraseña en voz alta no es realmente recomendable. Por lo tanto, creo que hay muchas oportunidades de brindar formas más sólidas de identidad y autenticación a estos diversos tipos de entornos de voz, ya sea nuevamente un altavoz inteligente dentro de un vehículo si está hablando dentro de su automóvil, o incluso en el entorno de la oficina como como esto Existe la oportunidad de obtener acceso a la información comercial, suponiendo que pueda traer consigo la seguridad, la identidad y la confianza adecuadas.

Tendencias de las pequeñas empresas : una de las cosas en las que pienso y en las que muchos de nosotros estamos pensando, desde su propia perspectiva, es cómo lograr que personas como los vendedores usen más CRM. La voz parece algo obvio para ello. Pero desde el punto de vista de la privacidad y la seguridad, lo que debe suceder para que los vendedores y las personas que usan aplicaciones comerciales se aseguren de que la persona correcta las esté usando, ingresando los datos y accediendo a los datos. ¿Qué tiene que suceder desde la perspectiva de la biometría de voz para que las empresas se sientan cómodas haciéndolo?

Chris Halaschek : Lo veo como, digamos, incluso para mí si voy a entrar en una de nuestras salas de conferencias donde tenemos un dispositivo habilitado para voz, y digamos que quiero tener acceso a quizás algunos de nuestros CRM relacionados datos relacionados con algunas de nuestras cuentas, necesito asegurarme de que, dado que es un dispositivo compartido, tengo la autorización adecuada para acceder a esa información. La oportunidad tal como la vemos y, una vez más, históricamente nos hemos centrado en el centro de llamadas con soluciones de autenticación y detección de fraude. Creo que la forma en que lo hemos abordado allí es similar a la que puede abordar en estos otros canales de voz.

Chris Halaschek : Si miras lo que hacemos hoy en el centro de llamadas y, nuevamente, creo que esto será paralelo a estos otros canales, Brent, es que estamos tratando de reemplazar las formas tradicionales de autenticar a alguien que está hablando en este canal de voz La forma en que eso se hace típicamente es usando algo llamado preguntas de autenticación basadas en el conocimiento. Por lo general, en términos de autenticación o seguridad, es algo que usted sabe. Así que es el apellido de soltera de mi madre, mis últimos cuatro dígitos de mi SSN, tal vez un PIN o una contraseña.

Nuevamente, mencionamos anteriormente en la conversación que estamos usando pines de cuatro dígitos en parlantes inteligentes. Se han utilizado tipos similares de enfoques en el centro de llamadas. La desafortunada realidad es que eso es terriblemente inseguro. Este tipo de datos está disponible en mercados secundarios o mercados negros. Eso es lo que ha llevado a un gran número de infracciones. En el canal de voz en los centros de llamadas empresariales, lo que lleva a lo que hoy es efectivamente un problema de 14 mil millones de dólares en términos de pérdida de fraude de voz en ese canal.

Vemos una oportunidad. Y lo que hace Pindrop es reemplazar esos pines y contraseñas con su voz, utilizando nuestra tecnología de biometría de voz, de la que podemos hablar con más profundidad. Tenemos tecnología para identificar de manera muy única y precisa el dispositivo que está realmente activo en ese tipo de interacción de voz. Así que tenemos tecnologías que nos permiten verificar sin fricciones la voz correcta, el dispositivo correcto, el comportamiento correcto.

Si observa cosas como parlantes inteligentes y yo entrando quizás en una de nuestras salas de conferencias e interactuando con uno de los dispositivos habilitados para voz allí, vemos una gran oportunidad en tomar esa misma tecnología de biometría de voz para asegurarnos de que soy el orador adecuado. en esa transacción en particular. Supongamos que usamos Salesforce y decimos "Oye, Salesforce u Oye Einstein, házmelo saber el estado más reciente de la oportunidad X, Y, Z", solo me lo dará porque he sido el orador identificado, y yo tener acceso a esa información.

Tendencias de las pequeñas empresas : ahora también hace cosas para alertar al usuario de que la voz es auténtica o no auténtica, orgánica o no orgánica. Hable un poco sobre eso.

Chris Halaschek : Si está analizando la identidad de voz y la tecnología de biometría de voz, sabe que debe ser resistente a los diversos vectores de amenazas que existen y que utilizan ese tipo de credencial de autenticación. La realidad es que los malos actores son muy inteligentes y hacen todo lo posible para superar este tipo de defensas. Entonces, si está buscando biometría de voz, tiene una variedad de diferentes vectores de ataque de suplantación de voz que los malos intentarán. Son cosas como ataques de repetición en los que realmente obtienen una grabación de usted haciendo algún tipo de interacción, y vuelven e intentan aprovechar esa grabación para obtener acceso a este tipo de sistema o datos.


Otros vectores de ataque más fusionados son algo llamado generación de voz sintética o síntesis de voz. No sé si viste la demostración de Google Duplex en la reciente conferencia Google I/O.

Tendencias de las pequeñas empresas : sí. Lo vi y estaba entre las personas que decían: “Vaya, está bien. Esto es interesante."

Chris Halaschek : Realmente genial y al mismo tiempo da un poco de miedo, ¿verdad?

Tendencias de las pequeñas empresas : Sí.

Chris Halaschek : Creo que, desde el punto de vista del usuario final, puede impulsar una gran cantidad de eficiencias, pero muestra a dónde se puede llegar con la generación de voz sintética porque el bot del otro extremo se hizo todo en tiempo real con voz sintética. . Tenemos algunas demostraciones, y estoy feliz de mostrarles algunas de ellas hoy, que muestran cuánto puede hacer con solo un par de minutos de audio que extraemos de, digamos, algo como YouTube. Nuestro equipo de investigación ha construido internamente nuestro propio motor de síntesis de voz principalmente para mostrar las realidades de este tipo de amenaza y por qué necesita protegerse contra ella.

Vemos cosas como la distorsión de la voz. Vemos cosas, la voz se transforma. Tendrás a un mal actor tratando de comprometer la cuenta bancaria de alguien, y saben que tal vez sea una cuenta femenina o masculina, por lo que ajustarán el tono de su voz para que suene como un hombre o una mujer.

Tendencias de las pequeñas empresas : Sí.

Chris Halaschek : Así que el habla sintética y la síntesis de voz es algo que está por llegar y para lo que tenemos que estar preparados.

Tendencias de las pequeñas empresas : cuando piensa en las aplicaciones empresariales, las aplicaciones de software, las cosas que incluso los agentes del centro de llamadas están usando, esto se vuelve realmente crítico para superar ese obstáculo de seguridad que preocupa legítimamente a las personas.

Chris Halaschek : Eso es exactamente correcto. Si observa escuchar una voz a medida que sale del canal telefónico, más hacia estos parlantes inteligentes que le brindan acceso a cosas como abrir puertas en su casa, que ahora está ahí fuera, debe estar pensando en estos tipos de amenazas y protección contra ellas.

Tendencias de las pequeñas empresas : ¿Dónde estamos actualmente en cuanto a la madurez de toda esta situación con estos dispositivos inteligentes y la necesidad de seguridad?

Chris Halaschek: Creo que todavía estamos en una etapa temprana, lo cual es bueno, y en una etapa temprana en el sentido de que creo que solo estamos rascando la superficie sobre los tipos de interacciones que tenemos con estos dispositivos. Otra razón por la que creo que es bueno es porque la gente está empezando a pensar en el futuro. Hablamos con algunos de nuestros clientes empresariales y están buscando llevar las habilidades de voz a las diversas plataformas en 2019. Quieren brindar experiencias más ricas a esos canales y entornos particulares, pero deben hacerlo de manera segura. camino.

Ahora, desde el punto de vista de la tecnología, creo que la tecnología está ahí. Solo tenemos que sacarlo a la luz y pensar en cómo lo aplicas. Quiero decir, mientras miro hacia el próximo año, creo que verás más y más empresas traer este tipo de experiencias a estos canales. Creo que todavía vamos a estar haciendo cosas bastante básicas. A medida que algunas de las soluciones relacionadas con la seguridad y la identidad salgan al mercado en estos canales, comenzaremos a exponer casos de uso mucho más interesantes en datos, si eso tiene sentido.

Tendencias de las pequeñas empresas : ¿Cómo afecta la adopción de dispositivos inteligentes por parte de los consumidores a lo que sucede en la empresa? Todos sabemos que todos somos consumidores. Traemos cosas a nuestra casa. Empezamos a usarlos. Se vuelven realmente convenientes. Entonces comenzamos a pensar: "Oh, Dios, ¿por qué la forma en que usamos la empresa no puede ser... ¿Por qué no puede ser tan conveniente como lo que hacemos en casa?"

Chris Halaschek : Creo que vemos una confusión entre consumidor y empresa. Creo que la realidad es que todos esperamos experiencias atractivas para los clientes, tanto desde el punto de vista de la empresa como del consumidor, porque al final del día, tiene razón, todos somos consumidores. Creo que si usted es una empresa de software empresarial, aún debe brindar experiencias de usuario agradables incluso a los consumidores de su empresa. Esa es solo mi filosofía. Creo que esa marea ha cambiado hace un tiempo. Realmente es una cuestión de observar esas aplicaciones comerciales, y los datos que están expuestos para esos tipos de aplicaciones en muchos casos pueden verse como mucho más confidenciales.

Gran parte del uso doméstico de estos asistentes de voz sigue siendo algo básico, pero comienza a tener una tendencia a cosas como pagos y administración, cosas relacionadas con pagos o compras. Entonces, comenzará a llegar a casos de uso más sensibles. También hemos imaginado dónde cosas como el comercio financiero... Para mí, como un consumidor minorista que puede querer hacer cosas como el comercio de acciones con un asistente de voz, creemos que comenzarán a llegar al mercado.

Se trata realmente de la sensibilidad de los datos. Creo que, por lo general, en el lado comercial, tiene equipos de seguridad que evalúan cómo va a exponer y bloquear esa información, mientras que en el lado del consumidor, creo que al menos comenzamos en el altavoz inteligente o algunos de estos espacios de asistente de voz. . Está en los confines de su propia casa, un escenario un poco más confiable. Pero a medida que trae transacciones más ricas allí, obviamente tendrá que tener formas sólidas de autenticación e identidad.

Esto es parte de la serie de entrevistas uno a uno con líderes de opinión. La transcripción ha sido editada para su publicación. Si se trata de una entrevista de audio o video, haga clic en el reproductor integrado de arriba o suscríbase a través de iTunes o Stitcher.