Chris Halaschek di Pindrop: mentre gli altoparlanti intelligenti aumentano di popolarità, il parlato sintetico e la sintesi vocale è qualcosa per cui dobbiamo essere pronti

Pubblicato: 2019-01-12

L'enorme Consumer Electronics Show (CES) annuale si sta concludendo oggi e sembra che per il secondo anno consecutivo i dispositivi intelligenti con assistenti vocali come Alexa di Amazon e Google's Assistant siano stati i discorsi dello spettacolo... gioco di parole. Con Amazon che ha recentemente annunciato di aver venduto oltre 100 milioni di dispositivi Echo e gli analisti stimano che Google abbia venduto circa la metà di quella quantità di dispositivi Google Home, è facile vedere che ci stiamo abituando abbastanza a interagire con i dispositivi intelligenti. Ma affinché le persone si sentano abbastanza a proprio agio da utilizzare questi dispositivi per gestire determinati tipi di interazioni e servizi più sensibili, sia a livello personale che professionale, avranno bisogno di una sicurezza ancora migliore per proteggere i propri dati da malintenzionati là fuori.

Chris Halaschek, vicepresidente dell'IoT presso Pindrop , un'azienda pioniera nella prevenzione e autenticazione delle frodi vocali, mi ha invitato nella sede dell'azienda con sede ad Atlanta per parlare di dove siamo oggi con la sicurezza per questo tipo di dispositivi e cosa si può fare per rendere più sicuro l'uso dei dispositivi più diffusi per fare più cose.

Di seguito è riportata una trascrizione modificata della nostra conversazione. Per vedere l'intera intervista e per vedere una demo di come l'identificazione vocale può impedire a persone diverse da te di chiedere ad Alexa le tue informazioni bancarie, guarda il video qui sotto o fai clic sul lettore SoundCloud incorporato.

Con l'aumento dell'uso degli altoparlanti intelligenti, aumentano anche le preoccupazioni per la sicurezza dell'assistente vocale

Tendenze per le piccole imprese : Ok, ehi, questa è Tendenze per le piccole imprese e sono seduto al quartier generale di Pindrop, e questa è un'azienda davvero interessante qui ad Atlanta. Spesso vorrei poter fare di più ad Atlanta. Questa azienda sta facendo alcune cose davvero interessanti su voce e biometria. Sono seduto qui con Chris Halaschek. Chris, grazie per esserti unito a me oggi.

Chris Halaschek : Sì, lo apprezzo Brent. Grazie per essere entrato.

Tendenze per le piccole imprese : Allora dimmi un po' di te e anche un po' di Pindrop, cosa fate qui.

Chris Halaschek : Sono nativo di Atlanta. Sono cresciuto ad Atlanta e poi mi sono trasferito a nord, all'Università del Maryland, dove ho conseguito il dottorato di ricerca in Informatica. Ho trascorso un po' di tempo nella zona di Washington. Poi mi sono diretto verso la costa occidentale e ho approfondito la tecnologia. Sono stato CTO per una manciata di aziende tecnologiche in fase iniziale. Ho passato tutto il mio tempo a creare prodotti, a portarli sul mercato e poi a far crescere e ridimensionare quelle attività.

Sono stato a Pindrop negli ultimi tre anni e mezzo circa. Il nostro obiettivo è sempre stato quello di portare identità, sicurezza e fiducia in tempo reale a tutte le interazioni vocali. In genere ci siamo concentrati sul call center aziendale, che è principalmente il luogo in cui è stata la voce, ma penso che apprezzerai che la voce ora si sta spostando ben oltre il canale telefonico verso dispositivi interessanti come altoparlanti intelligenti, automobili e così via.

Tendenze per le piccole imprese : quando si tratta di questi nuovi dispositivi, di questi altoparlanti intelligenti con assistenti vocali, qual è lo stato attuale della sicurezza e dove deve andare per essere adottati a un livello ancora più alto del nostro? rivedendo oggi?

Chris Halaschek : Sì. È una buona domanda. È quello che dobbiamo chiedere, Brent. Questo è uno dei motivi per cui ero così interessato a questa conversazione perché la sicurezza è di solito un ripensamento. Siamo a un punto in cui i tipi di interazioni che saranno in qualche modo realizzabili con questi tipi di dispositivi, saranno molto più ricchi e inizieranno a esporre dati molto più sensibili. Non sarà solo ascoltare musica o accendere le luci.

Quindi lo stato dell'arte in questo momento è probabilmente il caso migliore, se stiamo parlando solo di altoparlanti intelligenti, sta usando un pin parlato a quattro cifre. Penso che probabilmente qualcuno di noi apprezzerà il fatto che pronunciare la password ad alta voce non sia davvero consigliabile. Quindi penso che ci siano molte opportunità per portare forme più forti di identità e autenticazione a questi vari tipi di ambienti vocali, che si tratti di nuovo di un altoparlante intelligente all'interno di un veicolo se stai parlando all'interno della tua auto, o anche nell'ambiente dell'ufficio come come questo. C'è l'opportunità di accedere alle informazioni aziendali presupponendo che tu possa portare con sé sicurezza, identità e fiducia adeguate.

Tendenze per le piccole imprese : una delle cose a cui penso ea cui molti di noi stanno pensando, dal tuo punto di vista è come puoi convincere persone come i venditori a utilizzare di più il CRM? La voce sembra una cosa ovvia per questo. Ma dal punto di vista della privacy e della sicurezza, cosa deve accadere affinché i venditori e solo le persone che utilizzano le applicazioni aziendali aziendali possano assicurarsi che la persona giusta le utilizzi, inserisca i dati e acceda ai dati. Cosa deve succedere dal punto di vista della biometria vocale per renderlo qualcosa che le aziende si sentiranno a proprio agio nel fare?

Chris Halaschek : Lo guardo come diciamo anche per me se entrerò in una delle nostre sale conferenze dove abbiamo un dispositivo abilitato alla voce, e diciamo che voglio avere accesso forse ad alcuni dei nostri CRM correlati dati relativi ad alcuni dei nostri account, devo assicurarmi che, poiché si tratta di un dispositivo condiviso, dispongo dell'autorizzazione giusta per accedere effettivamente a tali informazioni. L'opportunità come la vediamo e, ancora una volta, storicamente ci siamo concentrati sul call center con soluzioni di rilevamento e autenticazione delle frodi. Il modo in cui l'abbiamo affrontato lì penso sia un modo simile in cui puoi affrontarlo in questi altri canali vocali.

Chris Halaschek : Se guardi quello che facciamo oggi nel call center, e, ancora, penso che questo sarà parallelo a questi altri canali, Brent, è che stiamo cercando di sostituire le forme tradizionali di autenticazione di qualcuno che sta parlando in questo canale vocale. Il modo in cui in genere viene fatto è usare qualcosa chiamato domande di autenticazione basate sulla conoscenza. Di solito è qualcosa che conosci nel linguaggio di autenticazione o sicurezza. Quindi è il cognome da nubile di mia madre, le ultime quattro cifre del mio SSN, forse un pin o una password.

Ancora una volta, abbiamo accennato in precedenza nella conversazione sull'utilizzo di pin a quattro cifre negli altoparlanti intelligenti. Tipi simili di approcci sono stati utilizzati nel call center. La sfortunata realtà è che è terribilmente insicuro. Questo tipo di dati è disponibile sui mercati secondari o sui mercati neri. Questo è ciò che ha portato a un gran numero di violazioni. Nel canale vocale nei call center aziendali ciò che porta a quello che oggi è effettivamente un problema di 14 miliardi di dollari in termini di perdita di frode vocale su quel canale.

Vediamo un'opportunità. E quello che fa Pindrop è sostituire quei pin e password con la tua voce, usando la nostra tecnologia di biometria vocale, di cui possiamo parlare in modo più approfondito. Abbiamo la tecnologia per identificare in modo molto univoco e accurato il dispositivo che è effettivamente attivo in quel tipo di interazione vocale. Quindi abbiamo tecnologie che ci consentono di verificare senza attriti la voce giusta, il dispositivo giusto, il comportamento giusto.

Se guardi cose come altoparlanti intelligenti e io che entriamo forse in una delle nostre sale conferenze e interagiamo con uno dei dispositivi abilitati alla voce lì, vediamo un'enorme opportunità nell'utilizzare la stessa tecnologia di biometria vocale per assicurarci di essere l'oratore giusto in quella particolare transazione. Supponiamo di utilizzare Salesforce e dire "Ehi, Salesforce o Ehi Einstein, fammi sapere lo stato più recente sull'opportunità X, Y, Z", me lo darà solo perché sono stato l'oratore identificato e io avere accesso a tali informazioni.

Tendenze per le piccole imprese : ora fai anche cose per avvisare l'utente che la voce è autentica o non autentica, organica o non organica. Parlane un po'.

Chris Halaschek : Se stai esaminando l'identità vocale e la tecnologia di biometria vocale, sai che devi essere resiliente ai vari vettori di minacce esistenti e che stanno utilizzando quel tipo di credenziali di autenticazione. La realtà è che i cattivi attori sono molto intelligenti e fanno di tutto per superare questo tipo di difese. Quindi, se stai guardando la biometria vocale, hai una varietà di diversi vettori di attacco di spoofing vocale che i cattivi attori proveranno. Sono cose come gli attacchi di riproduzione in cui ottengono effettivamente una registrazione di te mentre fai un qualche tipo di interazione, e tornano indietro e cercano di sfruttare quella registrazione per ottenere l'accesso a questo tipo di sistema o dati.


Altri vettori di attacco più uniti sono qualcosa chiamato generazione del parlato sintetico o sintesi vocale. Non so se hai visto forse la demo di Google Duplex alla recente conferenza di Google I/O.

Tendenze per le piccole imprese : Sì. L'ho visto ed ero tra le persone che dicevano: "Whoa, okay. Questo è interessante."

Chris Halaschek : Davvero fantastico e allo stesso tempo un po' spaventoso, giusto?

Tendenze per le piccole imprese : Sì.

Chris Halaschek : Penso che dal punto di vista dell'utente finale possa aumentare molte efficienze, ma in qualche modo mostra dove puoi andare con la generazione del parlato sintetico perché il bot dall'altra parte, è stato tutto fatto in tempo reale con il linguaggio sintetico . Abbiamo alcune demo, e sono felice di mostrartene alcune oggi, che mostrano quanto puoi fare con solo un paio di minuti di audio che estraiamo, diciamo, da qualcosa come YouTube. Il nostro team di ricerca ha creato internamente il nostro motore di sintesi vocale principalmente per mostrare le realtà di questo tipo di minaccia e perché è necessario proteggersi da essa.

Vediamo cose come la distorsione della voce. Vediamo le cose, la voce si trasforma. Avrai un cattivo attore che cerca di compromettere il conto in banca di qualcuno, e lui sa che forse è un account femminile o maschile, quindi regolerà il tono della sua voce in modo da sembrare un maschio o una femmina.

Tendenze per le piccole imprese : Sì.

Chris Halaschek : Quindi il discorso sintetico e la sintesi vocale è qualcosa per cui dobbiamo essere pronti.

Tendenze per le piccole imprese : quando si pensa alle applicazioni aziendali, alle applicazioni software, alle cose che utilizzano anche gli agenti dei call center, questo diventa davvero fondamentale per superare quel problema di sicurezza di cui le persone sono legittimamente preoccupate.

Chris Halaschek : Esatto. Se guardi sentire una voce mentre esce dal canale telefonico – più verso questi altoparlanti intelligenti che ti danno accesso a cose come aprire le porte di casa tua, che ora è un po' là fuori – devi pensare a questi tipi di minacce e protezione contro di esse.

Tendenze per le piccole imprese : a che punto siamo attualmente rispetto alla maturità di tutta questa situazione con questi dispositivi intelligenti e che necessitano di sicurezza?

Chris Halaschek: Penso che siamo ancora in anticipo, il che è positivo, e all'inizio, nel senso che stiamo solo grattando la superficie sui tipi di interazioni che abbiamo con questi dispositivi. Un altro motivo per cui penso che sia positivo è perché le persone stanno iniziando a pensare al futuro. Abbiamo parlato con alcuni dei nostri clienti aziendali e nel 2019 stanno cercando di far emergere le competenze vocali sulle varie piattaforme. Vogliono portare esperienze più ricche a quei canali e ambienti particolari, ma devono farlo in modo sicuro modo.

Ora, dal punto di vista tecnologico, penso che la tecnologia sia lì. Dobbiamo solo portarlo là fuori ed essere premurosi su come applicarlo. Voglio dire, mentre guardo al prossimo anno penso che vedrai sempre più aziende portare questo tipo di esperienze in questi canali. Penso che continueremo a fare cose piuttosto semplici. Poiché alcune delle soluzioni relative alla sicurezza e all'identità vengono immesse sul mercato in questi canali, inizieremo a esporre casi d'uso molto più interessanti nei dati, se ciò ha senso.

Tendenze per le piccole imprese : in che modo l'adozione dei dispositivi intelligenti da parte dei consumatori influisce su ciò che accade nell'azienda? Sappiamo tutti che siamo tutti consumatori. Portiamo le cose in casa nostra. Iniziamo ad usarli. Diventano davvero convenienti. Poi iniziamo a pensare: "Oh, diamine, perché il modo in cui usiamo l'impresa non può essere conveniente come quello che facciamo a casa?"

Chris Halaschek : Penso che vediamo una confusione tra consumatore e impresa. Penso che la realtà sia che tutti ci aspettiamo esperienze coinvolgenti per i clienti sia dal punto di vista aziendale che dal punto di vista del consumatore perché alla fine della giornata, hai ragione, siamo tutti consumatori. Penso che se sei un'azienda di software aziendale devi comunque offrire esperienze utente piacevoli anche ai tuoi consumatori aziendali. Questa è solo la mia filosofia. Penso che la marea sia cambiata qualche tempo fa. È davvero una questione di guardare quelle applicazioni aziendali e i dati che vengono esposti per quei tipi di applicazioni in molti casi possono essere visti come molto più sensibili.

Gran parte dell'uso domestico di questi assistenti vocali è ancora un po' basilare, ma inizia a tendere a cose come i pagamenti e la gestione, cose relative ai pagamenti o agli acquisti. Quindi inizierai ad arrivare a casi d'uso più sensibili. Abbiamo anche immaginato dove cose come il trading finanziario … Per me, come consumatore al dettaglio che potrebbe voler fare cose come il trading di azioni usando un assistente vocale, pensiamo che inizieranno a venire sul mercato.

Si tratta davvero della sensibilità dei dati. Penso che in genere sul lato aziendale ci siano team di sicurezza che stanno valutando come esporre e bloccare tali informazioni, mentre sul lato dei consumatori penso che almeno abbiamo iniziato nell'altoparlante intelligente o in alcuni di questi spazi dell'assistente vocale . È nei confini della tua stessa casa, un po' più di uno scenario di fiducia. Ma mentre porti lì transazioni più ricche, ovviamente dovrai disporre di forti forme di autenticazione e identità.

Questo fa parte della serie di interviste One-to-One con leader di pensiero. La trascrizione è stata modificata per la pubblicazione. Se si tratta di un'intervista audio o video, fai clic sul player incorporato in alto o iscriviti tramite iTunes o tramite Stitcher.