Pindrop'tan Chris Halaschek: Akıllı Konuşmacıların Popülaritesi Yükselirken, Sentetik Konuşma ve Ses Sentezi Hazır Olmamız Gereken Bir Şey

Yayınlanan: 2019-01-12

Yıllık devasa Tüketici Elektroniği Fuarı (CES) bugün sona eriyor ve görünüşe göre Amazon'un Alexa'sı ve Google'ın Asistanı gibi sesli asistanlara sahip akıllı cihazlar arka arkaya ikinci yıl için şovun konuşmasıydı… kelime oyunu. Amazon'un yakın zamanda 100 milyondan fazla Echo cihazı sattığını duyurması ve analistlerin Google'ın bu miktarın yaklaşık yarısını Google Home cihazı sattığını söylemesiyle birlikte, akıllı cihazlarla etkileşime oldukça alıştığımızı görmek kolay. Ancak, insanların hem kişisel hem de profesyonel olarak belirli türdeki daha hassas etkileşimleri ve hizmetleri idare etmek için bu cihazları kullanacak kadar rahat hissetmeleri için, verilerini kötü aktörlerden korumak için daha da iyi bir güvenliğe ihtiyaçları olacak.

Ses sahtekarlığı önleme ve kimlik doğrulama konusunda öncü bir şirket olan Pindrop'ta IoT başkan yardımcısı Chris Halaschek, bu tür cihazların güvenliği konusunda bugün nerede olduğumuz ve neler yapılabileceği hakkında konuşmak üzere beni şirketin Atlanta merkezli merkezine davet etti. daha fazla şey yapmak için popüler cihazları kullanmayı daha güvenli hale getirmek için.

Aşağıda konuşmamızın düzenlenmiş bir dökümü bulunmaktadır. Röportajın tamamını görmek ve sesli tanımlamanın, siz olmayan kişilerin Alexa'dan banka bilgilerinizi istemesini nasıl engelleyebileceğinin bir demosunu görmek için aşağıdaki videoyu izleyin veya yerleşik SoundCloud oynatıcısına tıklayın.

Akıllı Hoparlör Kullanımı Arttıkça Voice Assistant Güvenlik Endişeleri de Artıyor

Küçük İşletme Eğilimleri : Tamam, hey, bu Küçük İşletme Eğilimleri ve Pindrop'un genel merkezinde oturuyorum ve bu Atlanta'da gerçekten harika bir şirket. Sık sık Atlanta'da daha fazlasını yapabilmeyi isterdim. Bu şirket ses ve biyometri konusunda gerçekten ilginç şeyler yapıyor. Burada Chris Halaschek ile oturuyorum. Chris, bugün bana katıldığın için teşekkür ederim.

Chris Halaschek : Evet, takdir ediyorum Brent. Geldiğin için teşekkürler.

Küçük İşletme Eğilimleri : O halde bana biraz kendinizden ve biraz da Pindrop'tan bahsedin, sizler burada ne yapıyorsunuz.

Chris Halaschek : Ben bir Atlanta yerlisiyim . Atlanta'da büyüdüm ve sonra Kuzey'e, Bilgisayar Bilimleri alanında doktoramı yaptığım University of Maryland'e taşındım. DC bölgesinde biraz zaman geçirdim. Daha sonra Batı Sahili'ne gittim ve teknolojiye girdim. Bir avuç erken aşama teknoloji şirketinin CTO'suydum. Tüm zamanımı ürünler inşa etmek, bu ürünleri pazara sunmak ve ardından bu işletmeleri büyütüp ölçeklendirmek için harcadım.

Yaklaşık üç buçuk yıldır Pindrop'tayım. Odak noktamız her zaman tüm sesli etkileşimlere gerçek zamanlı kimlik, güvenlik ve güven getirmek olmuştur. Genelde sesin ağırlıklı olarak bulunduğu yer olan kurumsal çağrı merkezine odaklandık, ancak sesin artık telefon kanalının çok ötesine geçerek akıllı hoparlörler, otomotiv vb. gibi ilginç cihazlara geçtiğini takdir edeceksiniz.

Küçük İşletme Trendleri : Bu yeni cihazlar söz konusu olduğunda, içinde sesli asistanlar bulunan bu akıllı hoparlörler, mevcut güvenlik durumu nedir ve bizden daha üst düzeyde benimsenmesi için nereye gitmesi gerekiyor' bugün tekrar görüşüyor musun?

Chris Halaschek : Evet. Bu iyi bir soru. Bunu sormamız gerekiyor, Brent. Bu konuşmayı yapmamızla bu kadar ilgilenmemin sebeplerinden biri de buydu çünkü güvenlik genellikle sonradan akla geliyordu. Bu tür cihazlarla bir nevi gerçekleştirilebilecek etkileşim türlerinin çok daha zengin olacağı ve çok daha hassas verileri ifşa etmeye başlayacağı bir noktadayız. Sadece müzik dinlemek ya da ışıklarınızı açmak olmayacak.

Bu nedenle, şu anda en iyi durum muhtemelen en iyi durumdur, eğer sadece akıllı hoparlörlerden bahsediyorsak, konuşulan dört haneli bir pin kullanmaktır. Sanırım herhangi birimiz muhtemelen şifrenizi yüksek sesle söylemenin gerçekten tavsiye edilmediğini takdir edecektir. Bu yüzden, bu çeşitli ses ortamlarına daha güçlü kimlik ve kimlik doğrulama biçimleri getirmek için çok fazla fırsat olduğunu düşünüyorum, yine bir araç içinde konuşuyorsanız, arabanızın içinde veya hatta ofis ortamında konuşuyorsanız akıllı bir hoparlör olsun. bu gibi. Uygun güvenlik, kimlik ve güveni beraberinde getirebileceğinizi varsayarsak, iş bilgilerine erişme fırsatı vardır.

Küçük İşletme Eğilimleri : Kendi bakış açınızdan benim ve çoğumuzun düşündüğü şeylerden biri, satış görevlileri gibi insanları CRM'i daha fazla kullanmaya nasıl ikna edersiniz? Ses bunun için bariz bir şey gibi görünüyor. Ancak gizlilik ve güvenlik açısından, satış görevlilerinin ve sadece kurumsal kurumsal uygulamaları kullanan kişilerin, doğru kişinin onu kullandığından ve verileri girdiğinden ve verilere eriştiğinden emin olması için olması gerekenler. Şirketlerin yaparken rahat hissedeceği bir şey yapmak için sesli biyometri perspektifinden ne olması gerekiyor?

Chris Halaschek : Ses özellikli bir cihaza sahip olduğumuz konferans odalarımızdan birine gireceksem, benim için bile diyelim ki buna bakıyorum ve diyelim ki CRM ile ilgili bazılarımıza erişmek istiyorum. Bazı hesaplarımızla ilgili veriler, paylaşılan bir cihaz olduğu için bu bilgilere gerçekten erişmek için doğru yetkiye sahip olduğumdan emin olmam gerekiyor. Gördüğümüz gibi fırsat ve yine tarihsel olarak hem dolandırıcılık tespiti hem de kimlik doğrulama çözümleri ile çağrı merkezine odaklandık. Oradaki yaklaşımımız, diğer ses kanallarında da buna benzer bir şekilde yaklaşabileceğinizi düşünüyorum.

Chris Halaschek : Bugün çağrı merkezinde ne yaptığımıza bakarsanız ve yine, bunun bu diğer kanallarla paralellik göstereceğini düşünüyorum, Brent, burada konuşan birinin kimliğini doğrulamanın geleneksel biçimlerini değiştirmeye çalışıyoruz. ses kanalı. Bunun tipik olarak yapılma şekli, bilgi tabanlı kimlik doğrulama soruları adı verilen bir şey kullanmaktır. Genellikle kimlik doğrulama veya güvenlik tabiriyle bildiğiniz bir şeydir. Yani annemin kızlık soyadı, SSN'min son dört hanesi, belki bir pin veya şifre.

Yine, daha önce akıllı hoparlörlerde dört haneli pin kullandığımızdan bahsetmiştik. Çağrı merkezinde de benzer yaklaşımlar kullanılmıştır. Talihsiz gerçek şu ki, bu korkunç derecede güvensiz. Bu tür veriler ikincil piyasalarda veya karaborsalarda mevcuttur. Çok sayıda ihlale yol açan şey budur. Kurumsal çağrı merkezlerindeki ses kanalında nelere yol açarsa, o kanalda ses dolandırıcılığı kaybı açısından günümüzde etkin olan 14 milyar dolarlık bir sorundur.

Bir fırsat görüyoruz. Pindrop'un yaptığı ise, daha derinlemesine konuşabileceğimiz ses biyometri teknolojimizi kullanarak bu pinleri ve şifreleri sesinizle değiştirmek. Bu tür sesli etkileşimde gerçekten aktif olan cihazı çok benzersiz ve doğru bir şekilde tanımlayacak teknolojiye sahibiz. Dolayısıyla, doğru sesi, doğru cihazı, doğru davranışı sorunsuz bir şekilde doğrulamamızı sağlayan teknolojilerimiz var.

Akıllı hoparlörler ve benim konferans odalarımızdan birine girmem ve oradaki sesle etkinleştirilen cihazlardan biriyle etkileşim kurmam gibi şeylere bakarsanız, doğru konuşmacı olduğumdan emin olmak için aynı ses biyometri teknolojisini kullanma konusunda büyük bir fırsat görürüz. bu özel işlemde. Salesforce'u kullandığımızı ve "Hey, Salesforce veya Hey Einstein, X, Y, Z fırsatındaki son durumu bana bildirin" dediğimizi varsayalım, bunu bana sadece ben tanımlanmış konuşmacı olduğum için verecek ve ben bu bilgilere erişiminiz var.

Küçük İşletme Eğilimleri : Artık kullanıcıyı sesin gerçek olup olmadığı veya organik olup olmadığı konusunda uyarmak için de bir şeyler yapıyorsunuz. Bunun hakkında biraz konuş.

Chris Halaschek : Ses kimliği ve ses biyometri teknolojisine bakıyorsanız, var olan ve bu tür kimlik doğrulama bilgilerini kullanan çeşitli tehdit vektörlerine karşı dirençli olmanız gerektiğini bilirsiniz. Gerçek şu ki, kötü oyuncular çok zekidir ve bu tür savunmaları aşmak için büyük çaba harcarlar. Dolayısıyla, ses biyometrisine bakıyorsanız, kötü oyuncuların deneyeceği çeşitli ses sahteciliği saldırı vektörlerine sahipsiniz. Bu, bir tür etkileşim yaptığınızın bir kaydını aldıkları tekrar saldırıları gibi şeylerdir ve geri dönerler ve bu tür sistem veya verilere erişmek için bu kayıttan yararlanmaya çalışırlar.


Diğer daha fazla birleştirme saldırı vektörleri, sentetik konuşma oluşturma veya ses sentezi olarak adlandırılan bir şeydir. Son Google I/O konferansında belki Google Duplex demosunu gördünüz mü bilmiyorum.

Küçük İşletme Eğilimleri : Evet. Onu gördüm ve "Vay, tamam. Bu ilginç."

Chris Halaschek : Gerçekten harika ve aynı zamanda biraz korkutucu, değil mi?

Küçük İşletme Eğilimleri : Evet.

Chris Halaschek : Bence son kullanıcı açısından çok fazla verimlilik sağlayabilir, ancak diğer uçtaki bot, sentetik konuşma ile gerçek zamanlı olarak yapıldığı için sentetik konuşma oluşturma ile gidebileceğiniz bir yer gösteriyor. . Bazı demolarımız var ve bugün size bunlardan bazılarını göstermekten mutluluk duyuyorum, bu, örneğin YouTube gibi bir yerden aldığımız birkaç dakikalık sesle ne kadar çok şey yapabileceğinizi gösteriyor. Araştırma ekibimiz, esas olarak bu tür bir tehdidin gerçeklerini ve buna karşı neden korunmanız gerektiğini göstermek için dahili olarak kendi ses sentez motorumuzu oluşturdu.

Ses bozulması gibi şeyler görüyoruz. Bir şeyler görüyoruz, ses değişiyor. Birinin banka hesabını tehlikeye atmaya çalışan kötü bir aktörünüz olacak ve bunun belki bir kadın ya da erkek hesabı olduğunu biliyorlar, bu yüzden seslerinin perdesini erkek ya da kadın gibi çıkacak şekilde ayarlayacaklar.

Küçük İşletme Eğilimleri : Evet.

Chris Halaschek : Yani sentetik konuşma ve ses sentezi, hazır olmamız gereken bir şey.

Küçük İşletme Eğilimleri : Kurumsal uygulamaları, yazılım uygulamalarını, hatta çağrı merkezi temsilcilerinin bile kullandığı şeyleri düşündüğünüzde, bu, insanların haklı olarak endişe duyduğu güvenlik sorununu aşmak için gerçekten kritik hale geliyor.

Chris Halaschek : Bu kesinlikle doğru. Telefon kanalından gelen bir ses duymaya bakarsanız – daha çok evinizdeki kapıların kilidini açmak gibi şeylere erişmenizi sağlayan bu akıllı hoparlörlere bakarsanız, ki bu artık bir nevi dışarıdadır – bunları düşünmeniz gerekir. tehdit türleri ve bunlara karşı koruma.

Küçük İşletme Eğilimleri : Şu anda bu akıllı cihazlar ve güvenliğe ihtiyaç duyan tüm bu durumun olgunluğunun neresindeyiz?

Chris Halaschek: Bence hala erken, bu iyi ve bence erken, bu cihazlarla sahip olduğumuz etkileşim türleri hakkında sadece yüzeyi kazıdığımızı düşünüyorum. Bunun iyi olduğunu düşünmemin bir başka nedeni de insanların ileriyi düşünmeye başlaması. Kurumsal müşterilerimizden bazılarıyla konuştuk ve 2019'da çeşitli platformlara ses becerilerini getirmeyi düşünüyorlar. Bu belirli kanallara ve ortamlara daha zengin deneyimler getirmek istiyorlar, ancak bunu güvenli bir ortamda yapmaları gerekiyor. yol.

Şimdi, teknoloji açısından, teknolojinin orada olduğunu düşünüyorum. Sadece onu oradan çıkarmamız ve nasıl uyguladığınız konusunda düşünceli olmamız gerekiyor. Yani, gelecek yıla baktığımda, giderek daha fazla işletmenin bu tür deneyimleri bu kanallara getirdiğini göreceksiniz. Hala oldukça basit şeyler yapacağımızı düşünüyorum. Güvenlik ve kimlikle ilgili çözümlerden bazıları bu kanallarda piyasaya çıktıkça, eğer mantıklıysa, verilerde çok daha ilginç kullanım örnekleri sunmaya başlayacağız.

Küçük İşletme Eğilimleri : Tüketicilerin akıllı cihazları benimsemesi kuruluşta olanları nasıl etkiler? Hepimizin tüketici olduğunu biliyoruz. Eşyaları evimize getiriyoruz. Onları kullanmaya başlıyoruz. Gerçekten uygun hale gelirler. Sonra düşünmeye başlıyoruz, “Aman Tanrım, neden girişim kullanma şeklimiz olmasın… Neden bu evde yaptığımız kadar uygun olmasın?”

Chris Halaschek : Sanırım tüketici ve girişim arasında bir bulanıklık görüyoruz. Bence gerçek şu ki, hepimiz hem kurumsal hem de tüketici açısından zorlayıcı müşteri deneyimleri bekliyoruz çünkü günün sonunda haklısın, hepimiz tüketiciyiz. Bir kurumsal yazılım şirketiyseniz, ticari tüketicilerinize bile keyifli kullanıcı deneyimleri yaşatmanız gerektiğini düşünüyorum. Bu sadece benim felsefem. Sanırım bu gelgit bir süre önce değişti. Bu gerçekten bu iş uygulamalarına bakmakla ilgili bir sorudur ve çoğu durumda bu tür uygulamalar için açığa çıkan veriler çok daha hassas olarak görülebilir.

Bu sesli asistanların evde kullanımının çoğu hala biraz basit, ancak ödemeler ve yönetim, ödemeler veya satın almalarla ilgili şeyler gibi şeylere yönelmeye başlıyor. Böylece daha hassas kullanım durumlarına geçmeye başlayacaksınız. Ayrıca finansal alım satım gibi şeylerin nerede olduğunu da düşündük… Hisse senedi alım satımı gibi şeyleri sesli asistan kullanarak yapmak isteyebilecek bir perakende tüketici olarak, bunların piyasaya çıkmaya başlayacağını düşünüyoruz.

Bu gerçekten verilerin hassasiyeti ile ilgili. Bence tipik olarak iş tarafında, bu bilgiyi nasıl açığa çıkaracağınızı ve kilitleyeceğinizi değerlendiren güvenlik ekipleriniz var, tüketici tarafında ise en azından akıllı hoparlörde veya bu sesli asistan alanlarından bazılarında başladık. . Kendi evinizin sınırları içinde, biraz daha güvenilir bir senaryo. Ancak oraya daha zengin işlemler getirdiğinizde, açıkçası güçlü kimlik doğrulama ve kimlik biçimlerine sahip olmanız gerekecek.

Bu, düşünce liderleriyle Bire Bir Röportaj serisinin bir parçasıdır. Transkript yayın için düzenlenmiştir. Sesli veya görüntülü bir röportajsa, yukarıdaki gömülü oynatıcıya tıklayın veya iTunes veya Stitcher aracılığıyla abone olun.