Pindrop 的 Chris Halaschek:随着智能扬声器越来越受欢迎,我们需要为合成语音和语音合成做好准备

已发表: 2019-01-12

盛大的年度消费电子展 (CES) 今天结束了,似乎连续第二年带有语音助手的智能设备,如亚马逊的 Alexa 和谷歌的助手成为了展会的话题……双关语。 随着亚马逊最近宣布他们已经售出超过 1 亿台 Echo 设备,分析师估计谷歌已经售出了大约一半的 Google Home 设备,很容易看出我们已经非常习惯与智能设备交互。 但是,为了让人们感到足够舒适,可以使用这些设备来处理某些更敏感的交互和服务——无论是个人的还是专业的——他们需要更好的安全性来保护他们的数据免受不良行为者的侵害。

语音欺诈预防和身份验证领域的先驱公司Pindrop的物联网副总裁 Chris Halashek邀请我到该公司位于亚特兰大的总部讨论我们今天在此类设备的安全性方面的情况,以及可以做些什么让使用流行设备做更多事情变得更安全。

以下是我们谈话的编辑记录。 要查看整个采访 - 并查看语音识别如何阻止不是您的人向 Alexa 询问您的银行信息的演示,请查看下面的视频或单击嵌入式 SoundCloud 播放器。

随着智能扬声器使用量的增加,语音助手的安全问题也在增加

小企业趋势好的,嘿,这是小企业趋势,我坐在 Pindrop 的总部,这是亚特兰大一家非常酷的公司。 我经常希望我能在亚特兰大做更多的事情。 这家公司正在围绕语音和生物识别技术做一些非常有趣的事情。 我和克里斯·哈拉舍克坐在这里。 克里斯,谢谢你今天加入我。

Chris Halashek :是的,我很欣赏布伦特。 谢谢你进来。

小型企业趋势所以请告诉我一些关于你的信息以及一些关于 Pindrop 的信息,你们在这里做什么。

Chris Halashek :我是亚特兰大本地人。 我在亚特兰大长大,然后向北搬到马里兰大学,在那里我获得了计算机科学博士学位。 我在华盛顿特区呆了一段时间。 然后我前往西海岸并深入研究技术。 我是少数早期科技公司的首席技术官。 我把所有的时间都花在构建产品上,将这些产品推向市场,然后发展和扩展这些业务。

在过去大约三年半左右的时间里,我一直在 Pindrop。 我们的重点一直是为所有语音交互带来实时身份、安全性和信任。 我们通常专注于企业呼叫中心,这主要是语音所在,但我认为您会欣赏语音现在远远超出电话渠道,转向智能扬声器、汽车等有趣的设备。

小型企业趋势当涉及到这些新设备时,这些带有语音助手的智能扬声器,当前的安全状态是什么,以及它需要去哪里才能在比我们更高的水平上被采用今天又看到了吗

克里斯·哈拉舍克:是的。 这是个好问题。 这是我们需要问的,布伦特。 这就是为什么我对我们进行这次谈话如此感兴趣的原因之一,因为安全通常是事后才想到的。 我们正处于这样一个阶段,这些类型的设备将可以实现交互类型,它们将变得更加丰富,并且它们将开始暴露更多敏感数据。 这不仅仅是听音乐或打开灯。

因此,如果我们只是在谈论智能扬声器,那么现在最先进的技术可能是最好的情况,它正在使用口语四位数密码。 我想我们中的任何人都可能会明白,大声说出您的密码并不是真正可取的。 所以我认为有很多机会可以为这些不同类型的语音环境带来更强大的身份和身份验证形式,如果你在车内说话,或者甚至是在办公室环境中说话,那么它就是车内的智能扬声器。像这样。 假设您可以带来适当的安全性、身份和信任,就有机会访问业务信息。

小型企业趋势我和我们很多人都在考虑的事情之一,从您自己的角度来看,您如何让销售人员等人更多地使用 CRM? 语音对它来说似乎是一件显而易见的事情。 但是从隐私和安全的角度来看,为了让销售人员和使用企业应用程序的人确保正确的人在使用它并输入数据和访问数据,需要做些什么。 从语音生物识别的角度来看,要让公司感到舒服,必须做些什么?

Chris Halashek :我认为即使对我来说,如果我要走进我们有语音设备的会议室,假设我想访问我们的一些与 CRM 相关的与我们的某些帐户相关的数据,我需要确保因为它是共享设备,所以我有权实际访问该信息。 我们看到的机会,而且,我们在历史上一直专注于呼叫中心,同时提供欺诈检测和身份验证解决方案。 我认为我们在那里处理它的方式与您可以在这些其他语音通道中处理它的方式类似。

克里斯·哈拉舍克:如果你看看我们今天在呼叫中心所做的事情,我认为这将与其他渠道平行,布伦特,是我们正在尝试取代传统形式的认证某人在这语音通道。 通常这样做的方式是使用一种称为基于知识的身份验证问题的方法。 它通常在身份验证或安全用语中是您所知道的。 所以这是我母亲的娘家姓,我 SSN 的最后四位数字,可能是密码或密码。

同样,我们在前面的对话中提到我们在智能扬声器中使用四位数字引脚。 呼叫中心也使用了类似类型的方法。 不幸的现实是,这是非常不安全的。 此类数据可在二级市场或黑市上获得。 这就是导致大量违规行为的原因。 在企业呼叫中心的语音渠道中,它导致了今天实际上是一个 140 亿美元的问题,即该渠道上的语音欺诈损失。

我们看到了机会。 Pindrop 所做的就是使用我们的语音生物识别技术,用您的声音替换这些密码和密码,我们可以更深入地讨论一下。 我们拥有非常独特和准确地识别在这种类型的语音交互中实际处于活动状态的设备的技术。 因此,我们拥有的技术使我们能够以无摩擦的方式验证正确的声音、正确的设备和正确的行为。

如果你看看智能扬声器之类的东西,我走进我们的一个会议室并与那里的一个支持语音的设备进行交互,我们看到了采用相同的语音生物识别技术来确保我是正确的演讲者的巨大机会在该特定交易中。 假设我们使用 Salesforce 并说“嘿,Salesforce 或嘿 Einstein,让我知道 X、Y、Z 机会的最新状态”,它只会给我,因为我一直是确定的发言人,而且我有权访问该信息。

小型企业趋势现在您还可以提醒用户声音是真实的还是不真实的,或者是有机的还是非有机的。 稍微谈一下。

Chris Halashek :如果您正在研究语音身份和语音生物识别技术,您就会知道您必须对存在的各种威胁向量具有弹性,并且正在使用这种类型的身份验证凭证。 现实情况是,坏演员非常聪明,他们不遗余力地克服这些类型的防御。 因此,如果您正在研究语音生物识别技术,就会发现不良行为者会尝试各种不同的语音欺骗攻击向量。 就像重放攻击一样,他们实际上会记录您进行某种类型的交互,然后他们会返回并尝试利用该记录来访问此类系统或数据。


其他更多合并的攻击向量称为合成语音生成或语音合成。 我不知道您是否在最近的 Google I/O 大会上看到了 Google Duplex 演示。

小企业趋势是的。 我看到了它,并且在那些喜欢的人中,“哇,好吧。 这很有趣。”

Chris Halashek :真的很酷,同时也有点吓人,对吧?

小企业趋势是的。

Chris Halaschek :我认为从最终用户的角度来看,它可以提高很多效率,但它确实展示了合成语音生成可以在哪里进行,因为另一端的机器人是使用合成语音实时完成的. 我们有一些演示,今天我很高兴向您展示其中的一些,它们展示了您可以用我们从 YouTube 之类的东西中提取的几分钟音频来做多少事情。 我们的研究团队在内部构建了我们自己的语音合成引擎,主要是为了展示这种威胁的现实以及为什么需要防范它。

我们看到诸如语音失真之类的东西。 我们看到东西,声音变形。 你会有一个坏演员试图盗用某人的银行账户,他们知道这可能是一个女性或男性账户,所以他们会调整他们的声音,让他们听起来像男性或女性。

小企业趋势是的。

Chris Halashek :所以合成语音和语音合成即将到来,我们必须做好准备。

小型企业趋势当您考虑企业应用程序、软件应用程序,甚至呼叫中心代理正在使用的东西时,这对于克服人们合理担心的安全问题变得非常关键。

Chris Halashek :完全正确。 如果您看到从电话频道中传出的声音——更多的是这些智能扬声器,让您可以访问诸如解锁您家中的门之类的东西,现在就在那里–您必须考虑这些类型的威胁和防御它们。

小型企业趋势对于这些智能设备和需要安全性的整体情况,我们目前处于何种成熟度?

Chris Halaschek:我认为我们还处于早期阶段,这很好,而且在某种意义上说我们还处于早期阶段,因为我认为我们对这些设备的交互类型只是触及了皮毛 我认为它很好的另一个原因是人们开始提前思考。 我们已经与一些企业客户进行了交谈,他们正在考虑在 2019 年将语音技能引入各种平台。他们希望为这些特定渠道和环境带来更丰富的体验,但他们必须在安全的情况下做到这一点大大地。

现在,从技术的角度来看,我认为技术就在那里。 我们只需要把它拿出来,并考虑如何应用它。 我的意思是,展望明年,我认为您将看到越来越多的企业将这些类型的体验带入这些渠道。 我认为我们仍然会做一些非常基本的事情。 随着一些安全和身份相关的解决方案在这些渠道中上市,如果有意义的话,我们将开始在数据中公开更多有趣的用例。

小型企业趋势消费者对智能设备的采用如何影响企业中发生的事情? 我们都知道我们都是消费者。 我们把东西带进我们的房子。 我们开始使用它们。 它们变得非常方便。 然后我们开始思考,“哦,天哪,为什么我们使用企业的方式不能......为什么不能像我们在家里那样方便?”

Chris Halashek :我认为我们看到消费者和企业之间的界限越来越模糊。 我认为现实情况是,无论从企业角度还是消费者角度,我们都期望引人注目的客户体验,因为归根结底,你是对的,我们都是消费者。 我认为,如果您是一家企业软件公司,您仍然必须为您的企业消费者带来令人愉悦的用户体验。 这只是我的哲学。 我认为这股潮流已经在一段时间前发生了变化。 这实际上是查看这些业务应用程序的问题,并且在许多情况下为这些类型的应用程序公开的数据可以被视为更加敏感。

这些语音助手的许多家庭使用仍然是基本的,但开始趋向于支付和管理等与支付或购买相关的事物。 因此,您将开始处理更敏感的用例。 我们还设想了金融交易之类的东西......对于我作为一个可能想要使用语音助手进行股票交易等事情的零售消费者来说,我们认为这些将开始进入市场。

这实际上与数据的敏感性有关。 我认为通常在业务方面,您的安全团队正在评估您将如何公开和锁定该信息,而在消费者方面,我认为至少我们已经开始使用智能扬声器或其中一些语音助手领域. 它在您自己家的范围内,更像是一个值得信赖的场景。 但是当你在那里带来更丰富的交易时,显然你将不得不拥有强大的身份验证和身份形式。

这是与思想领袖的一对一访谈系列的一部分。 成绩单已编辑出版。 如果是音频或视频采访,请点击上面的嵌入式播放器,或通过 iTunes 或通过 Stitcher 订阅。