Крис Халашек из Pindrop: По мере роста популярности умных динамиков мы должны быть готовы к синтетической речи и синтезу голоса

Опубликовано: 2019-01-12

Огромная ежегодная выставка Consumer Electronics Show (CES) завершается сегодня, и кажется, что второй год подряд смарт-устройства с голосовыми помощниками, такими как Alexa от Amazon и Google Assistant, стали предметом обсуждения на шоу… каламбур. Учитывая, что Amazon недавно объявила о продаже более 100 миллионов устройств Echo, а по оценкам аналитиков Google продала примерно половину от этого количества устройств Google Home, легко увидеть, что мы уже привыкли к взаимодействию со смарт-устройствами. Но для того, чтобы люди чувствовали себя достаточно комфортно, чтобы использовать эти устройства для обработки определенных видов более конфиденциальных взаимодействий и услуг — как в личном, так и в профессиональном плане — им потребуется еще более высокий уровень безопасности для защиты своих данных от злоумышленников.

Крис Халашек, вице-президент по IoT в Pindrop , новаторской компании в области предотвращения голосового мошенничества и аутентификации, пригласил меня в штаб-квартиру компании в Атланте, чтобы поговорить о том, где мы находимся сегодня с безопасностью для таких устройств и что можно сделать. чтобы сделать более безопасным использование популярных устройств для выполнения большего количества задач.

Ниже приводится отредактированная стенограмма нашего разговора. Чтобы увидеть интервью целиком и увидеть демонстрацию того, как идентификация по голосу может помешать людям, которые не являются вами, запрашивать у Alexa информацию о вашем банке, посмотрите видео ниже или нажмите на встроенный проигрыватель SoundCloud.

По мере роста использования умных динамиков растут и проблемы с безопасностью голосового помощника

Тенденции малого бизнеса : Хорошо, привет, это Тенденции малого бизнеса, и я сижу в штаб-квартире Pindrop, и это действительно крутая компания здесь, в Атланте. Часто я хотел бы сделать больше в Атланте. Эта компания занимается действительно интересными вещами, связанными с голосом и биометрией. Я сижу здесь с Крисом Халашеком. Крис, спасибо, что присоединился ко мне сегодня.

Крис Халашек : Да, Брент, я ценю это. Спасибо, что пришли.

Тенденции малого бизнеса . Итак, расскажите мне немного о себе, а также немного о Pindrop, чем вы здесь занимаетесь.

Крис Халашек : Я уроженец Атланты. Я вырос в Атланте, а затем переехал на север в Мэрилендский университет, где защитил докторскую диссертацию по компьютерным наукам. Я провел некоторое время в районе DC. Затем я отправился на Западное побережье и занялся технологиями. Я был техническим директором в нескольких технологических компаниях на ранней стадии развития. Я тратил все свое время на создание продуктов, вывод этих продуктов на рынок, а затем на рост и масштабирование этого бизнеса.

Я работаю в Pindrop последние примерно три с половиной года или около того. Мы всегда стремились обеспечить идентификацию, безопасность и доверие в режиме реального времени для всех голосовых взаимодействий. Как правило, мы сосредоточились на корпоративном колл-центре, в котором в основном используется голосовая связь, но я думаю, вы оцените, что теперь голосовая связь выходит далеко за пределы телефонного канала и становится доступной для интересных устройств, таких как умные колонки, автомобили и т. д.

Тенденции малого бизнеса : когда дело доходит до этих новых устройств, этих интеллектуальных динамиков, в которых есть голосовые помощники, каково текущее состояние безопасности и что нужно сделать, чтобы они были приняты на еще более высоком уровне, чем мы? сегодня видишь?

Крис Халашек : Да. Это хороший вопрос. Это то, о чем мы должны спросить, Брент. Это одна из причин, по которой я был так заинтересован в нашем разговоре, потому что о безопасности обычно забывают. Мы находимся на этапе, когда типы взаимодействий, которые будут достижимы с этими типами устройств, станут намного богаче, и они начнут раскрывать гораздо больше конфиденциальных данных. Это не просто слушать музыку или включать свет.

Таким образом, современный уровень техники сейчас, вероятно, в лучшем случае, если мы просто говорим об умных колонках, использует голосовой четырехзначный PIN-код. Я думаю, что любой из нас, вероятно, оценит, что произносить пароль вслух на самом деле не рекомендуется. Так что я думаю, что есть много возможностей привнести более надежные формы идентификации и аутентификации в эти различные голосовые среды, будь то умный динамик внутри автомобиля, если вы говорите внутри своего автомобиля, или даже в офисных условиях, таких как как это. Существует возможность получить доступ к бизнес-информации при условии, что вы сможете обеспечить надлежащую безопасность, идентификацию и доверие.

Тенденции малого бизнеса . Одна из вещей, о которой я думаю, и о которой думают многие из нас, с вашей точки зрения, заключается в том, как заставить таких людей, как продавцы, больше использовать CRM? Голос кажется очевидным для него. Но с точки зрения конфиденциальности и безопасности, что должно произойти, чтобы продавцы и просто люди, использующие бизнес-приложения, удостоверились, что правильное лицо использует их, вводит данные и получает доступ к данным. Что должно произойти с точки зрения голосовой биометрии, чтобы компании чувствовали себя комфортно?

Крис Халашек : Я смотрю на это так, скажем, даже для себя, если я собираюсь войти в один из наших конференц-залов, где у нас есть устройство с поддержкой голоса, и, скажем, я хочу получить доступ, возможно, к некоторым из наших CRM-систем. данные, связанные с некоторыми из наших учетных записей, мне нужно убедиться, что, поскольку это совместно используемое устройство, у меня есть право доступа к этой информации. Возможности, как мы их видим, и, опять же, мы исторически сосредоточили свое внимание на колл-центре как с решениями для обнаружения мошенничества, так и с решениями для аутентификации. То, как мы подошли к этому, я думаю, похоже на то, как вы можете подойти к этому в других голосовых каналах.

Крис Халашек : Если вы посмотрите на то, что мы делаем сегодня в колл-центре, и, опять же, я думаю, что это будет параллельно с этими другими каналами, Брент, то, что мы пытаемся заменить традиционные формы аутентификации того, кто говорит в этом голосовой канал. Как правило, это делается с помощью так называемых вопросов проверки подлинности на основе знаний. Обычно на языке аутентификации или безопасности это то, что вы знаете. Итак, это девичья фамилия моей матери, мои последние четыре цифры SSN, возможно, пин-код или пароль.

Опять же, мы упоминали ранее в разговоре о том, что мы используем четырехзначные контакты в умных колонках. Подобные типы подходов использовались в колл-центре. К сожалению, реальность такова, что это ужасно небезопасно. Этот тип данных доступен на вторичных или черных рынках. Именно это и привело к большому количеству нарушений. Что касается голосового канала в корпоративных колл-центрах, то это приводит к тому, что на сегодняшний день составляет проблему в 14 миллиардов долларов с точки зрения потерь голосового мошенничества на этом канале.

Мы видим возможность. Что делает Pindrop, так это заменяет эти пин-коды и пароли вашим голосом, используя нашу технологию голосовой биометрии, о которой мы можем поговорить подробнее. У нас есть технология, позволяющая однозначно и точно идентифицировать устройство, которое действительно активно в этом типе голосового взаимодействия. Итак, у нас есть технологии, которые позволяют нам без проблем проверять правильный голос, правильное устройство, правильное поведение.

Если вы посмотрите на такие вещи, как умные колонки и меня, идущего, возможно, в один из наших конференц-залов и взаимодействующего с одним из голосовых устройств там, мы видим огромные возможности в использовании той же технологии голосовой биометрии, чтобы убедиться, что я правильный динамик. в этой конкретной сделке. Допустим, мы используем Salesforce и говорим: «Эй, Salesforce или Эй, Эйнштейн, дайте мне знать последний статус возможности X, Y, Z». иметь доступ к этой информации.

Тенденции малого бизнеса : теперь вы также делаете что-то, чтобы предупредить пользователя о том, что голос либо подлинный, либо нет, органичный или неестественный. Расскажите немного об этом.

Крис Халашек : Если вы рассматриваете технологию голосовой идентификации и голосовой биометрии, вы знаете, что должны быть устойчивыми к различным существующим векторам угроз и использовать этот тип учетных данных аутентификации. Реальность такова, что плохие актеры очень умны, и они идут на многое, чтобы обойти эти типы защиты. Итак, если вы смотрите на голосовую биометрию, у вас есть множество различных векторов атаки с подменой голоса, которые будут пытаться использовать злоумышленники. Это такие вещи, как повторные атаки, когда они фактически получают запись того, как вы выполняете какое-то взаимодействие, и они возвращаются и пытаются использовать эту запись, чтобы получить доступ к этому типу системы или данным.


Другие более сливающиеся векторы атак — это то, что называется синтетической генерацией речи или голосовым синтезом. Я не знаю, видели ли вы демонстрацию Google Duplex на недавней конференции Google I/O.

Тенденции малого бизнеса : Да. Я видел это и был среди людей, которые говорили: «Вау, ладно. Это интересно."

Крис Халашек : Действительно круто и в то же время немного страшно, правда?

Тенденции малого бизнеса : Да.

Крис Халашек : Я думаю, что с точки зрения конечного пользователя это может значительно повысить эффективность, но это своего рода демонстрация возможностей создания синтетической речи, потому что бот на другом конце все это делал в режиме реального времени с помощью синтетической речи. . У нас есть несколько демонстраций, и я рад показать вам некоторые из них сегодня, которые показывают, как много вы можете сделать, используя всего пару минут аудио, которые мы берем, скажем, с YouTube. Наша исследовательская группа создала собственный механизм синтеза голоса, главным образом, чтобы продемонстрировать реальность этого типа угроз и понять, почему вам необходимо защищаться от них.

Мы видим такие вещи, как искажение голоса. Мы видим вещи, трансформируем голос. У вас будет плохой актер, пытающийся скомпрометировать чей-то банковский счет, и они знают, что это, возможно, женский или мужской счет, поэтому они будут регулировать высоту своего голоса, чтобы он звучал как мужчина или женщина.

Тенденции малого бизнеса : Да.

Крис Халашек : Итак, синтетическая речь и синтез голоса — это то, к чему мы должны быть готовы.

Тенденции для малого бизнеса . Когда вы думаете о корпоративных приложениях, программных приложениях, вещах, которые используют даже агенты колл-центра, становится действительно важно преодолеть тот горб безопасности, о котором люди обоснованно беспокоятся.

Крис Халашек : Совершенно верно. Если вы посмотрите на голос, исходящий из телефонного канала — больше похоже на эти умные динамики, дающие вам доступ к таким вещам, как отпирание дверей в вашем доме, который теперь как бы там, — вы должны думать об этом. виды угроз и защита от них.

Тенденции малого бизнеса : на каком этапе развития всей этой ситуации с интеллектуальными устройствами и потребностью в безопасности мы сейчас находимся?

Крис Халашек: Я думаю, что мы еще рано, и это хорошо, и рано в том смысле, что я думаю, что мы просто царапаем поверхность о типах взаимодействия с этими устройствами. Еще одна причина, по которой я думаю, что это хорошо, заключается в том, что люди начинают думать наперед. Мы поговорили с некоторыми из наших корпоративных клиентов, и они рассматривают возможность использования голосовых функций на различных платформах в 2019 году. способ.

Теперь, с точки зрения технологии, я думаю, что технология есть. Мы просто должны получить его там и подумать о том, как вы его применяете. Я имею в виду, что в следующем году я думаю, что вы увидите, как все больше и больше предприятий привносят такой опыт в эти каналы. Я думаю, что мы все еще собираемся делать довольно простые вещи. По мере того, как некоторые решения, связанные с безопасностью и идентификацией, выходят на рынок по этим каналам, мы начнем раскрывать гораздо больше интересных вариантов использования данных, если это имеет смысл.

Тенденции малого бизнеса : как внедрение интеллектуальных устройств потребителями влияет на то, что происходит на предприятии? Все мы знаем, что все мы потребители. Мы приносим вещи в наш дом. Мы начинаем их использовать. Они становятся действительно удобными. Затем мы начинаем думать: «О, черт возьми, почему мы не можем использовать предприятие… Почему это не может быть так же удобно, как то, что мы делаем дома?»

Крис Халашек : Я думаю, мы видим размывание потребительского и корпоративного. Я думаю, что реальность такова, что мы все ожидаем убедительного клиентского опыта как с точки зрения предприятия, так и с точки зрения потребителя, потому что, в конце концов, вы правы, мы все потребители. Я думаю, что если вы являетесь компанией-разработчиком корпоративного программного обеспечения, вы все равно должны приносить восхитительный пользовательский опыт даже вашим бизнес-потребителям. Это просто моя философия. Я думаю, что волна немного изменилась некоторое время назад. На самом деле это вопрос рассмотрения этих бизнес-приложений, и данные, которые предоставляются для этих типов приложений, во многих случаях могут рассматриваться как гораздо более конфиденциальные.

Домашнее использование этих голосовых помощников по-прежнему носит базовый характер, но начинает склоняться к таким вещам, как платежи и управление, вещам, связанным с платежами или покупками. Таким образом, вы начнете переходить к более чувствительным вариантам использования. Мы также предусмотрели такие вещи, как финансовая торговля… Для меня, как для розничного потребителя, который может захотеть делать такие вещи, как торговля акциями с помощью голосового помощника, мы думаем, что они начнут появляться на рынке.

Это действительно о чувствительности данных. Я думаю, что, как правило, со стороны бизнеса у вас есть группы безопасности, которые оценивают, как вы собираетесь раскрывать и блокировать эту информацию, тогда как со стороны потребителя, я думаю, по крайней мере, мы начали с умного динамика или некоторых из этих голосовых помощников. . Это в пределах вашего собственного дома, немного более надежный сценарий. Но по мере того, как вы приносите туда более богатые транзакции, очевидно, вам понадобятся надежные формы аутентификации и идентификации.

Это часть серии интервью один на один с лидерами мнений. Стенограмма была отредактирована для публикации. Если это аудио- или видеоинтервью, нажмите на встроенный проигрыватель выше или подпишитесь через iTunes или Stitcher.