PindropのChrisHalaschek:スマートスピーカーの人気が高まるにつれ、合成音声合成と音声合成は私たちが準備する必要があるものです

公開: 2019-01-12

毎年恒例の巨大なConsumerElectronics Show(CES)が本日締めくくられ、AmazonのAlexaやGoogleのAssistantなどの音声アシスタントを備えたスマートデバイスが2年連続でショーの話題になりました…しゃれが意図されていました。 アマゾンが最近1億台以上のエコーデバイスを販売したことを発表し、アナリストはグーグルがその約半分の量のグーグルホームデバイスを販売したと推定しているので、スマートデバイスとの対話にかなり慣れていることは容易にわかります。 しかし、人々がこれらのデバイスを使用して、個人的にも専門的にも、特定の種類のより機密性の高い対話やサービスを処理するのに十分快適であると感じるためには、悪意のある人物からデータを保護するためのさらに優れたセキュリティが必要になります。

音声詐欺の防止と認証のパイオニア企業であるPindropのIoT担当副社長であるChrisHalaschekが、アトランタに本拠を置く同社の本社に私を招待し、これらの種類のデバイスのセキュリティに関する現在の状況と、何ができるかについて話しました。より多くのことを行うために人気のあるデバイスを使用することをより安全にするため。

以下は私たちの会話の編集されたトランスクリプトです。 インタビュー全体を見るには、そして音声識別があなた以外の人があなたの銀行情報をAlexaに尋ねるのをブロックする方法のデモを見るには、下のビデオをチェックするか、埋め込まれたSoundCloudプレーヤーをクリックしてください。

スマートスピーカーの使用が増えるにつれ、音声アシスタントのセキュリティ上の懸念も高まります

Small Business Trends はい、これはSmall Business Trendsです。私はピンドロップの本社に座っています。これは、ここアトランタにある本当にクールな会社です。 多くの場合、私はアトランタでもっとできることを望みます。 この会社は、音声と生体認証に関していくつかの非常に興味深いことを行っています。 私はクリス・ハラシェクとここに座っています。 クリス、今日はご参加いただきありがとうございます。

クリス・ハラシェク:ええ、ブレントに感謝します。 来てくれてありがとう。

中小企業の動向では、あなたについて少し教えてください。また、Pindropについても少し教えてください。

Chris Halaschek :私はアトランタ出身です。 私はアトランタで育ち、その後メリーランド大学に北上し、そこでコンピューターサイエンスの博士号を取得しました。 私はDCエリアでしばらく過ごしました。 それから私は西海岸に向かい、テクノロジーを掘り下げました。 私は少数の初期段階のテクノロジー企業のCTOでした。 私はすべての時間を製品の構築、それらの製品の市場投入、そしてそれらのビジネスの成長と拡大に費やしました。

私はここピンドロップに約3年半ほどいます。 私たちの焦点は常に、すべての音声対話にリアルタイムのID、セキュリティ、および信頼をもたらすことでした。 私たちは通常、主に音声があったエンタープライズコールセンターに焦点を当ててきましたが、音声が電話チャネルをはるかに超えて、スマートスピーカーや自動車などの興味深いデバイスに移行していることを理解していただけると思います。

中小企業の動向これらの新しいデバイスに関しては、音声アシスタントを搭載したこれらのスマートスピーカー、現在のセキュリティの状態、および私たちよりもさらに高いレベルで採用されるためにはどこに行く必要がありますか?今日再会しますか?

クリス・ハラシェク:うん。 いい質問ですね。 ブレント、それは私たちが尋ねる必要があるものです。 セキュリティは通常後付けであるため、これが私がこの会話をすることに非常に興味を持った理由の1つです。 これらのタイプのデバイスである程度達成可能なインタラクションのタイプは、はるかに豊富になり、はるかに機密性の高いデータを公開し始める段階にあります。 音楽を聴いたり、電気をつけたりするだけではありません。

したがって、スマートスピーカーについて話しているだけの場合は、現在の最先端技術がおそらく最良のケースであり、4桁の音声ピンを使用しています。 パスワードを大声で言うのはあまりお勧めできません。 ですから、これらのさまざまな種類の音声環境に、より強力な形式のIDと認証をもたらす機会はたくさんあると思います。車内で話している場合は、車内のスマートスピーカー、さらにはそのようなオフィス環境でも、このように。 適切なセキュリティ、ID、および信頼をもたらすことができれば、ビジネス情報にアクセスする機会があります。

中小企業の動向私が考えていることの1つであり、私たちの多くが考えていることの1つは、あなた自身の観点から、セールスマンのような人々にCRMをもっと使用させる方法です。 声はそれにとって明白なことのように思えます。 しかし、プライバシーとセキュリティの観点から、セールスマンや企業のアプリケーションを使用する人々が、適切な人がそれを使用してデータを入力し、データにアクセスしていることを確認するために何が必要か。 企業が快適に過ごせるようにするには、音声生体認証の観点から何が必要ですか?

Chris Halaschek :音声対応デバイスがある会議室の1つに足を踏み入れて、おそらくCRM関連のいくつかにアクセスしたいとしましょう。一部のアカウントに関連するデータについては、共有デバイスであるため、実際にその情報にアクセスするための適切な権限があることを確認する必要があります。 私たちが見ている機会、そして繰り返しになりますが、私たちは歴史的に、不正検出と認証の両方のソリューションを備えたコールセンターに焦点を当ててきました。 そこで私たちがアプローチした方法は、これらの他の音声チャネルでアプローチできるのと同様の方法だと思います。

Chris Halaschek :今日のコールセンターで私たちが行っていることを見ると、これは他のチャネルと並行していると思います。ブレントは、これで話している人を認証する従来の形式を置き換えようとしているということです。音声チャネル。 これが通常行われる方法は、知識ベースの認証質問と呼ばれるものを使用することです。 これは通常、認証またはセキュリティの用語で、あなたが知っていることです。 つまり、それは私の母の旧姓、私のSSNの最後の4桁、おそらくPINまたはパスワードです。

繰り返しになりますが、先ほどの会話で、スマートスピーカーで4桁のピンを使用していることについて説明しました。 同様のタイプのアプローチがコールセンターで使用されています。 残念なことに、それはひどく不安定です。 このタイプのデータは、流通市場または闇市場で入手できます。 これが、多数の侵害につながった理由です。 エンタープライズコールセンターの音声チャネルでは、そのチャネルでの音声詐欺の損失に関して、今日実質的に140億ドルの問題につながるものがあります。

チャンスがあります。 そして、Pindropが行うことは、音声生体認証技術を使用して、これらのピンとパスワードをあなたの声に置き換えることです。 そのタイプの音声対話で実際にアクティブなデバイスを非常に一意かつ正確に識別するテクノロジーがあります。 そのため、摩擦のない方法で、適切な音声、適切なデバイス、適切な動作を検証できるテクノロジーがあります。

スマートスピーカーのようなものを見て、私が会議室の1つに足を踏み入れ、そこで音声対応デバイスの1つと対話する場合、同じ音声生体認証技術を使用して、私が正しいスピーカーであることを確認する大きなチャンスがあります。その特定のトランザクションで。 Salesforceを使用して、「Hey、Salesforce、またはHey Einstein、X、Y、Zの機会に関する最新のステータスを教えてください」と言うと、私が特定された講演者であるため、それが私に与えられるだけです。その情報にアクセスできます。

中小企業の動向今度は、音声が本物か本物ではないか、有機的か有機的でないかをユーザーに警告することも行います。 それについて少し話してください。

Chris Halaschek :音声IDと音声生体認証技術を検討している場合、存在し、そのタイプの認証クレデンシャルを使用しているさまざまな脅威ベクトルに対して回復力が必要であることをご存知でしょう。 現実には、悪役は非常に賢く、これらのタイプの防御を乗り越えるために非常に長い時間を費やします。 したがって、音声バイオメトリクスを調べている場合は、悪意のある人物が試みるさまざまな音声スプーフィング攻撃ベクトルがあります。 これは、ある種の対話を行っているあなたの記録を実際に取得するリプレイ攻撃のようなものであり、彼らは戻ってその記録を利用してこのタイプのシステムまたはデータにアクセスしようとします。


他のよりマージする攻撃ベクトルは、合成音声生成または音声合成と呼ばれるものです。 最近のGoogleI / OカンファレンスでGoogleDuplexのデモを見たかどうかはわかりません。

中小企業の動向はい。 私はそれを見て、「わあ、大丈夫。 これは面白い。"

クリス・ハラシェク:本当にかっこいいと同時に、少し怖いですよね?

中小企業の動向ええ。

Chris Halaschek :エンドユーザーの観点からは、多くの効率を上げることができると思いますが、反対側のボットはすべて合成音声でリアルタイムに行われたため、合成音声生成を使用できる場所を示しています。 。 いくつかのデモがありますが、今日はそのいくつかを紹介します。これは、たとえばYouTubeのようなものから取得したわずか数分のオーディオでどれだけのことができるかを示しています。 私たちの研究チームは、主にこのタイプの脅威の現実と、それから保護する必要がある理由を示すために、独自の音声合成エンジンを社内で構築しました。

声の歪みなどが見られます。 私たちは物事を見て、声のモーフィングをします。 あなたは誰かの銀行口座を危険にさらそうとしている悪役がいるでしょう、そして彼らはそれがおそらく女性または男性の口座であることを知っているので、彼らは男性または女性のように聞こえるように彼らの声のピッチを調整します。

中小企業の動向ええ。

Chris Halaschek :ですから、合成音声合成と音声合成は、私たちが準備しなければならないものです。

中小企業の動向エンタープライズアプリケーション、ソフトウェアアプリケーション、コールセンターのエージェントでさえ使用しているものについて考えるとき、これは、人々が合法的に心配しているセキュリティのこぶを乗り越えるために非常に重要になります。

クリス・ハラシェク:その通りです。 電話チャネルから聞こえる音声を見ると、これらのスマートスピーカーに向かって、家のドアのロックを解除するなどのアクセスが可能になります。これは、今では一種の問題です。これらについて考える必要があります。脅威の種類とそれらに対する保護。

中小企業の動向これらのスマートデバイスでセキュリティが必要な状況全体が、現在どこで成熟しているのでしょうか。

Chris Halaschek:私たちはまだ早いと思います。これは良いことであり、これらのデバイスとの相互作用の種類について表面をかじっただけだと思う​​という意味で早いです。 私がそれが良いと思うもう一つの理由は、人々が先を考え始めているからです。 いくつかの企業顧客と話をしましたが、彼らは2019年にさまざまなプラットフォームに音声スキルをもたらすことを検討しています。彼らはそれらの特定のチャネルと環境により豊かな体験をもたらしたいと考えていますが、安全にそれを行う必要があります仕方。

さて、テクノロジーの観点からは、テクノロジーはそこにあると思います。 私たちはそれをそこに出して、あなたがそれをどのように適用するかについて考えなければなりません。 つまり、来年に向けて、これらのチャネルにこれらのタイプのエクスペリエンスをもたらす企業がますます増えると思います。 私たちはまだかなり基本的なことをしていると思います。 セキュリティとIDに関連するソリューションの一部がこれらのチャネルで市場に出回っているので、それが理にかなっている場合は、データでさらに多くの興味深いユースケースを公開し始めます。

中小企業の動向消費者によるスマートデバイスの採用は、企業で何が起こっているかにどのように影響しますか? 私たちは皆、私たち全員が消費者であることを知っています。 私たちは家に物を持ち込みます。 私たちはそれらを使い始めます。 彼らは本当に便利になります。 それから私たちは、「ああ、まあ、なぜ私たちが企業を使う方法ができないのか…なぜそれが私たちが家でするのと同じくらい便利ではないのか?」と考え始めます。

Chris Halaschek :消費者と企業がぼやけていると思います。 結局のところ、私たち全員が消費者であるため、企業の観点と消費者の観点の両方から、魅力的な顧客体験を期待しているのが現実だと思います。 あなたがエンタープライズソフトウェア会社であるなら、あなたはまだあなたのビジネス消費者にさえ楽しいユーザー体験をもたらさなければならないと思います。 それが私の哲学です。 少し前に潮流が変わったと思います。 それは本当にそれらのビジネスアプリケーションを見ることの問題であり、多くの場合、それらのタイプのアプリケーションに対して公開されるデータは、はるかに機密性が高いと見なすことができます。

これらの音声アシスタントの家庭での使用法の多くはまだ基本的なものですが、支払いや管理、支払いや購入に関連するものなどに傾向があり始めています。 したがって、より機密性の高いユースケースに取り掛かることになります。 また、金融取引なども想定しています…音声アシスタントを使って株取引などをしたいと思う小売消費者として、私はそれらが市場に出始めると思います。

それは本当にデータの機密性についてです。 通常、ビジネス側では、その情報をどのように公開してロックダウンするかを評価するセキュリティチームがいると思いますが、消費者側では、少なくともスマートスピーカーまたはこれらの音声アシスタントスペースの一部から始めたと思います。 。 それはあなた自身の家の範囲内にあり、もう少し信頼できるシナリオです。 しかし、より豊富なトランザクションをそこに持ち込むと、明らかに強力な形式の認証とIDが必要になります。

これは、ソートリーダーとの1対1のインタビューシリーズの一部です。 トランスクリプトは公開用に編集されています。 オーディオまたはビデオのインタビューの場合は、上の埋め込みプレーヤーをクリックするか、iTunesまたはStitcherを介してサブスクライブします。