コンテンツに移動
AI & 機械学習

Speaker ID により、コールセンターで機械学習ベースの音声識別機能が利用可能に

2021年10月18日
Google Cloud Japan Team

※この投稿は米国時間 2021 年 10 月 2 日に、Google Cloud blog に投稿されたものの抄訳です。

Google は、世界最大級のコールセンターで会話型 AI を活用してカスタマー エクスペリエンスを再定義する取り組みを始めるために、Contact Center AI(CCAI)を発表しました。Google のアプローチはこの数年間でその価値を証明してきました。CCAI 顧客インタビューに基づく 2020 年のある調査によると、エージェントへの電話の 20~35% の減少、平均通話時間短縮による 130~370 万ドル分のエージェントの生産性向上、コールセンター ソリューションの管理労力の最大 75% の削減が見込まれています(「New Technology: The Projected Total Economic Impact™ Of Google Cloud Contact Center AI(英語)」2020 年 8 月、Forrester Consulting による委託調査)。

本日の Speaker ID の発表により、Google はカスタマー エクスペリエンスの再定義への投資を続けます。Speaker ID によって、Google の音声識別テクノロジーが Google Cloud の顧客とコールセンター パートナーに直接提供されることになり、顧客やパートナーは、発信者に電話ツリーやメニューなどの煩雑で回りくどい認証プロセスを要求することなく、最も直感的なインターフェースである音声を使用してサービスを提供できるようになります。

Avaya のテクノロジー パートナー&アライアンス担当バイス プレジデント Eric Rossman 氏は次のように述べています。「ML ベースの話者識別機能が CCAI でも利用できるようになったことをうれしく思います。弊社は、Google Cloud CCAI のローンチ パートナーとして、Google の AI テクノロジーがコールセンターにもたらす効果を見てきました。弊社のお客様は、既存の Dialogflow エージェントに、他の電話通信やテクノロジーを統合することなく ML ベースの検証機能を追加できるようになります。」

コールセンターにおけるスピードと利便性のニーズ

多くの顧客は、サポートや問い合わせをする際の方法としてコールセンターへの電話を好みます。2020 年には、サービス提供手段として音声通話を希望する顧客の割合は 10% 増加して 43% となり、2 位のテキストによる問い合わせを希望する 22% を大きく引き離しました(「Aspect Consumer Index Annual Report 2020(英語)」)。

とはいえ、十分にパーソナライズされたサービスを受けるには、顧客はパスワードを記憶したり、検証のために個人情報を提供したりするなど、時代遅れの認証プロセスを経る必要があります。これは発信者にとって非常に面倒であるだけでなく、解決までに余分な時間を要し、エージェントの貴重な時間も浪費します。こうした時代遅れのポリシーに AI を適用することはある程度役に立つものの、今必要なのは、会話型 AI を活用して顧客との交流をゼロから再定義することです。

Speaker ID の紹介

Speaker ID により、発信者は自分の声を使用して電話上で認証を行うことができるようになります。Speaker ID は、機械学習(ML)ベースの音声識別を使用して発信者を識別して検証します。Speaker ID を使用するには、登録と検証という 2 つの主要なプロセスが必要です。

発信者は初めてこのシステムを使用する際に、登録を行う必要があります。一般的に、登録ではまず既存のプロセスを使用して認証を行い、その後発信者が短い声のサンプルを提供します。次回以降は、従来のプロセスの代わりにこのサンプルを使用して検証を素早く行うことができます。Google Cloud の Speaker ID は「テキスト非依存」です。つまり、ユーザーが一度登録を行えば、その後は最短 3 秒の任意の音声スニペットを使用して検証できます。パスワード フレーズは必要なく、ユーザーは何かを言うだけで音声によって身元を認証できます。"

Contact Center AI との統合

Speaker ID は Google Cloud の Contact Center AI プラットフォームと直接統合されています。企業は CCAI 内の Dialogflow CX を使用して、発信者のための会話エクスペリエンスを設計できます。Speaker ID との統合により、Dialogflow CX は音声を送信してインテント検出とエンティティ抽出を行うことができるようになります。

完全な音声統合に加えて、Speaker ID には事前構築された Dialogflow CX コンポーネントが含まれているため、既存または新規の Dialogflow CX ボットに登録および検証フローを簡単に追加できます。顧客は、Dialogflow CX を構成して受動的な検証も行えます。これは、発信者と音声ボットとの通常のやり取りをベースにして話者の検証を行います。ユーザーに特定のフレーズを発声するよう要求する必要はありません。

https://storage.googleapis.com/gweb-cloudblog-publish/original_images/Adding_enrollment_and_verification_flows_with_Speaker_ID.gif

使ってみる

Speaker ID の一般提供は本日より開始されます。Google Cloud のプロダクトや機能は、Google Cloud の AI の原則に従っています。Speaker ID にご興味がある場合、お客様のユースケースが Google の AI の原則と、Speaker ID を認証とセキュリティに使用するためのベスト プラクティスに沿ったものかどうかを確認する審査プロセスがありますので、ご利用ください。GCP 販売者に連絡してご利用を開始してください。

Speaker ID の詳細については、cloud.google.com/speaker-id をご覧ください。また、Google Cloud Next 2021 にご登録いただき、Google による会話型 AI サービスの詳細をご確認ください。


- Google Cloud Speaker ID 担当プロダクト マネージャー Calum Barnes
投稿先