データ分析

お客様からのフィードバックを変革: BigQuery ML の音声文字変換によるカスタマーレビュー音声の分析

2024年5月9日

Google Cloud Japan Team

※この投稿は米国時間 2024 年 4 月 30 日に、Google Cloud blog に投稿されたものの抄訳です。

BigQuery に統合されている音声文字変換機能は、音声データに隠された貴重な分析情報を引き出すための強力なツールになります。このサービスは、カスタマーレビューの通話のような音声ファイルをテキスト形式に文字変換して、BigQuery の堅牢なデータプラットフォームで分析できるようにします。音声文字変換と BigQuery の分析機能を組み合わせることで、お客様の感情を掘り下げ、繰り返し発生する製品の問題を特定し、お客様の声を深く理解できるようになります。

BigQuery の音声文字変換は、音声データを実用的な分析情報に変換し、業界全体に潜在的なメリットをもたらすとともに、複数のチャネルにわたるお客様とのやり取りをより深く理解できるようにしてくれます。また、BigQuery ML を使用して Gemini 1.0 Pro を活用することで、BigQuery ML のネイティブな音声文字変換機能を通じて音声ファイルから抽出したテキストについて、さらにエンティティ抽出や感情分析などの分析情報やデータ形式を取得することもできます。以下に、特定の業界のユースケースとビジネス価値をいくつかご紹介します。

業種	ユースケース	ビジネスの可能性
小売、e コマース	お客様の通話録音を分析し、共通の問題点、製品の好み、全体的な感情を特定する	フィードバックで指摘された問題に対処することで、製品開発を改善パーソナライズと対象を絞ったサポートにより、カスタマーサービスを強化お客様との通話から発見した分析情報に基づき、マーケティングキャンペーンを強化
医療	患者と医師のやり取りを音声文字変換し、医療記録への自動入力、診断の要約、治療の進行状況の追跡を行う	医療従事者のワークフローがさらに合理化され、管理負担を軽減より良い意思決定のための包括的な患者記録を実現研究と医療の改善に向けて、患者の懸念の傾向を特定できる可能性がある
財務	業績発表や株主総会を分析することで、市場センチメントの評価、潜在的なリスクの特定、重要な分析情報の抽出を行う	より多くの情報に基づいた投資決定をサポート新たなトレンドや潜在的な問題を迅速に特定先を見越したリスク管理戦略
メディア、エンターテイメント	ポッドキャスト、インタビュー、フォーカスグループの音声文字変換により、コンテンツ分析とオーディエンス分析を行う	新しいコンテンツ作成のため、注目のトピックやテーマを早期に特定番組開発や広告に対する視聴者の好みを把握字幕の自動化により、アクセシビリティを向上

BigQuery ML などの高度な AI 機能を使用する場合も、BigQuery に組み込まれているすべてのガバナンス機能にアクセスできます。これにより、アクセス制御パススルーが利用できるため、BigQuery オブジェクトテーブルに設定した行レベルのセキュリティに基づいて、お客様の音声ファイルから得た分析情報を制限できます。

音声データを分析情報に変える準備はできましたか？それでは、BigQuery で音声文字変換を使用する方法についてご説明しましょう。

Google Cloud Storage バケットに、お客様からのフィードバックの通話記録が音声ファイルとして保存されているとします。BigQuery の ML.TRANSCRIBE 関数は、Google の Vertex AI プラットフォームでホストされている事前トレーニング済みの音声文字変換モデルに接続されており、これを使用すると、これらの音声ファイルを BigQuery 内で判読可能なテキストに自動的に変換できます。音声データに特化した変換機とお考えください。ML.TRANSCRIBE 関数に、音声ファイルの場所（オブジェクトテーブル内）と使用する音声文字変換モデルを指示します。次に、ML を活用して音声文字変換処理を行い、テキスト結果を BigQuery に直接配信します。これにより、お客様の会話を他のビジネスデータと合わせて簡単に分析できます。

このプロセスを BigQuery で見ていきましょう。

設定の手順:

開始する前に、Google Cloud プロジェクトを選択し、請求先アカウントをリンクして、必要な API を有効にします。詳細な手順はこちらからご確認ください。
認識ツールを作成します。認識ツールは音声認識の構成を保存するもので、作成は任意です。
クラウドリソース接続を作成し、接続のサービスアカウントを取得します。詳細なガイドはこちらをご覧ください。
こちらの手順に沿って、サービスアカウントへのアクセスを許可します。
こちらの手順に沿って、モデルとオブジェクトテーブルを含むデータセットを作成します。
音声ファイルをダウンロードして Google Cloud Storage に保存します。

こちらから 5 つの音声ファイルをダウンロードします。
Google Cloud Storage にバケットを作成し、バケット内にフォルダを作成します。
ダウンロードした音声ファイルをフォルダにアップロードします。

モデルの作成

REMOTE_SERVICE_TYPE で CLOUD_AI_SPEECH_TO_TEXT_V2 のリモートモデルを作成します。モデルにより、Speech-to-Text API が BigQuery 内で利用可能になります。

構文:

読み込んでいます...

クエリの例:

読み込んでいます...

音声ファイルを参照するオブジェクトテーブルの作成

構文:

読み込んでいます...

サンプルコード:

'BUCKET_PATH' は、音声ファイルが保存されている Google Cloud Storage バケット / フォルダのパスに置き換えてください。

読み込んでいます...

BigQuery ML を使用した音声ファイルの音声文字変換

構文:

読み込んでいます...

クエリの例:

読み込んでいます...

結果:

ML.TRANSCRIBE の結果には次の列が含まれます。

transcripts: 処理された音声ファイルの音声文字変換テキストが含まれます。
ml_transcribe_result: Speech-to-Text API からの結果を含む JSON 値
ml_transcribe_status: 各行の音声文字変換処理の成功 / 失敗を示す文字列値が含まれます。処理が成功した場合は空になります。
オブジェクトテーブルの列

https://storage.googleapis.com/gweb-cloudblog-publish/images/image1_dn60Vq9.max-1500x1500.png

ML.TRANSCRIBE 関数を使用すると、手作業による音声文字変換の必要がなくなり、時間と労力を節約できます。音声文字変換されたテキストは BigQuery 内で簡単に検索および分析が可能になり、音声データから貴重な分析情報を抽出できるようになります。

追加のアイデア

音声ファイルから抽出されたテキストを取得し、Gemini 1.0 Pro と BigQuery ML の ML.generate_text 関数を使用して、製品名、株価などのエンティティや、対象となる他のタイプのエンティティデータを抽出した後、JSON で構造化する。
Gemini 1.0 Pro と BigQuery ML を使用して、抽出されたテキストの感情分析を行い、ポジティブ / ネガティブな感情を JSON で構造化する。
お客様からのフィードバックの逐語的な内容や感情スコアを顧客生涯価値の合計スコアやその他の関連する顧客データと結合して、定量的データと定性的データが相互にどのように関連しているかを確認する。
抽出されたテキスト上にエンべディングを生成し、ベクトル検索を使用して音声ファイルで特定のコンテンツを検索する。

詳細については、ML.TRANSCRIBE に関するGoogle Cloud の公式ドキュメントをご確認ください。また、BigQuery ML の Gemini 1.0 Pro サポートに関するブログでは、「追加のアイデア」で概説している他の生成 AI ユースケースについてもご覧いただけます。ぜひチェックしてみてください。

-データ分析カスタマー エンジニア、Nivedita Kumari

-データ分析 AI / ML 担当プロダクト責任者、Michael Kilberry

投稿先