クライアント ライブラリを使用して音声を文字に変換する
このページでは、Google Cloud クライアント ライブラリを用いて、お好みのプログラミング言語で Speech-to-Text に音声認識リクエスト送信する方法について説明します。
Speech-to-Text を使用すると、Google の音声認識技術をデベロッパーのアプリケーションに簡単に統合できます。音声データを Speech-to-Text API に送信し、音声ファイルの音声が文字に変換されたテキストを取得できます。サービスの詳細については、Speech-to-Text の基本をご覧ください。
始める前に
Speech-to-Text API にリクエストを送信する前に、以下の操作を完了しておく必要があります。詳細については、始める前にのページをご覧ください。
- Google Cloud プロジェクトで Speech-to-Text を有効にする。
- Speech-to-Text の課金が有効になっていることを確認する。
- 1 つ以上のサービス アカウントを作成して、Speech-to-Text に割り当てる。
- サービス アカウントの認証情報キーをダウンロードする。
- 認証情報の環境変数を設定する。
- (省略可)音声データを保存する新しい Google Cloud Storage バケットを作成する。
クライアント ライブラリをインストールする
Go
go get cloud.google.com/go/speech/apiv1
Java
Maven を使用している場合は、次のものを pom.xml
ファイルに追加します。BOM の詳細については、Google Cloud Platform ライブラリ BOM をご覧ください。
Gradle を使用している場合は、次のものを依存関係に追加します。
sbt を使用している場合は、次のものを依存関係に追加します。
Visual Studio Code、IntelliJ または Eclipse を使用している場合は、次の IDE プラグインでプロジェクトにクライアント ライブラリを追加できます。
プラグインでは、サービス アカウントのキー管理などの追加機能も提供されます。詳細は各プラグインのドキュメントをご覧ください。
Node.js
ライブラリをインストールする前に、Node.js 開発のための環境を用意しておいてください。
npm install --save @google-cloud/speech
Python
ライブラリをインストールする前に、Python 開発用の環境を用意しておいてください。
pip install --upgrade google-cloud-speech
音声文字変換をリクエストする
では、Speech-to-Text を使用して、音声ファイルをテキストに変換してみましょう。次のコードを使用して、Speech-to-Text API に recognize
リクエストを送信します。
これで完了です。Speech-to-Text への最初のリクエストを送信できました。
エラーが発生する場合や Speech-to-Text からのレスポンスが空である場合は、トラブルシューティングとエラーの軽減の手順を確認してください。
クリーンアップ
このページで使用したリソースについて、Google Cloud アカウントに課金されないようにするには、次の手順を行います。
- プロジェクトを必要としない場合は、Google Cloud コンソールを使用して削除してください。
次のステップ
- 短い音声ファイルの音声を文字に変換する。
- 長い音声ファイルの音声認識を一括で行う方法を学習する。
- マイクからの入力など、ストリーミングの音声を文字に変換する方法を学習する。
- 特定の言語で Speech-to-Text クライアント ライブラリを使用して、Speech-to-Text を利用する。
- サンプル アプリケーションを実行する。
- ベスト プラクティスのドキュメントで、最高のパフォーマンスと精度を実現するための方法やヒントを確認する。