クイックスタート

Google Cloud Speech API では、Google の音声認識技術をデベロッパーのアプリケーションに簡単に統合できます。Speech API では、音声をサービスに送信すると、音声文字変換テキストを受け取ることができます(詳しくは、Google Cloud Speech API とは をご覧ください)。

Google Cloud SDK のインストール

Google Speech API は Google Cloud Platform の gcloud に組み込まれている gcloud コマンドライン ツールを利用します。Cloud SDK のインストールと設定について説明するページの指示に沿って操作してください。

コマンド プロンプトが必要な場合は、Google Cloud Shell を使用できます。Google Cloud Shell は、Google Cloud SDK がすでに含まれているコマンドライン環境であるため、インストールする必要はありません(Google Cloud SDK は、Google Compute Engine の仮想マシンにもプレインストールされています)。

プロジェクトを設定する

次の手順をまだ行っていない場合は、行います。

  1. Google アカウントへのログイン

    Google アカウントをまだお持ちでない場合は、新しいアカウントを登録します。

  2. In Cloud Platform Console で、[プロジェクト] ページに移動し、新しいプロジェクトを選択または作成します。

    [プロジェクト] ページに移動

  3. プロジェクトの課金を有効にします。

    課金の有効化

  4. Cloud Speech API を有効にする。

    Enable the API

Speech API リクエストを作成する

recognize REST メソッドを使用して、Speech API リクエストを作成します。

  1. 次のテキストを含む JSON リクエスト ファイルを作成し、sync-request.json 書式なしテキスト ファイルとして保存します。

    {
      "config": {
          "encoding":"FLAC",
          "sampleRateHertz": 16000,
          "languageCode": "en-US",
          "enableWordTimeOffsets": false
      },
      "audio": {
          "uri":"gs://cloud-samples-tests/speech/brooklyn.flac"
      }
    }
      

    この JSON スニペットは、音声ファイルのエンコード形式が FLAC で、サンプルレートが 16,000 Hz であり、この音声ファイルが Google Cloud Storage に特定の URI で保存されていることを表します。

  2. サービス アカウント キーファイルの場所を渡して、サービス アカウントへの認証を行います。

    gcloud auth activate-service-account --key-file=service-account-key-file
      
  3. サービス アカウントを使用して承認トークンを取得します。

    gcloud auth application-default print-access-token
    access_token
      
  4. curl を使用して speech:recognize リクエストを行い、出力したアクセス トークンとステップ 1 で設定した JSON リクエストのファイル名を渡します。

    curl -s -H "Content-Type: application/json" \
        -H "Authorization: Bearer access_token" \
        https://speech.googleapis.com/v1/speech:recognize \
        -d @sync-request.json
      

    curl にファイル名を渡すには、-d オプション(「データ」を指定する)を使用して、ファイル名の前に @ 記号を付けます。このファイルは、curl コマンドを実行する同じディレクトリにある必要があります。

    次のようなレスポンスが表示されるはずです。

    {
      "results": [
        {
          "alternatives": [
            {
              "transcript": "how old is the Brooklyn Bridge",
              "confidence": 0.98267895
            }
          ]
        }
      ]
    }
      

これで、Cloud Speech API への最初のリクエストが送信されました。

次のステップ

外出先でもリソースをモニタリング

Google Cloud Console アプリを入手して、プロジェクトの管理にお役立てください。

フィードバックを送信...

Google Cloud Speech API ドキュメント