クイックスタート

Google Cloud Speech API では、Google の音声認識技術をデベロッパーのアプリケーションに簡単に統合できます。Speech API では、音声をサービスに送信すると、音声文字変換テキストを受け取ることができます(詳しくは、Google Cloud Speech API とは をご覧ください)。

Google Cloud SDK のインストール

Google Speech API makes は Google Cloud Platform の Cloud SDK に組み込まれている gcloud コマンドライン ツールを利用します。Cloud SDK のインストールとセットアップについて説明するページの指示に従ってください。

注: Google Compute Engine VM を使用している場合は、すでにそのイメージに Cloud SDK がプリインストールされています。

プロジェクトを設定する

次の手順をまだ行っていない場合は、行います。

  1. Google アカウントへのログイン

    Google アカウントをまだお持ちでない場合は、新しいアカウントを登録します。

  2. In Cloud Platform Console で、[プロジェクト] ページに移動し、新しいプロジェクトを選択または作成します。

    [プロジェクト] ページに移動

  3. プロジェクトの課金を有効にします。

    課金の有効化

  4. Cloud Speech API を有効にする。

    Enable the API

  5. Google Cloud Speech API を有効にした後、[認証情報に進む] ボタンをクリックして Cloud Speech API の認証情報を設定します。

  6. コードから Cloud Speech API サービスの承認を受ける方法については、サービス アカウントの設定をご覧ください。承認を受けると、このクイックスタートで Speech API への認証に使用できるサービス アカウント キー ファイル(JSON 形式)と GOOGLE_APPLICATION_CREDENTIALS 環境変数の両方を取得できます。

Speech API リクエストを作成する

ここでは syncrecognize REST メソッドを使用して Speech API リクエストを作成します。

  1. 次のテキストを含む JSON リクエスト ファイルを作成し、sync-request.json 書式なしテキスト ファイルとして保存します。

    {
      'config': {
          'encoding':'FLAC',
          'sampleRate': 16000,
          'languageCode': 'en-US'
      },
      'audio': {
          'uri':'gs://cloud-samples-tests/speech/brooklyn.flac'
      }
    }
      

    この JSON スニペットは、音声ファイルのエンコード形式が FLAC で、サンプルレートが 16000 Hz であり、この音声ファイルが Google Cloud Storage に特定の URI で保存されていることを表します。

  2. サービス アカウント キー ファイルの場所を渡して、サービス アカウントへの認証を行います。

    gcloud auth activate-service-account --key-file=service-account-key-file
      
  3. サービス アカウントを使用して承認トークンを取得します。

    gcloud auth print-access-token
    access_token
      
  4. curl を使用して speech:syncrecognize リクエストを行い、出力したアクセス トークンとステップ 1 で設定した JSON リクエストのファイル名を渡します。

    curl -s -k -H "Content-Type: application/json" \
        -H "Authorization: Bearer access_token" \
        https://speech.googleapis.com/v1beta1/speech:syncrecognize \
        -d @sync-request.json
      

    curl にファイル名を渡すには、-d オプション(「データ」を指定する)を使用して、ファイル名の前に @ 記号を付けます。このファイルは、curl コマンドを実行する同じディレクトリにある必要があります。

    次のようなレスポンスが表示されるはずです。

    {
      "results": [
        {
          "alternatives": [
            {
              "transcript": "how old is the Brooklyn Bridge",
              "confidence": 0.98267895
            }
          ]
        }
      ]
    }
      

これで、Cloud Speech API への最初のリクエストが送信されました。

次のステップ

外出先でもリソースをモニタリング

Google Cloud Console アプリを入手して、プロジェクトの管理にお役立てください。

フィードバックを送信...

Google Cloud Speech API ドキュメント