サポートとトラブルシューティング

このページでは、Cloud Speech-to-Text から期待する結果を得る方法、そして必要な回答を得るためのサポートの利用方法をご紹介します。

サポート

技術サポートが追加で必要な場合は、次の方法をご利用いただけます。

Stack Overflow で質問する

Speech-to-Text API については、Stack Overflow で質問してください。Speech-to-Text API に関する質問には、タグ google-cloud-speech を使用してください。このタグを使うと、Stack Overflow コミュニティからだけではなく、タグをモニタリングして非公式なサポートを提供する Google エンジニアからも回答を受け取ることができます。

Cloud Speech API についてディスカッションし、最新情報を入手する

cloud-speech-discuss Google グループに参加して Speech-to-Text API についてディスカッションし、Speech-to-Text API のお知らせと最新情報を入手してください。

サポート パッケージを入手する

Google Cloud Platform には、24 時間 365 日の対応や電話サポート、テクニカル サポート マネージャーへのお問い合わせなど、さまざまなニーズに対応する各種のサポート パッケージが用意されています。詳しくは、Google Cloud Platform サポートをご覧ください。

トラブルシューティング

Speech-to-Text から返される結果が期待どおりではない場合:

  • レスポンスにエラー メッセージがないか確認します。

  • 割り当てと制限を確認します。

  • 認識の精度を向上させるには、ベスト プラクティスのガイドラインに従います。

  • 音声文字変換テキストが返されず(空白の {} JSON レスポンスを受け取るなど)、エラーが発生していない場合、音声で正しいエンコードが使用されていないと考えられます。

    1. ファイルを再生し、出力を聴きます。音声がクリアで、話を理解できますか?

      ファイルを再生するには、SoX(Sound eXchange)play コマンドを使用します。複数の音声エンコードに基づくいくつかの例を以下に示します。

      FLAC ファイルにはサンプルレート、エンコード タイプ、チャンネル数を示すヘッダーが含まれ、次のように再生できます。

      play audio.flac
      

      LINEAR16 ファイルにはヘッダーが含まれません。LINEAR16 ファイルを再生するには、サンプルレート、エンコード タイプ、チャンネル数を指定する必要があります。LINEAR16 のエンコードは 16 ビット、符号付き整数、リトル エンディアンにする必要があります。

      play --channels=1 --bits=16 --rate=16000 --encoding=signed-integer \
        --endian=little audio.raw
      

      MULAW ファイルにもヘッダーが含まれず、多くの場合に低いサンプルレートを使用します。

      play --channels=1 --rate=8000 --encoding=u-law audio.raw
      

      Cloud Speech-to-Text サービスでは現在、1 つの音声チャンネルのみがサポートされています。

    2. データの音声エンコードが、InitialRecognizeRequest で送信したパラメータと一致していることを確認します。たとえば、リクエストで "encoding":"FLAC""sampleRateHertz":16000 を指定した場合、SoXplay コマンドで一覧表示される音声データ パラメータがこれらのパラメータに一致する必要があります。次に例を示します。

      play audio.flac
      

      次のように表示されるはずです。

      Encoding: FLAC
      Channels: 1 @ 16-bit
      Sampleratehertz: 16000Hz
       

      SoX のリストに 16000Hz 以外の Sampleratehertz が示されている場合は、一致するように InitialRecognizeRequest"sampleRateHertz" を変更します。EncodingFLAC でない場合や Channels1 @ 16-bit でない場合は、このファイルを直接使用することはできず、互換性のあるエンコードに変換する必要があります(次の手順を参照)。

    3. 音声ファイルが FLAC エンコードではない場合、SoX を使用して FLAC に変換し、上記の手順を繰り返してファイルを再生し、エンコード、sampleRateHertz、チャンネルを確認します。さまざまな音声ファイル形式を FLAC エンコードに変換する例を以下に示します。

      sox audio.wav --channels=1 --bits=16 audio.flac
      sox audio.ogg --channels=1 --bits=16 audio.flac
      sox audio.au --channels=1 --bits=16 audio.flac
      sox audio.aiff --channels=1 --bits=16 audio.flac
      

      未加工ファイルを FLAC に変換するには、ファイルの音声エンコードを知る必要があります。たとえば、16,000 Hz のステレオ 16 ビット符号付きリトル エンディアンを FLAC に変換するには、次のように指定します。

      sox --channels=2 --bits=16 --rate=16000 --encoding=signed-integer \
        --endian=little audio.raw --channels=1 --bits=16 audio.flac
      

    4. 提供されているサンプル音声ファイルを使用して、クイックスタートの例またはいずれかのサンプル アプリケーションを実行します。この例が正常に動作したら、サンプル音声ファイルの代わりに独自の音声ファイルを使用します。

このページは役立ちましたか?評価をお願いいたします。

フィードバックを送信...

Cloud Speech-to-Text API ドキュメント
ご不明な点がありましたら、Google のサポートページをご覧ください。