Speech-to-Text API v2 では、最新の Google Cloud API 設計を活用して、エンタープライズ セキュリティと規制に関する要件をすぐに満たすことができます。
これらの要件は次のようにして満たされます。
データ所在地: Speech-to-Text v2 は、ベルギーやシンガポールなどの Google Cloud リージョンで既存の音声文字変換モデルを幅広く提供しています。そのため、完全にリージョン化されたサービスを通じて音声文字変換モデルを呼び出すことができます。
認識機能のリソースフルネス: 認識機能は再利用可能な認識構成で、モデル、言語、機能の組み合わせを含めることができます。
ロギング: リソースの作成と音声文字変換は、 Google Cloud コンソールで利用可能なログを生成します。そのため、テレメトリーとデバッグが容易になります。
暗号化: Speech-to-Text v2 は、すべてのリソースとバッチ音声文字変換の顧客管理の暗号鍵をサポートしています。
音声自動検出: Speech-to-Text v2 では、音声ファイルのサンプルレート、チャンネル数、形式を自動的に検出できます。リクエスト構成でその情報を指定する必要はありません。
v1 から v2 への移行
v1 API から v2 API への移行は自動的には行われません。機能セットを利用するには、最小限の実装変更が必要です。
API の移行
Speech-to-Text v1 と同様、音声文字変換を行うには、音声の言語と使用する認識モデルを選択して、RecognitionConfig
を作成する必要があります。
Python
必要に応じて、Speech-to-Text API を使用するリージョンを選択し、そのリージョンの言語とモデルの可用性を確認します。
Python
多数の音声文字変換リクエストで特定の認識構成を再利用する必要がある場合は、必要に応じて認知機能リソースを作成します。
Python
新しい v2 API のリクエストとレスポンスには、他にも違いがあります。詳細については、リファレンス ドキュメントをご覧ください。
UI での移行
Speech Google Cloud コンソールを使用して移行するには、次の手順に沿って操作します。
Speech Google Cloud コンソールに移動します。
[音声文字変換] ページに移動します。
[新しい音声文字変換] をクリックし、[音声設定] タブで音声を選択します。
[音声文字変換のオプション] タブで [V2] を選択します。
次のステップ
- クライアント ライブラリを使用して、好みのプログラミング言語で音声文字変換を行う。
- 短い音声ファイルの文字変換を行う。
- ストリーミング音声を文字に変換する方法を学習する。
- 長い音声ファイルを文字に変換する方法を学習する。