Speech-to-Text の料金
Speech-to-Text では、サービスごとに正常に処理された音声の量に基づいて、1 秒ごとに課金されます。API がレスポンスを返した場合、リクエストで送信された音声は正常に処理されています。これには空のレスポンスが含まれます。これは、API で音声が処理されたものの、文字に変換できなかったことを示しています。リクエストがサーバーエラーになった場合、処理に成功しないため、費用は発生しません。
使用量と現在の請求額を含む現在の請求ステータスは、Google Cloud コンソールで確認できます。アカウントの管理について詳しくは、Cloud Billing のドキュメントまたは課金と支払いのサポートをご覧ください。
料金表
以下の表に示す料金は、1 か月間で処理される音声(分)に適用されます。
Category | モデル | 料金 | |
---|---|---|---|
0 ~ 60 分/月 | 60 分以上/月 | ||
音声認識(データロギングなし - デフォルト) | 標準 1 | 無料 | $0.024 / 分 ** |
医療 2 | 無料 | $0.078 / 分 ** | |
音声認識(データロギングを有効化) | 標準 1 | 無料 | $0.016 / 分 ** |
Standard1 モデルには、default
、command_and_search
、latest_short
、latest_long
、phone_call
、video
があります。
Medical2 モデルには、medical_conversation
、medical_dictation
があります。
** 各リクエストは 1 秒単位で切り上げられます。
料金の決定要素
Speech-to-Text の料金は、以下の要素により決まります。
データロギング
データロギングを有効にすると、Speech-to-Text に送信された音声データを Google が記録するのを許可したことになります。このデータは、Google が音声文字変換に使用する機械学習モデルの改善のために利用されます。そのため、データロギングを有効にした場合の Speech-to-Text の料金は割安に設定されています。
マルチ チャンネル
音声チャンネルごとに課金されます。マルチ チャンネルのリクエストを送信すると、すべてのチャンネルで処理された音声の合計の長さに基づいて課金されます。この時間の処理は、月間の使用量上限のトラッキング方法とは異なります。使用量上限はマルチ チャンネルを考慮しておらず、音声ファイルの長さによってのみ決定されます。たとえば、4 チャンネルある 30 秒間の音声をリクエストした場合は、120 秒分課金されますが、月間の割り当てに対しては 30 秒間のみがカウントされます。詳細については、割り当てと上限ページをご覧ください。
大規模なワークロード
ワークロードが非常に大きいお客様は、ボリューム割引を追加で適用できます。詳しくは、営業担当者までお問い合わせください。
Google Cloud Platform の費用
認識する音声ファイルを Google Cloud Storage に保存する場合や、他の Google Cloud Platform リソース(Google App Engine インスタンスなど)を Speech-to-Text と併用する場合は、そのサービスの利用料も請求の対象となります。現行料金に基づいてその他の費用を試算するには、Google Cloud Platform の料金計算ツールをご利用ください。
次のステップ
- Speech-to-Text のドキュメントを読む。
- Speech-to-Text を使ってみる。
- 料金計算ツールを試す。
- Speech-to-Text のソリューションとユースケースについて学習する。