料金

Speech-to-Text は正常に処理された音声の長さに基づいて月ごとに請求され、15 秒単位で切り上げて計算されます。

以下の料金表は、パーソナル システム(スマートフォン、タブレット、ノートパソコン、デスクトップ パソコンなど)のアプリケーションに適用されます。Speech-to-Text API を組み込み機器(自動車、テレビ、電化製品、スピーカーなど)で使用する場合は、承認と利用料金について Google までお問い合わせください

Cloud Console で、使用量と現在の使用料金などの現在の請求ステータスをご確認いただけます。アカウントの管理について詳しくは、Cloud Billing のドキュメントまたは課金と支払いのサポートをご覧ください。

料金表

機能 標準モデル
(拡張動画と通話を除くすべてのモデル)
拡張モデル
(動画、通話)
0~60 分 60 分超~100 万分まで 0~60 分 60 分超~100 万分まで
音声認識(データロギングなし - デフォルト) 無料 $0.006/15 秒** 無料 $0.009/15 秒**
音声認識(データロギングあり) 無料 $0.004/15 秒** 無料 $0.006/15 秒**

** 各リクエストは 15 秒単位で切り上げられます。

料金の決定要素

Speech-to-Text の料金は、以下の要素により決まります。

拡張モデル

Speech-to-Text には、音声認識に使用できる複数の機械学習モデルがあります。このモデルのうち、拡張音声通話モデルと動画モデルの 2 つは、高度な認識性能を備えており、それぞれの使用方法に合わせて調整され、適切に使用すると高品質な結果が得られます。サポート対象言語のページを参照して、拡張モデルがご希望の言語で使用可能かを確認してください。

データロギング

データロギングを有効にすると、Speech-to-Text に送信された音声データを Google が記録するのを許可したことになります。このデータは、Google が音声文字変換に使用する機械学習モデルの改善のために利用されます。そのため、データロギングを有効にした場合の Speech-to-Text の料金は割安に設定されています。

マルチ チャンネル

音声チャンネルごとに課金されます。マルチ チャンネルのリクエストを送信すると、すべてのチャンネルで処理された音声の合計の長さに基づいて課金されます。この時間の処理は、月間の使用量上限のトラッキング方法とは異なります。使用量上限はマルチ チャンネルを考慮しておらず、音声ファイルの長さによってのみ決定されます。たとえば、4 チャンネルある 30 秒間の音声をリクエストした場合は、120 秒分課金されますが、月間の割り当てに対しては 30 秒間のみがカウントされます。詳細については、割り当てと上限ページをご覧ください。

料金の計算

各リクエストは 15 秒単位で切り上げられます。たとえば、それぞれに 7 秒の音声が含まれる 3 つのリクエストは、45 秒(3×15 秒)の音声として $0.018 が請求されます。15 秒単位で切り上げられるときに、小数点以下の秒数も対象になります。つまり、15.14 秒は 30 秒として請求されます。

1 か月あたりの利用は 100 万分までとなります。音声の使用が 100 万分/月を超える場合は、詳細をプロジェクトの Speech-to-Text 割り当てリクエストでお知らせください。

Google Cloud Platform の費用

認識する音声ファイルを Google Cloud Storage に保存する場合や、他の Google Cloud Platform リソース(Google App Engine インスタンスなど)を Speech-to-Text と併用する場合は、そのサービスの利用料も請求の対象となります。現行料金に基づいてその他の費用を試算するには、Google Cloud Platform の料金計算ツールをご利用ください。