シングルゾーンのプロビジョンド スループット

シングルゾーン プロビジョンド スループットを使用すると、1 つのゾーンのみが使用可能な特定のリージョンでスループットを予約できます。このオプションは、ML 処理が必要なユースケースで、Gemini モデルの予測可能なパフォーマンスを提供します。

サポートされているモデルとリージョンのリストについては、デプロイとエンドポイントをご覧ください。ML 処理をサポートするリージョンとモデルのリストについては、ML 処理をご覧ください。

シングルゾーン プロビジョンド スループットの機能

このセクションでは、シングルゾーン プロビジョニング済みスループットの主な機能の概要を説明します。

  • 料金と単位は標準のプロビジョンド スループットと一致しています。単一ゾーンのプロビジョンド スループットでは、標準のプロビジョンド スループットと同じスループットの測定単位(GSU)、料金、条件が使用されます。

  • 単一ゾーンのプロビジョニングされたスループットはリージョン内の ML 処理をサポート: 購入したスループット量を超えるトラフィックを含め、すべてのリクエストが購入したリージョンで処理されます。このトラフィックは、リージョンのバッファ容量を使用して、従量課金制の料金で課金されます。

  • 超過分を制御する: 標準のプロビジョニングされたスループットと同じヘッダーを使用して、オーバーフロー トラフィックを制御できます。

  • 注文をモニタリングできます: 既存のプロビジョニングされたスループットのモニタリング機能を使用して、単一ゾーンのプロビジョニングされたスループットの注文をモニタリングできます。

制限事項

シングルゾーン プロビジョンド スループットには次の制限があります。

  • シングルゾーン プロビジョニング スループットは対象サービスではなく、Vertex AI の Gemini オンライン推論サービスレベル契約から除外されます。

  • 単一ゾーンのプロビジョニングされたスループットは、バッチ リクエストファインチューニングと統合されておらず、サポートもされていません。

  • ML 処理のないリージョンでは、シングル ゾーン プロビジョンド スループットのレイテンシが、標準のプロビジョンド スループットや従量課金制よりも高くなることがあります。

シングルゾーンのプロビジョンド スループットを購入する

シングルゾーン プロビジョンド スループットの購入については、 Google Cloud アカウント担当者にお問い合わせください。

次のステップ