シングルゾーン プロビジョンド スループットを使用すると、1 つのゾーンのみが使用可能な特定のリージョンでスループットを予約できます。このオプションは、ML 処理が必要なユースケースで、Gemini モデルの予測可能なパフォーマンスを提供します。
サポートされているモデルとリージョンのリストについては、デプロイとエンドポイントをご覧ください。ML 処理をサポートするリージョンとモデルのリストについては、ML 処理をご覧ください。
シングルゾーン プロビジョンド スループットの機能
このセクションでは、シングルゾーン プロビジョニング済みスループットの主な機能の概要を説明します。
料金と単位は標準のプロビジョンド スループットと一致しています。単一ゾーンのプロビジョンド スループットでは、標準のプロビジョンド スループットと同じスループットの測定単位(GSU)、料金、条件が使用されます。
単一ゾーンのプロビジョニングされたスループットはリージョン内の ML 処理をサポート: 購入したスループット量を超えるトラフィックを含め、すべてのリクエストが購入したリージョンで処理されます。このトラフィックは、リージョンのバッファ容量を使用して、従量課金制の料金で課金されます。
超過分を制御する: 標準のプロビジョニングされたスループットと同じヘッダーを使用して、オーバーフロー トラフィックを制御できます。
注文をモニタリングできます: 既存のプロビジョニングされたスループットのモニタリング機能を使用して、単一ゾーンのプロビジョニングされたスループットの注文をモニタリングできます。
制限事項
シングルゾーン プロビジョンド スループットには次の制限があります。
シングルゾーン プロビジョニング スループットは対象サービスではなく、Vertex AI の Gemini オンライン推論サービスレベル契約から除外されます。
単一ゾーンのプロビジョニングされたスループットは、バッチ リクエストやファインチューニングと統合されておらず、サポートもされていません。
ML 処理のないリージョンでは、シングル ゾーン プロビジョンド スループットのレイテンシが、標準のプロビジョンド スループットや従量課金制よりも高くなることがあります。
シングルゾーンのプロビジョンド スループットを購入する
シングルゾーン プロビジョンド スループットの購入については、 Google Cloud アカウント担当者にお問い合わせください。