このページでは、プロビジョンド スループットを定期購入する前に考慮すべき詳細、プロビジョンド スループットの注文やその表示に必要な権限、標準プロビジョンド スループットの注文とその表示の手順について説明します。
単一ゾーンのプロビジョンド スループットを購入する場合は、 Google Cloud アカウント担当者にお問い合わせください。シングルゾーン プロビジョンド スループットの詳細については、シングルゾーン プロビジョンド スループットをご覧ください。
購入前に考慮すべきこと
プロビジョンド スループットを購入するかどうかを判断する際は、次の点を考慮してください。
期間の途中で注文をキャンセルすることはできません。
プロビジョンド スループットの購入はコミットメントであるため、期間中に注文をキャンセルすることはできません。ただし、購入した GSU の数は増やすことができます。コミットメントを誤って購入した場合や、構成に問題がある場合は、Google Cloud アカウント担当者にお問い合わせください。
サブスクリプションは自動更新できます。
注文を送信する際に、サブスクリプションの期間の終了時に自動更新するか、サブスクリプションを終了するかを選択できます。自動更新プロセスはキャンセルできます。自動更新の前にサブスクリプションをキャンセルするには、次の期間の開始の 30 日前までに自動更新をキャンセルしてください。
月単位のサブスクリプションは、毎月自動的に更新するように設定できます。週単位のプランでは自動更新はサポートされていません。
詳細については、プロビジョンド スループットの注文を変更するをご覧ください。 Google Cloud アカウント担当者にお問い合わせいただくこともできます。
自動更新の動作、モデル、モデル バージョン、リージョンは、通知の送信後に変更されます。
プロジェクト、リージョン、モデル、モデル バージョン、自動更新の動作を選択して注文が承認され、有効になると、プロビジョンド スループットが有効になります(使用可能な容量が上限となります)。自動更新の動作、モデル、モデル バージョン、リージョンを変更するには、 Google Cloud コンソールを使用して既存のプロビジョニングされたスループットの注文を変更します。
すべての変更はベスト エフォートに基づいて処理され、通常は最初のリクエストから 10 営業日以内に完了します。
モデルの変更は特定のパブリッシャーに限定されます。たとえば、プロビジョニングされたスループットのモデル割り当てを Google Gemini 2.0 Pro から Google Gemini 2.0 Flash に切り替えることはできますが、Google Gemini 2.0 Flash から Anthropic の Claude 3.5 Sonnet v2 に切り替えることはできません。
デフォルトでは、超過分は従量課金制で請求されます。
スループットがプロビジョンド スループットの注文量を超えると、超過分は標準の従量課金制で処理され、請求されます。超過分はリクエストごとに制御できます。詳細については、プロビジョンド スループットを使用するをご覧ください。
料金については、プロビジョンド スループットをご覧ください。
プレビュー モデルのプロビジョンド スループットを購入する
モデルの一般提供バージョンがリリースされていない場合は、プレビュー版の Google モデルのプロビジョニングされたスループットを購入できます。
プレビュー版モデルのプロビジョンド スループットの注文が有効で、モデルの一般提供版がリリースされた場合は、次のいずれかを行うことができます。
モデルの一般提供版に注文を移動します。注文を一般提供モデルに移行した後は、注文をプレビュー モデルに戻すことはできません。注文の変更の詳細については、プロビジョンド スループットの注文を変更するをご覧ください。
または、プレビュー版が安定している限り、モデルのプレビュー版でプロビジョンド スループットを引き続き使用します。安定版モデルと廃止されたモデルの詳細については、モデルのバージョンとライフサイクルをご覧ください。
ロールと権限
次のロールは、Vertex AI プロビジョンド スループットの管理に対する完全なアクセス権を付与します。
roles/aiplatform.provisionedThroughputAdmin
: Vertex AI プロビジョンド スループット リソースにアクセスできます。
このロールには次の権限が含まれます。
権限 | 説明 |
---|---|
aiplatform.googleapis.com/provisionedThroughputs.create |
新しいプロビジョンド スループットの注文を送信します。 |
aiplatform.googleapis.com/provisionedThroughputs.get |
特定のプロビジョンド スループットの注文を表示します。 |
aiplatform.googleapis.com/provisionedThroughputs.list |
プロビジョンド スループットの注文をすべて表示します。 |
aiplatform.googleapis.com/provisionedThroughputs.update |
プロビジョンド スループットの注文を変更します。 |
aiplatform.googleapis.com/provisionedThroughputs.cancel |
保留中の注文または保留中の更新をキャンセルします。 |
標準のプロビジョンド スループットを注文する
Imagen の一部の機能は一般公開されていない場合があります。詳細については、制限付き一般提供とプレビュー版の機能をご覧ください。
MedLM-large-1.5 を使用する注文を行う前に、 Google Cloud アカウント担当者に連絡してアクセスをリクエストしてください。
QPM が 30,000 を超えると予想される場合は、プロビジョンド スループットの注文を最大化するために、次の情報を使用してデフォルトの Vertex AI システム割り当ての割り当て調整をリクエストします。
- サービス: Vertex AI API。
- 名前:
Online prediction requests per minute per region
- サービスタイプ: 割り当て。
- ディメンション: プロビジョンド スループットを注文したリージョン。
- 値: 選択したオンライン予測トラフィックの上限。
プロビジョニングされたスループットの注文は、注文のサイズと利用可能な容量に基づいて処理されます。リクエストされた GSU の数と利用可能な容量によっては、注文の処理に数分から数週間かかることがあります。プロビジョンド スループットの注文時に、生成 AI スケール ユニットの見積もりツールを使用して、購入する必要がある GSU の数を計算できます。見積もりを確認した後、見積もりを進めるか、購入する GSU の数を変更できます。
標準のプロビジョンド スループットを購入する手順は次のとおりです。シングルゾーン プロビジョンド スループットの購入については、 Google Cloud アカウント担当者にお問い合わせください。
コンソール
- Google Cloud コンソールで、[プロビジョンド スループット] ページに移動します。
- 新しい注文を開始するには、[新しい注文] をクリックします。
- 注文名を入力します。
- モデルを選択します。
- リージョンを選択します。
- [見積もりツール] をクリックします。
[生成 AI スケール ユニット見積もりツール] ペインで、次の手順に沿って必要な GSU の数を見積もります。
- モデルを選択します。
選択したモデルに基づいて、必要な GSU の数を推定するための詳細を入力します。各モデルの GSU の最小購入額と購入単位については、サポートされているモデルをご覧ください。モデルの機能と入出力の制限については、モデルのドキュメントをご覧ください。
Gemini 2.5 Pro モデルと Gemini 2.5 Flash モデルの場合は、次のように入力します。
- 保証が必要な推定秒間クエリ数
- クエリあたりの入力テキスト トークン数
- クエリあたりの入力画像トークン数
- クエリあたりの入力動画トークン数
- クエリあたりの入力音声トークン数
- クエリあたりの出力レスポンス テキスト トークン数
- クエリあたりの出力推論テキスト トークン数
- クエリあたりの出力画像数(Gemini 2.5 Flash Image プレビューにのみ適用)
Gemini 2.5 Flash with Live API モデルの場合は、次のように入力します。
- 保証が必要な推定秒間クエリ数
- クエリあたりの入力トークン数
- クエリあたりの入力音声トークン数
- クエリあたりの入力動画トークン数
- クエリあたりの入力セッション メモリトークン数
- クエリあたりの出力テキスト トークン数
- クエリあたりの出力音声トークン数
Gemini 2.5 Flash-Lite モデルの場合は、次のように入力します。
- 保証が必要な推定秒間クエリ数
- クエリあたりの入力テキスト トークン数
- クエリあたりの入力画像トークン数
- クエリあたりの入力動画トークン数
- クエリあたりの入力音声トークン数
- クエリあたりの出力レスポンス テキスト トークン数
- クエリあたりの出力推論テキスト トークン数
Gemini 2.0 Flash モデルと Gemini 2.0 Flash-Lite モデルの場合は、次のように入力します。
- 保証が必要な推定秒間クエリ数
- クエリあたりの入力トークン数
- クエリあたりの入力画像トークン数
- クエリあたりの入力動画トークン数
- クエリあたりの入力音声トークン数
- クエリあたりの出力テキスト トークン数
Veo 3 モデルと Veo 3 Fast モデルの場合は、次のように入力します。
- 保証が必要な推定秒間クエリ数
- クエリあたりの出力動画の秒数
- クエリあたりの出力動画と音声の秒数
Imagen モデルの場合は、次のように入力します。
- 秒間クエリ数
- クエリあたりの出力画像数
[GSU の見積もりと月額料金] セクションで、必要な GSU の見積もり数と料金を確認します。
[Use calculated](計算値を使用)をクリックします。
省略可: [月あたりの生成 AI スケール ユニット(GSU)数] を変更します。
期間を選択します。期間料金は、その期間中はキャンセルできません。また、実際の使用状況に関係なく、モデルが廃止された場合でも支払いが発生します。廃止日までに、割り当てられたモデルを変更することをおすすめします。廃止モデルの自動更新が事前にキャンセルされることはありません。
次のオプションが用意されています。
- 1 週間
- 1 か月
- 3 か月
- 1 年
省略可: 期間の開始日時(プレビュー)を選択します。
注文から 2 週間以内の開始日時を指定できます。開始日時を指定しない場合、容量が確保でき次第、注文が処理されます。リクエストされた開始日時は、ベスト エフォート方式で処理されます。また、注文のステータスが [承認済み] に設定されるまでは、注文がこれらの日時までに処理されるとは限りません。
リクエストした開始日が現在の日付に近すぎる場合、注文が承認されて有効化されるまでにリクエストした開始日を過ぎてしまうことがあります。この場合、選択した期間の長さに基づいて、有効化日から終了日が調整されます。保留中の注文のキャンセルについては、プロビジョンド スループットの注文を変更するをご覧ください。
[更新] リストで、期間の終了時に注文を自動更新するかどうかを指定します。更新オプションを指定できるのは、期間として [1 か月]、[3 か月]、[1 年] のいずれかを選択した場合のみです。
[続行] をクリックします。
[確認して送信] セクションで、注文の価格とスループットの見積もりを確認します。フォームに記載されている利用規約とリンク先の利用規約をお読みください。
注文を確定して送信するには、[注文確認] フィールドに「
CONFIRM
」と入力し、[注文を送信] をクリックします。注文の処理には、注文の数量と利用可能な容量に応じて、数分から数週間かかることがあります。注文が処理されると、 Google Cloud コンソールのステータスが [有効] に変わります。注文が有効になってから、請求が行われます。
標準のプロビジョンド スループットの注文を変更する
次の表に、注文のステータスと既存の条件に基づいて、Google Cloud コンソールでプロビジョンド スループットの注文を変更する方法を示します。注文の変更はプレビュー機能であり、コンソールからオンラインで注文した場合にのみ使用できます。オフライン注文の変更については、Google Cloud アカウント担当者にお問い合わせください。
また、 Google Cloud コンソールを使用してモデルまたはモデル バージョンを変更すると、既存の注文が変更されますが、サブスクリプションの終了日は同じままになります。
注文ステータス | アクション | 注 | Google Cloud コンソールでの手順 |
---|---|---|---|
確認待ち | 注文をキャンセルできます。 |
注文内容をさらに変更する場合は、保留中の注文をキャンセルして、新たに注文してください。 複数のモデルがある場合、各モデルに同時に設定できる保留中の注文の変更または保留中の注文は 1 つのみです。 |
Google Cloud コンソールで保留中の注文をキャンセルする手順は次のとおりです。
|
承認済み | 注文を変更することはできません。 | 注文は有効化待ちです。 現時点では、注文を変更することはできません。 | 該当なし |
有効 |
次の変更は、注文が 5 日以内に期限切れにならない場合、または自動更新される場合にのみ行うことができます。
|
有効期限が 5 日未満で、自動更新が設定されていない有効な注文は変更できません。 | Google Cloud コンソールで有効な注文を変更するには、次のいずれかの方法を使用します。
|
注文ステータスを確認
プロビジョンド スループットの注文を送信すると、注文ステータスが次のいずれかになります。
- 審査待ち: 注文は完了しています。承認は、注文をプロビジョニングするための利用可能な容量に依存するため、注文は審査/ 承認待ち状態になります。保留中の注文のステータスについて詳しくは、 Google Cloud アカウント担当者にお問い合わせください。
- 承認済み: Google が注文を承認しました。注文は有効化待ちです。注文が承認された後は変更できません。
- 有効: Google が注文を有効にしました。請求が開始されます。
- 期限切れ: 注文の有効期限が切れています。
標準のプロビジョンド スループットの注文を表示する
プロビジョンド スループットの注文を表示する手順は次のとおりです。
コンソール
- Google Cloud コンソールで、[プロビジョンド スループット] ページに移動します。
- リージョンを選択します。注文のリストが表示されます。