デプロイとエンドポイント

Vertex AI の Google モデルとパートナー モデル、生成 AI 機能は、特定のリージョン エンドポイントとグローバル エンドポイントとして公開されます。グローバル エンドポイントは世界全体をカバーし、単一リージョンよりも高い可用性と信頼性を提供します。

モデル エンドポイントは、リージョンの可用性やリージョン内の ML 処理を保証するものではありません。データ所在地については、データ所在地をご覧ください。

グローバル エンドポイント

リクエストにグローバル エンドポイントを選択すると、全体的な可用性が向上し、リソース不足(429)エラーを減らすことができます。ML 処理の要件がある場合は、グローバル エンドポイントを使用しないでください。リクエストが行われたときに ML 処理リクエストが送信されるリージョンを制御または把握できないためです。

サポートされているモデル

グローバル エンドポイントの使用は、指定されたリージョンの次の Google モデルでサポートされています。グローバル エンドポイントをサポートしているリージョンの詳細については、Google モデルのエンドポイントのロケーションの表の [グローバル] タブをご覧ください。

パートナー モデルのグローバル エンドポイントの可用性については、Google Cloud パートナー モデルのエンドポイントのロケーションの表の [グローバル] タブをご覧ください。

グローバル エンドポイントを使用する

グローバル エンドポイントを使用するには、エンドポイント名からロケーションを除外し、リソースのロケーションを global に構成します。たとえば、次の URL はグローバル エンドポイント URL です。

https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent

Google Gen AI SDK の場合は、global ロケーションを使用するクライアントを作成します。

client = genai.Client(
    vertexai=True, project='PROJECT_ID', location='global'
)

Vertex AI SDK for Python の場合は、global のロケーションを使用して SDK を初期化します。

import vertexai
from vertexai.generative_models import GenerativeModel

vertexai.init(project='PROJECT_ID', location='global')

制限事項

グローバル エンドポイントを使用する場合、次の機能は使用できません。

  • チューニング
  • バッチ予測
  • 検索拡張生成(RAG)コーパス(RAG リクエストがサポートされています)

プロビジョンド スループットでのグローバル エンドポイントの使用は、次のモデルでのみ可能です。

モデル サポートされている最新のモデル バージョン
Gemini 2.5 Flash 画像プレビュー(プレビュー gemini-2.5-flash-image-preview
Gemini 2.5 Flash-Lite gemini-2.5-flash-lite
Gemini 2.5 Pro gemini-2.5-pro
Gemini 2.5 Flash gemini-2.5-flash
Gemini 2.0 Flash gemini-2.0-flash-001
Gemini 2.0 Flash-Lite gemini-2.0-flash-lite-001

Google モデル エンドポイントのロケーション

Vertex AI の生成 AI の Google モデル エンドポイントは、次のリージョンで利用できます。

米国

コロンバス、オハイオ州(us-east5) ダラス、テキサス州(us-south1) アイオワ(us-central1) ラスベガス、ネバダ州(us-west4) モンクスコーナー、サウスカロライナ州(us-east1) 北バージニア(us-east4) オレゴン(us-west1)
Gemini 2.5 Flash
gemini-2.5-flash
Gemini 2.5 Pro
gemini-2.5-pro
Gemini 2.5 Flash-Lite
gemini-2.5-flash-lite
Gemini 2.0 Flash
gemini-2.0-flash-001
Gemini 2.0 Flash
gemini-2.0-flash-001
Gemini 2.0 Flash-Lite
gemini-2.0-flash-lite-001
Gemini 1.5 Pro
gemini-1.5-pro-002
Gemini 1.5 Flash
gemini-1.5-flash-002
Gemini エンベディング
gemini-embedding-001
テキスト用エンベディング
マルチモーダル エンベディング
キャプションと VQA 用の Imagen
Imagen
(imagegeneration@002)
Imagen 2
imagegeneration@005
Imagen 2
imagegeneration@006
Imagen 3
imagen-3.0-generate-001
Imagen 3 Fast
imagen-3.0-fast-generate-001
Imagen 3 の編集とカスタマイズ
imagen-3.0-capability-001
Imagen 3
imagen-3.0-generate-002
Imagen 4
imagen-4.0-generate-001
Imagen 4
imagen-4.0-fast-generate-001
Imagen 4 Ultra Generate(試験運用版)
imagen-4.0-ultra-generate-001
Veo 2
veo-2.0-generate-001
Veo 3
veo-3.0-generate-001
Veo 3 Fast
veo-3.0-fast-generate-001
Veo 3(プレビュー)
veo-3.0-generate-preview
Veo 3 Fast(プレビュー)
veo-3.0-fast-generate-preview

カナダ

モントリオール(northamerica-northeast1)
Gemini 2.5 Flash
gemini-2.5-flash
*
Gemini 2.5 Pro
gemini-2.5-pro
Gemini 2.5 Flash-Lite
gemini-2.5-flash-lite
Gemini 2.0 Flash
gemini-2.0-flash-001
Gemini 2.0 Flash-Lite
gemini-2.0-flash-lite-001
Gemini 1.5 Pro
gemini-1.5-pro-002
Gemini 1.5 Flash
gemini-1.5-flash-002
Gemini エンベディング
gemini-embedding-001
テキスト用エンベディング
マルチモーダル エンベディング
キャプションと VQA 用の Imagen
Imagen
(imagegeneration@002)
Imagen 2
imagegeneration@005
Imagen 2
imagegeneration@006
Imagen 3
imagen-3.0-generate-001
Imagen 3 Fast
imagen-3.0-fast-generate-001
Imagen 3 の編集とカスタマイズ
imagen-3.0-capability-001
Imagen 3
imagen-3.0-generate-002
Imagen 4
imagen-4.0-generate-001
Imagen 4
imagen-4.0-fast-generate-001
Imagen 4 Ultra Generate(試験運用版)
imagen-4.0-ultra-generate-001

南アメリカ

サンパウロ、ブラジル(southamerica-east1)
Gemini 2.5 Flash
gemini-2.5-flash
Gemini 2.5 Pro
gemini-2.5-pro
Gemini 2.5 Flash-Lite
gemini-2.5-flash-lite
Gemini 2.0 Flash
gemini-2.0-flash-001
Gemini 2.0 Flash-Lite
gemini-2.0-flash-lite-001
Gemini 1.5 Pro
gemini-1.5-pro-002
Gemini 1.5 Flash
gemini-1.5-flash-002
Gemini エンベディング
gemini-embedding-001
テキスト用エンベディング
マルチモーダル エンベディング
キャプションと VQA 用の Imagen
Imagen
(imagegeneration@002)
Imagen 2
imagegeneration@005
Imagen 2
imagegeneration@006
Imagen 3
imagen-3.0-generate-001
Imagen 3 Fast
imagen-3.0-fast-generate-001
Imagen 3 の編集とカスタマイズ
imagen-3.0-capability-001
Imagen 3
imagen-3.0-generate-002
Imagen 4
imagen-4.0-generate-001
Imagen 4
imagen-4.0-fast-generate-001
Imagen 4 Ultra Generate(試験運用版)
imagen-4.0-ultra-generate-001

ヨーロッパ

オランダ(europe-west4) パリ、フランス(europe-west9) ロンドン、英国(europe-west2) フランクフルト、ドイツ(europe-west3) ベルギー(europe-west1) チューリッヒ、スイス(europe-west6) マドリッド、スペイン(europe-southwest1) ミラノ、イタリア(europe-west8) フィンランド(europe-north1) ワルシャワ、ポーランド(europe-central2)
Gemini 2.5 Flash
gemini-2.5-flash
+ * *
Gemini 2.5 Pro
gemini-2.5-pro
Gemini 2.5 Flash-Lite
gemini-2.5-flash-lite
Gemini 2.0 Flash
gemini-2.0-flash-001
Gemini 2.0 Flash-Lite
gemini-2.0-flash-lite-001
Gemini 1.5 Pro
gemini-1.5-pro-002
Gemini 1.5 Flash
gemini-1.5-flash-002
Gemini エンベディング
gemini-embedding-001
テキスト用エンベディング
マルチモーダル エンベディング
キャプションと VQA 用の Imagen
Imagen
(imagegeneration@002)
Imagen 2
imagegeneration@005
Imagen 2
imagegeneration@006
Imagen 3
imagen-3.0-generate-001
Imagen 3 Fast
imagen-3.0-fast-generate-001
Imagen 3 の編集とカスタマイズ
imagen-3.0-capability-001
Imagen 3
imagen-3.0-generate-002
Imagen 4
imagen-4.0-generate-001
Imagen 4
imagen-4.0-fast-generate-001
Imagen 4 Ultra Generate(試験運用版)
imagen-4.0-ultra-generate-001

アジア太平洋

東京、日本(asia-northeast1) シドニー、オーストラリア(australia-southeast1) シンガポール(asia-southeast1) ソウル、韓国(asia-northeast3) 台湾(asia-east1) 香港、中国(asia-east2) ムンバイ、インド(asia-south1)
Gemini 2.5 Flash
gemini-2.5-flash
* * * * *
Gemini 2.5 Pro
gemini-2.5-pro
Gemini 2.5 Flash-Lite
gemini-2.5-flash-lite
Gemini 2.0 Flash
gemini-2.0-flash-001
Gemini 2.0 Flash-Lite
gemini-2.0-flash-lite-001
Gemini 1.5 Pro
gemini-1.5-pro-002
Gemini 1.5 Flash
gemini-1.5-flash-002
Gemini エンベディング
gemini-embedding-001
テキスト用エンベディング
マルチモーダル エンベディング
キャプションと VQA 用の Imagen
Imagen
(imagegeneration@002)
Imagen 2
imagegeneration@005
Imagen 2
imagegeneration@006
Imagen 3
imagen-3.0-generate-001
Imagen 3 Fast
imagen-3.0-fast-generate-001
Imagen 3 の編集とカスタマイズ
imagen-3.0-capability-001
Imagen 3
imagen-3.0-generate-002
Imagen 4
imagen-4.0-generate-001
Imagen 4
imagen-4.0-fast-generate-001
Imagen 4 Ultra Generate(試験運用版)
imagen-4.0-ultra-generate-001

中東

ダンマーム、サウジアラビア(me-central2) ドーハ、カタール(me-central1) テルアビブ、イスラエル(me-west1)
Gemini 2.5 Flash
gemini-2.5-flash
Gemini 2.5 Pro
gemini-2.5-pro
Gemini 2.5 Flash-Lite
gemini-2.5-flash-lite
Gemini 2.0 Flash
gemini-2.0-flash-001
Gemini 2.0 Flash-Lite
gemini-2.0-flash-lite-001
Gemini 1.5 Pro
gemini-1.5-pro-002
Gemini 1.5 Flash
gemini-1.5-flash-002
Gemini エンベディング
gemini-embedding-001
テキスト用エンベディング
マルチモーダル エンベディング
キャプションと VQA 用の Imagen
Imagen
(imagegeneration@002)
Imagen 2
imagegeneration@005
Imagen 2
imagegeneration@006
Imagen 3
imagen-3.0-generate-001
Imagen 3 Fast
imagen-3.0-fast-generate-001
Imagen 3 の編集とカスタマイズ
imagen-3.0-capability-001
Imagen 3
imagen-3.0-generate-002
Imagen 4
imagen-4.0-generate-001
Imagen 4
imagen-4.0-fast-generate-001
Imagen 4 Ultra Generate(試験運用版)
imagen-4.0-ultra-generate-001

グローバル

グローバル(グローバル)
Gemini 2.5 Flash
gemini-2.5-flash
Gemini 2.5 Pro
gemini-2.5-pro
Gemini 2.5 Flash-Lite
gemini-2.5-flash-lite
Gemini 2.0 Flash
gemini-2.0-flash-001
Gemini 2.0 Flash-Lite
gemini-2.0-flash-lite-001
Gemini 1.5 Pro
gemini-1.5-pro-002
Gemini 1.5 Flash
gemini-1.5-flash-002
Gemini エンベディング
gemini-embedding-001
テキスト用エンベディング
マルチモーダル エンベディング
キャプションと VQA 用の Imagen
Imagen
(imagegeneration@002)
Imagen 2
imagegeneration@005
Imagen 2
imagegeneration@006
Imagen 3
imagen-3.0-generate-001
Imagen 3 Fast
imagen-3.0-fast-generate-001
Imagen 3 の編集とカスタマイズ
imagen-3.0-capability-001
Imagen 3
imagen-3.0-generate-002
Imagen 4
imagen-4.0-generate-001
Imagen 4
imagen-4.0-fast-generate-001
Imagen 4 Ultra Generate(試験運用版)
imagen-4.0-ultra-generate-001

* リージョンは、シングルゾーン プロビジョンド スループットの使用中にのみ使用できます。このリージョンでは、教師ありファインチューニングはサポートされていません。

+ このリージョンでは、教師ありファインチューニングはサポートされていません。

Google Cloud パートナー モデル エンドポイントのロケーション

Google は、指定したリージョンからリクエストを処理します。一部のモデルでは、全体的な可用性を向上させ、エラー率を低減するために、グローバル エンドポイントも提供しています。グローバル エンドポイントには、リージョン エンドポイントとは別の割り当てセットを設定できます。また、データ所在地要件はサポートされていません。詳細については、 MaaS 用の Vertex AI パートナー モデルの「リージョン エンドポイントとグローバル エンドポイント」セクションをご覧ください。

Vertex AI の生成 AI のパートナー モデル エンドポイントは、次のリージョンで利用できます。

米国

コロンバス、オハイオ州(us-east5) ダラス、テキサス州(us-south1) アイオワ(us-central1) ラスベガス、ネバダ州(us-west4) モンクスコーナー、サウスカロライナ州(us-east1) 北バージニア(us-east4) オレゴン(us-west1)
Anthropic の Claude Opus 4.1
Anthropic の Claude Opus 4
Anthropic の Claude Sonnet 4
Anthropic の Claude 3.7 Sonnet
Anthropic の Claude 3.5 Haiku
Anthropic の Claude 3 Haiku
DeepSeek R1(0528)
Llama 4 Maverick 17B-128E(プレビュー)
Llama 4 Scout 17B-16E(プレビュー)
Llama 3.3 70B(プレビュー)
Llama 3.2 90B(プレビュー)
Llama 3.1 405B
Llama 3.1 70B(プレビュー)
Llama 3.1 8B(プレビュー)
Mistral OCR(25.05)
Mistral Small 3.1(25.03)
Mistral Large
Codestral

ヨーロッパ

オランダ(europe-west4) ベルギー(europe-west1)
Anthropic の Claude Opus 4.1
Anthropic の Claude Opus 4
Anthropic の Claude Sonnet 4
Anthropic の Claude 3.7 Sonnet
Anthropic の Claude 3.5 Haiku
Anthropic の Claude 3 Haiku
DeepSeek R1(0528)
Llama 4 Maverick 17B-128E(プレビュー)
Llama 4 Scout 17B-16E(プレビュー)
Llama 3.3 70B(プレビュー)
Llama 3.2 90B(プレビュー)
Llama 3.1 405B
Llama 3.1 70B(プレビュー)
Llama 3.1 8B(プレビュー)
Mistral OCR(25.05)
Mistral Small 3.1(25.03)
Mistral Large
Codestral

アジア太平洋

シンガポール(asia-southeast1) 台湾(asia-east1)
Anthropic の Claude Opus 4.1
Anthropic の Claude Opus 4
Anthropic の Claude Sonnet 4
Anthropic の Claude 3.7 Sonnet
Anthropic の Claude 3.5 Haiku
Anthropic の Claude 3 Haiku
DeepSeek R1(0528)
Llama 4 Maverick 17B-128E(プレビュー)
Llama 4 Scout 17B-16E(プレビュー)
Llama 3.3 70B(プレビュー)
Llama 3.2 90B(プレビュー)
Llama 3.1 405B
Llama 3.1 70B(プレビュー)
Llama 3.1 8B(プレビュー)
Mistral OCR(25.05)
Mistral Small 3.1(25.03)
Mistral Large
Codestral

グローバル

グローバル(グローバル)
Anthropic の Claude Opus 4.1
Anthropic の Claude Opus 4
Anthropic の Claude Sonnet 4
Anthropic の Claude 3.7 Sonnet
Anthropic の Claude 3.5 Haiku
Anthropic の Claude 3 Haiku
DeepSeek R1(0528)
Llama 4 Maverick 17B-128E(プレビュー)
Llama 4 Scout 17B-16E(プレビュー)
Llama 3.3 70B(プレビュー)
Llama 3.2 90B(プレビュー)
Llama 3.1 405B
Llama 3.1 70B(プレビュー)
Llama 3.1 8B(プレビュー)
Mistral OCR(25.05)
Mistral Small 3.1(25.03)
Mistral Large
Codestral

次のステップ