エンドポイントのタイプを選択する

次の表に、Vertex AI オンライン予測のサービングでサポートされているエンドポイント タイプを比較し、ベスト プラクティスとして推奨されるタイプを示します。

専用パブリック エンドポイント(推奨) パブリック エンドポイント Private Service Connect エンドポイント(推奨) プライベート エンドポイント
目的 デフォルトのネットワーキング エクスペリエンス。パブリック インターネットからのリクエストの送信を有効にします(VPC Service Controls が有効になっていない場合)。 デフォルトのネットワーキング エクスペリエンス。パブリック インターネットからのリクエストの送信を有効にします(VPC Service Controls が有効になっていない場合)。 本番環境のエンタープライズ アプリケーションに推奨されます。リクエストとレスポンスがプライベートにルーティングされるようにすることで、ネットワーク レイテンシとセキュリティを向上させます。 本番環境のエンタープライズ アプリケーションに推奨されます。リクエストとレスポンスがプライベートにルーティングされるようにすることで、ネットワーク レイテンシとセキュリティを向上させます。
インバウンド ネットワーキング 専用のネットワーキング プレーンを使用する公共インターネット 共有ネットワーキング プレーンを使用する公共インターネット Private Service Connect エンドポイントを使用したプライベート ネットワーキング プライベート サービス アクセス(VPC ネットワーク ピアリング)を使用したプライベート ネットワーキング
アウトバウンド ネットワーキング 公共のインターネット 公共のインターネット 非対応 プライベート サービス アクセス(VPC ネットワーク ピアリング)を使用したプライベート ネットワーキング
VPC Service Controls サポートされていません。代わりに Private Service Connect エンドポイントを使用します。 サポート対象 サポート対象 サポート対象
費用 Vertex AI Prediction Vertex AI Prediction Vertex AI Prediction + Private Service Connect エンドポイント Vertex AI Prediction + プライベート サービス アクセス(「Private Service Connect エンドポイント(転送ルール)を使用して、公開済みのサービスにアクセスする」をご覧ください)
ネットワーク レイテンシ 最適化 最適化なし 最適化 P50 レイテンシが低く、P99(テール)レイテンシが高い
転送データの暗号化 CA 署名付き証明書を使用した TLS CA 署名付き証明書を使用した TLS 自己署名証明書を使用した TLS(省略可) なし
推論のタイムアウト 構成可能(最大 1 時間) 60 秒 構成可能(最大 1 時間) 60 秒
ペイロード サイズの上限 10 MB 1.5 MB 10 MB 10 MB
QPM の割り当て 無制限 30,000 無制限 無制限
プロトコル サポート HTTP または gRPC HTTP HTTP または gRPC HTTP
ストリーミングのサポート はい(SSE) いいえ はい(SSE) いいえ
トラフィック分割 はい いいえ
リクエストとレスポンスのロギング はい いいえ
アクセス ロギング はい いいえ
AutoML モデルと説明可能性 いいえ いいえ いいえ