次の表に、Vertex AI オンライン予測のサービングでサポートされているエンドポイント タイプを比較し、ベスト プラクティスとして推奨されるタイプを示します。
専用パブリック エンドポイント(推奨) | パブリック エンドポイント | Private Service Connect エンドポイント(推奨) | プライベート エンドポイント | |
---|---|---|---|---|
目的 | デフォルトのネットワーキング エクスペリエンス。パブリック インターネットからのリクエストの送信を有効にします(VPC Service Controls が有効になっていない場合)。 | デフォルトのネットワーキング エクスペリエンス。パブリック インターネットからのリクエストの送信を有効にします(VPC Service Controls が有効になっていない場合)。 | 本番環境のエンタープライズ アプリケーションに推奨されます。リクエストとレスポンスがプライベートにルーティングされるようにすることで、ネットワーク レイテンシとセキュリティを向上させます。 | 本番環境のエンタープライズ アプリケーションに推奨されます。リクエストとレスポンスがプライベートにルーティングされるようにすることで、ネットワーク レイテンシとセキュリティを向上させます。 |
インバウンド ネットワーキング | 専用のネットワーキング プレーンを使用する公共インターネット | 共有ネットワーキング プレーンを使用する公共インターネット | Private Service Connect エンドポイントを使用したプライベート ネットワーキング | プライベート サービス アクセス(VPC ネットワーク ピアリング)を使用したプライベート ネットワーキング |
アウトバウンド ネットワーキング | 公共のインターネット | 公共のインターネット | 非対応 | プライベート サービス アクセス(VPC ネットワーク ピアリング)を使用したプライベート ネットワーキング |
VPC Service Controls | サポートされていません。代わりに Private Service Connect エンドポイントを使用します。 | サポート対象 | サポート対象 | サポート対象 |
費用 | Vertex AI Prediction | Vertex AI Prediction | Vertex AI Prediction + Private Service Connect エンドポイント | Vertex AI Prediction + プライベート サービス アクセス(「Private Service Connect エンドポイント(転送ルール)を使用して、公開済みのサービスにアクセスする」をご覧ください) |
ネットワーク レイテンシ | 最適化 | 最適化なし | 最適化 | P50 レイテンシが低く、P99(テール)レイテンシが高い |
転送データの暗号化 | CA 署名付き証明書を使用した TLS | CA 署名付き証明書を使用した TLS | 自己署名証明書を使用した TLS(省略可) | なし |
推論のタイムアウト | 構成可能(最大 1 時間) | 60 秒 | 構成可能(最大 1 時間) | 60 秒 |
ペイロード サイズの上限 | 10 MB | 1.5 MB | 10 MB | 10 MB |
QPM の割り当て | 無制限 | 30,000 | 無制限 | 無制限 |
プロトコル サポート | HTTP または gRPC | HTTP | HTTP または gRPC | HTTP |
ストリーミングのサポート | はい(SSE) | いいえ | はい(SSE) | いいえ |
トラフィック分割 | ○ | ○ | はい | いいえ |
リクエストとレスポンスのロギング | ○ | ○ | はい | いいえ |
アクセス ロギング | ○ | ○ | はい | いいえ |
AutoML モデルと説明可能性 | いいえ | ○ | いいえ | いいえ |