Endpunkttyp auswählen

In der folgenden Tabelle werden die unterstützten Endpunkttypen für die Bereitstellung von Vertex AI-Onlinevorhersagen verglichen und es wird angegeben, welche Typen als Best Practices empfohlen werden.

Dedizierter öffentlicher Endpunkt (empfohlen) Öffentlicher Endpunkt Private Service Connect-Endpunkt (empfohlen) Privater Endpunkt
Zweck Standardnetzwerkeinstellungen Ermöglicht das Senden von Anfragen aus dem öffentlichen Internet, wenn VPC Service Controls nicht aktiviert ist. Standardnetzwerkeinstellungen Ermöglicht das Senden von Anfragen aus dem öffentlichen Internet, wenn VPC Service Controls nicht aktiviert ist. Empfohlen für Produktionsanwendungen in Unternehmen. Verbessert die Netzwerklatenz und -sicherheit, da Anfragen und Antworten privat weitergeleitet werden. Empfohlen für Produktionsanwendungen in Unternehmen. Verbessert die Netzwerklatenz und -sicherheit, da Anfragen und Antworten privat weitergeleitet werden.
Eingehende Netzwerke Öffentliches Internet mit dedizierter Netzwerkebene Öffentliches Internet mit gemeinsam genutzter Netzwerkebene Privates Netzwerk mit Private Service Connect-Endpunkt Privates Netzwerk mit Zugriff auf private Dienste (VPC-Netzwerk-Peering)
Ausgehende Daten Öffentliches Internet Öffentliches Internet Nicht unterstützt Privates Netzwerk mit Zugriff auf private Dienste (VPC-Netzwerk-Peering)
VPC Service Controls Nicht unterstützt. Verwenden Sie stattdessen einen Private Service Connect-Endpunkt. Unterstützt Unterstützt Unterstützt
Kosten Vertex-AI-Prediction Vertex-AI-Prediction Vertex AI Prediction + Privater Service Connect-Endpunkt Vertex AI Prediction + Zugriff auf private Dienste (siehe „Private Service Connect-Endpunkt (Weiterleitungsregel) verwenden, um auf einen veröffentlichten Dienst zuzugreifen“)
Netzwerklatenz Optimiert Nicht optimiert Optimiert Niedrigere P50-Latenz, höhere P99-Latenz (Extremwertlatenz)
Verschlüsselung während der Übertragung TLS mit von einer Zertifizierungsstelle signiertem Zertifikat TLS mit von einer Zertifizierungsstelle signiertem Zertifikat Optionale TLS-Verschlüsselung mit selbstsigniertem Zertifikat Keine
Zeitlimit für Inferenz Bis zu 1 Stunde konfigurierbar 60 Sekunden Bis zu 1 Stunde konfigurierbar 60 Sekunden
Nutzlastgrößenlimit 10 MB 1,5 MB 10 MB 10 MB
QPM-Kontingent Unbegrenzt 30.000 Unbegrenzt Unbegrenzt
Protokollunterstützung HTTP oder gRPC HTTP HTTP oder gRPC HTTP
Streamingunterstützung Ja (SSE) Nein Ja (SSE) Nein
Trafficaufteilung Ja Ja Ja Nein
Anfrage- und Antwort-Logging Ja Ja Ja Nein
Zugriffs-Logging Ja Ja Ja Nein
AutoML-Modelle und Erklärbarkeit Nein Ja Nein Nein