In der folgenden Tabelle werden die unterstützten Endpunkttypen für die Bereitstellung von Vertex AI-Onlinevorhersagen verglichen und es wird angegeben, welche Typen als Best Practices empfohlen werden.
Dedizierter öffentlicher Endpunkt (empfohlen) | Öffentlicher Endpunkt | Private Service Connect-Endpunkt (empfohlen) | Privater Endpunkt | |
---|---|---|---|---|
Zweck | Standardnetzwerkeinstellungen Ermöglicht das Senden von Anfragen aus dem öffentlichen Internet, wenn VPC Service Controls nicht aktiviert ist. | Standardnetzwerkeinstellungen Ermöglicht das Senden von Anfragen aus dem öffentlichen Internet, wenn VPC Service Controls nicht aktiviert ist. | Empfohlen für Produktionsanwendungen in Unternehmen. Verbessert die Netzwerklatenz und -sicherheit, da Anfragen und Antworten privat weitergeleitet werden. | Empfohlen für Produktionsanwendungen in Unternehmen. Verbessert die Netzwerklatenz und -sicherheit, da Anfragen und Antworten privat weitergeleitet werden. |
Eingehende Netzwerke | Öffentliches Internet mit dedizierter Netzwerkebene | Öffentliches Internet mit gemeinsam genutzter Netzwerkebene | Privates Netzwerk mit Private Service Connect-Endpunkt | Privates Netzwerk mit Zugriff auf private Dienste (VPC-Netzwerk-Peering) |
Ausgehende Daten | Öffentliches Internet | Öffentliches Internet | Nicht unterstützt | Privates Netzwerk mit Zugriff auf private Dienste (VPC-Netzwerk-Peering) |
VPC Service Controls | Nicht unterstützt. Verwenden Sie stattdessen einen Private Service Connect-Endpunkt. | Unterstützt | Unterstützt | Unterstützt |
Kosten | Vertex-AI-Prediction | Vertex-AI-Prediction | Vertex AI Prediction + Privater Service Connect-Endpunkt | Vertex AI Prediction + Zugriff auf private Dienste (siehe „Private Service Connect-Endpunkt (Weiterleitungsregel) verwenden, um auf einen veröffentlichten Dienst zuzugreifen“) |
Netzwerklatenz | Optimiert | Nicht optimiert | Optimiert | Niedrigere P50-Latenz, höhere P99-Latenz (Extremwertlatenz) |
Verschlüsselung während der Übertragung | TLS mit von einer Zertifizierungsstelle signiertem Zertifikat | TLS mit von einer Zertifizierungsstelle signiertem Zertifikat | Optionale TLS-Verschlüsselung mit selbstsigniertem Zertifikat | Keine |
Zeitlimit für Inferenz | Bis zu 1 Stunde konfigurierbar | 60 Sekunden | Bis zu 1 Stunde konfigurierbar | 60 Sekunden |
Nutzlastgrößenlimit | 10 MB | 1,5 MB | 10 MB | 10 MB |
QPM-Kontingent | Unbegrenzt | 30.000 | Unbegrenzt | Unbegrenzt |
Protokollunterstützung | HTTP oder gRPC | HTTP | HTTP oder gRPC | HTTP |
Streamingunterstützung | Ja (SSE) | Nein | Ja (SSE) | Nein |
Trafficaufteilung | Ja | Ja | Ja | Nein |
Anfrage- und Antwort-Logging | Ja | Ja | Ja | Nein |
Zugriffs-Logging | Ja | Ja | Ja | Nein |
AutoML-Modelle und Erklärbarkeit | Nein | Ja | Nein | Nein |