Le tableau suivant compare les types de points de terminaison compatibles pour la diffusion des prédictions en ligne Vertex AI et indique les types recommandés en tant que bonnes pratiques.
Point de terminaison public dédié (recommandé) | Point de terminaison public | Point de terminaison Private Service Connect (recommandé) | Point de terminaison privé | |
---|---|---|---|---|
Objectif | Expérience réseau par défaut. Active l'envoi de requêtes depuis Internet public (si VPC Service Controls n'est pas activé). | Expérience réseau par défaut. Permet d'envoyer des requêtes depuis Internet public (si VPC Service Controls n'est pas activé). | Recommandé pour les applications d'entreprise de production. Améliore la latence et la sécurité du réseau en veillant à ce que les requêtes et les réponses soient acheminées de manière privée. | Recommandé pour les applications d'entreprise de production. Améliore la latence et la sécurité du réseau en veillant à ce que les requêtes et les réponses soient acheminées de manière privée. |
Mise en réseau entrante | Internet public utilisant un plan de mise en réseau dédié | Internet public utilisant un plan de réseautage partagé | Mise en réseau privée à l'aide d'un point de terminaison Private Service Connect | Mise en réseau privée à l'aide de l'accès aux services privés (appairage de réseaux VPC) |
Mise en réseau sortante | Internet public | Internet public | Non compatible | Mise en réseau privée à l'aide de l'accès aux services privés (appairage de réseaux VPC) |
VPC Service Controls | Non compatible Utilisez plutôt un point de terminaison Private Service Connect. | Compatible | Compatible | Compatible |
Coût | Vertex AI Prediction | Vertex AI Prediction | Vertex AI Prediction + point de terminaison Service Connect privé | Prédiction Vertex AI + Accès aux services privés (voir "Utiliser un point de terminaison Private Service Connect (règle de transfert) pour accéder à un service publié") |
Latence du réseau | Optimisé | Non optimisé | Optimisé | Latence P50 plus faible, latence P99 (queue) plus élevée |
Chiffrement en transit | TLS avec certificat signé par une autorité de certification | TLS avec certificat signé par une autorité de certification | TLS facultatif avec certificat autosigné | Aucun |
Délai d'expiration de l'inférence | Configurable jusqu'à une heure | 60 secondes | Configurable jusqu'à une heure | 60 secondes |
Limite de taille de la charge utile | 10 Mo | 1,5 Mo | 10 Mo | 10 Mo |
Quota de RPM | Illimité | 30 000 | Illimité | Illimité |
Compatibilité avec le protocole | HTTP ou gRPC | HTTP | HTTP ou gRPC | HTTP |
Prise en charge du streaming | Oui (SSE) | Non | Oui (SSE) | Non |
Répartition du trafic | Oui | Oui | Oui | Non |
Journalisation des requêtes et réponses | Oui | Oui | Oui | Non |
La journalisation des accès | Oui | Oui | Oui | Non |
Modèles AutoML et explicabilité | Non | Oui | Non | Non |