Scegli un tipo di endpoint

La tabella seguente mette a confronto i tipi di endpoint supportati per la pubblicazione delle previsioni online di Vertex AI e indica quali tipi sono consigliati come best practice.

Endpoint pubblico dedicato (consigliato) Endpoint pubblico Endpoint Private Service Connect (consigliato) Endpoint privato
Finalità Esperienza di networking predefinita. Consente di inviare richieste da internet pubblico (se i Controlli di servizio VPC non sono abilitati). Esperienza di networking predefinita. Consente di inviare richieste da internet pubblico (se i Controlli di servizio VPC non sono abilitati). Consigliata per le applicazioni aziendali di produzione. Migliora la latenza e la sicurezza della rete garantendo che le richieste e le risposte vengano inoltrate in privato. Consigliata per le applicazioni aziendali di produzione. Migliora la latenza e la sicurezza della rete garantendo che le richieste e le risposte vengano inoltrate in privato.
Networking in entrata Rete internet pubblica che utilizza un piano di rete dedicato Rete internet pubblica che utilizza un piano di networking condiviso Rete privata che utilizza l'endpoint Private Service Connect Networking privato con accesso privato ai servizi (peering di reti VPC)
Networking in uscita Rete internet pubblica Rete internet pubblica Non supportata Networking privato con accesso privato ai servizi (peering di reti VPC)
Controlli di servizio VPC Non supportato. Utilizza invece l'endpoint Private Service Connect. Supportato Supportato Supportato
Costo Vertex AI Prediction Vertex AI Prediction Vertex AI Prediction + endpoint Private Service Connect Vertex AI Prediction + accesso ai servizi privati (vedi "Utilizzo di un endpoint di Private Service Connect (regola di inoltro) per accedere a un servizio pubblicato")
Latenza di rete Ottimizzata Non ottimizzato Ottimizzata Latenza P50 inferiore, latenza P99 (coda) superiore
Crittografia dei dati in transito TLS con certificato firmato dall'autorità di certificazione TLS con certificato firmato dall'autorità di certificazione TLS facoltativo con certificato autofirmato Nessuno
Timeout di inferenza Configurabile fino a 1 ora 60 secondi Configurabile fino a 1 ora 60 secondi
Limite di dimensioni del payload 10 MB 1,5 MB 10 MB 10 MB
Quota QPM Illimitato 30.000 Illimitato Illimitato
Supporto del protocollo HTTP o gRPC HTTP HTTP o gRPC HTTP
Supporto per lo streaming Sì (SSE) No Sì (SSE) No
Suddivisione traffico No
Log di richieste e risposte No
Logging degli accessi No
Modelli AutoML e spiegabilità No No No