La tabella seguente mette a confronto i tipi di endpoint supportati per la pubblicazione delle previsioni online di Vertex AI e indica quali tipi sono consigliati come best practice.
Endpoint pubblico dedicato (consigliato) | Endpoint pubblico | Endpoint Private Service Connect (consigliato) | Endpoint privato | |
---|---|---|---|---|
Finalità | Esperienza di networking predefinita. Consente di inviare richieste da internet pubblico (se i Controlli di servizio VPC non sono abilitati). | Esperienza di networking predefinita. Consente di inviare richieste da internet pubblico (se i Controlli di servizio VPC non sono abilitati). | Consigliata per le applicazioni aziendali di produzione. Migliora la latenza e la sicurezza della rete garantendo che le richieste e le risposte vengano inoltrate in privato. | Consigliata per le applicazioni aziendali di produzione. Migliora la latenza e la sicurezza della rete garantendo che le richieste e le risposte vengano inoltrate in privato. |
Networking in entrata | Rete internet pubblica che utilizza un piano di rete dedicato | Rete internet pubblica che utilizza un piano di networking condiviso | Rete privata che utilizza l'endpoint Private Service Connect | Networking privato con accesso privato ai servizi (peering di reti VPC) |
Networking in uscita | Rete internet pubblica | Rete internet pubblica | Non supportata | Networking privato con accesso privato ai servizi (peering di reti VPC) |
Controlli di servizio VPC | Non supportato. Utilizza invece l'endpoint Private Service Connect. | Supportato | Supportato | Supportato |
Costo | Vertex AI Prediction | Vertex AI Prediction | Vertex AI Prediction + endpoint Private Service Connect | Vertex AI Prediction + accesso ai servizi privati (vedi "Utilizzo di un endpoint di Private Service Connect (regola di inoltro) per accedere a un servizio pubblicato") |
Latenza di rete | Ottimizzata | Non ottimizzato | Ottimizzata | Latenza P50 inferiore, latenza P99 (coda) superiore |
Crittografia dei dati in transito | TLS con certificato firmato dall'autorità di certificazione | TLS con certificato firmato dall'autorità di certificazione | TLS facoltativo con certificato autofirmato | Nessuno |
Timeout di inferenza | Configurabile fino a 1 ora | 60 secondi | Configurabile fino a 1 ora | 60 secondi |
Limite di dimensioni del payload | 10 MB | 1,5 MB | 10 MB | 10 MB |
Quota QPM | Illimitato | 30.000 | Illimitato | Illimitato |
Supporto del protocollo | HTTP o gRPC | HTTP | HTTP o gRPC | HTTP |
Supporto per lo streaming | Sì (SSE) | No | Sì (SSE) | No |
Suddivisione traffico | Sì | Sì | Sì | No |
Log di richieste e risposte | Sì | Sì | Sì | No |
Logging degli accessi | Sì | Sì | Sì | No |
Modelli AutoML e spiegabilità | No | Sì | No | No |