Una previsione è l'output di un modello addestrato di machine learning. Questa pagina fornisce una panoramica del flusso di lavoro per ottenere le previsioni dai tuoi modelli su Vertex AI.
Vertex AI offre due metodi per ottenere previsioni:
Le previsioni online sono richieste sincrone effettuate a un modello di cui è stato eseguito il deployment in un
endpoint
. Pertanto, prima di inviare una richiesta, devi prima eseguire il deployment della risorsaModel
in un endpoint. In questo modo, le risorse di calcolo vengono associate al modello in modo che possa fornire previsioni online con bassa latenza. Utilizza le predizioni online quando effettui richieste in risposta all'input dell'applicazione o in situazioni che richiedono un'inferenza tempestiva.Batch Le previsioni sono richieste asincrone effettuate a un modello che non è il deployment in un endpoint. Invii la richiesta (come
BatchPredictionsJob
risorsa) direttamente alla risorsaModel
. Utilizza le predizioni batch quando non hai bisogno di una risposta immediata e vuoi elaborare i dati accumulati utilizzando una singola richiesta.
Testa il tuo modello localmente
Prima di ottenere previsioni, è utile eseguire il deployment del modello durante la fase di sviluppo e test. In questo modo puoi eseguire l'iterazione in modo più rapido e testare il modello senza eseguirne il deployment in un endpoint online prevede costi di previsione. Il deployment locale è destinato allo sviluppo locale e test, non per i deployment di produzione.
Per eseguire il deployment di un modello in locale, utilizza l'SDK Vertex AI per Python ed esegui il deployment di un
LocalModel
in un
LocalEndpoint
.
Per una dimostrazione, consulta questo
notebook.
Anche se il client non è scritto in Python, puoi comunque utilizzare l'SDK Vertex AI per Python per avviare il contenitore e il server in modo da poter testare le richieste dal client.
Ottenere previsioni da modelli con addestramento personalizzato
Per ottenere previsioni, devi prima importare il tuo
modello. Dopo l'importazione, diventa una risorsa Model
visibile in Vertex AI Model Registry.
Poi, leggi la seguente documentazione per scoprire come ottenere le previsioni:
Passaggi successivi
- Scopri di più sulle risorse di computing per per la previsione.