Questo tutorial è una guida completa che mostra come utilizzare l'SDK Vertex AI per Python per creare un modello addestrato personalizzato. Il codice viene eseguito in blocco note (IPYNB) che utilizza un container Docker per addestrare e creare un modello di machine learning. Il tutorial è rivolto ai data scientist che non hanno mai utilizzato Vertex AI e con i blocchi note, Python e il flusso di lavoro di machine learning (ML).
Il processo inizia utilizzando la console Google Cloud per creare il progetto che contiene il tuo lavoro. Nel progetto, utilizzerai Vertex AI Workbench per per creare un blocco note Jupyter. L'ambiente del blocco note è il luogo in cui esegui il codice che scarica e prepara un set di dati, poi lo usa per creare e addestrare un modello. Alla fine del tutorial, il modello addestrato genera previsioni.
L'obiettivo di questo tutorial è illustrare tutti i passaggi necessari per creare predizioni in meno di un'ora. Il set di dati utilizzato è relativamente piccolo, non impiega molto tempo per addestrare il modello. Al termine, puoi applicare ciò che hai imparato a set di dati più grandi. Più grande è il set di dati, più precisa sarà la tua le previsioni.
Passaggi del tutorial
Prerequisiti: crea il tuo account e il tuo progetto Google Cloud.
Crea un blocco note - Crea e prepara un blocco note Jupyter e il relativo ambiente. Utilizzi il notebook per eseguire il codice che crea il set di dati, crea e addestra il modello e genera le previsioni.
Crea un set di dati. Scarica un set di dati pubblico. set di dati BigQuery disponibile, quindi usalo per creare un come un set di dati tabulare. Il set di dati contiene i dati che utilizzi per addestrare il modello.
Crea uno script di addestramento - Crea uno script Python che passi al job di addestramento. Lo script viene eseguito quando il job di addestramento addestra e crea il modello.
Addestra un modello: utilizza i dati tabulari per addestrare un modello ed eseguirne il deployment. Utilizza il modello per creare le tue predizioni.
Fai previsioni: utilizza il modello per creare previsioni. Questa sezione illustra anche la procedura per eliminare risorse che crei durante l'esecuzione di questo tutorial per non incorrere in inutili addebiti.
Risultati ottenuti
Questo tutorial illustra come utilizzare l'SDK Vertex AI per Python per svolgere quanto segue:
- crea un bucket Cloud Storage per archiviare un set di dati
- Pre-elabora i dati per l'addestramento
- Utilizzare i dati elaborati per creare un set di dati in BigQuery
- Utilizza il set di dati BigQuery per creare un set di dati tabulare Vertex AI
- Crea e addestra un modello con addestramento personalizzato
- esegui il deployment del modello con addestramento personalizzato su un endpoint
- Generare una previsione
- Annullare il deployment del modello
- Elimina tutte le risorse create nel tutorial per evitare ulteriori addebiti
Risorse fatturabili utilizzate
Questo tutorial utilizza risorse fatturabili associate a Vertex AI, BigQuery e i servizi Google Cloud di Cloud Storage. Se non hai mai utilizzato Google Cloud, potresti essere in grado di utilizzare uno o più di questi servizi senza costi aggiuntivi. Vertex AI offre 300 $ di crediti gratuiti ai nuovi clienti, mentre Cloud Storage e BigQuery hanno livelli gratuiti. Per ulteriori informazioni, consulta le seguenti risorse:
- Prezzi di Vertex AI e funzionalità cloud e offerta di prova gratuite
- Prezzi di BigQuery e utilizzo del livello gratuito di BigQuery
- Prezzi di Cloud Storage e utilizzo del livello gratuito di Cloud Storage
- Calcolatore prezzi di Google Cloud
Per evitare ulteriori addebiti, il passaggio finale di questo tutorial illustra rimuovendo tutte le risorse Google Cloud fatturabili che hai creato.