Crea un notebook

In questo tutorial utilizzerai l'SDK Vertex AI in un Gioia un blocco note per ottenere previsioni usando un'istanza di Vertex AI Workbench.

Questa sezione mostra come creare un blocco note Jupyter in un'istanza di Vertex AI Workbench. Le istanze Vertex AI Workbench sono ambienti di sviluppo basati su blocchi note Jupyter per l'intero flusso di lavoro di data science. Le istanze di Vertex AI Workbench sono preconfezionate con JupyterLab e dispongono di una suite preinstallata di pacchetti di deep learning, incluso il supporto per i framework TensorFlow e PyTorch. Per ulteriori informazioni, consulta la sezione Introduzione a Istanze di Vertex AI Workbench.

Dopo aver creato un blocco note in Vertex AI Workbench, esegui parti sequenziali di codice Python per svolgere la maggior parte del lavoro necessario per generare le tue predizioni.

crea un'istanza di Vertex AI Workbench

Per creare un'istanza di Vertex AI Workbench, segui questi passaggi:

  1. Nella console Google Cloud, apri il progetto Google Cloud se non è già aperto.

  2. Nella console Google Cloud, vai alla pagina Istanze di Vertex AI Workbench.

    Vai a Istanze

  3. Se viene visualizzata l'opzione per abilitare l'API Notebooks, fai clic su Abilita. Il completamento della procedura di attivazione potrebbe richiedere alcuni istanti.

  4. Fai clic su  Crea nuovo.

  5. Nella finestra di dialogo Nuova istanza, in Nome, inserisci un nome per l'istanza.

  6. In Regione, seleziona us-central1 (Iowa).

  7. In Zona, seleziona us-central1-a.

  8. Fai clic su Crea. Se vuoi saperne di più sulla tua istanza, appare nell'elenco delle istanze, fai clic sul suo nome per visualizzarne le proprietà.

Preparare il notebook

La tua istanza di Vertex AI Workbench è già autenticata in per utilizzare il tuo progetto Google Cloud. Tuttavia, devi installare e inizializzare l'SDK Vertex AI per Python. Questa sezione illustra questi passaggi.

Dopo aver creato il blocco note, lo puoi utilizzare per inserire ed eseguire snippet di codice in questo tutorial. Ogni snippet di codice deve essere eseguito singolarmente e in ordine.

Crea e apri il blocco note

Il notebook è il luogo in cui esegui il codice in questo tutorial. Si tratta di un file contenente estensione .ipynb. Quando lo crei, è senza titolo. Puoi rinominarlo dopo averlo aperto. Per creare e aprire il blocco note, segui questi passaggi:

  1. Nella console Google Cloud, vai alla pagina Istanze.

    Vai a Istanze

  2. Fai clic su Apri JupyterLab accanto al nome dell'istanza.

    L'istanza di Vertex AI Workbench apre l'ambiente JupyterLab.

  3. In JupyterLab, seleziona File > Nuovo > Notebook.

    Si apre il nuovo file del blocco note e viene visualizzata la finestra di dialogo Seleziona kernel.

  4. Nella finestra di dialogo Seleziona kernel, seleziona il kernel Python 3.

  5. Nel riquadro di navigazione a sinistra di JupyterLab, individua il nuovo blocco note, chiamato Untitled.ipynb. Per rinominarla, fai clic con il tasto destro del mouse il nome del blocco note, fai clic su Rinomina e inserisci un nuovo nome.

Installare l'SDK Vertex AI Python

Dopo aver aperto il notebook, devi installare l'SDK Vertex AI per Python. Utilizza l'SDK Vertex AI per Python per effettuare chiamate all'API Vertex AI che creano il set di dati, creano il modello, lo addestrano ed eseguono il deployment e effettuano previsioni con il modello. Per ulteriori informazioni, consulta Utilizzare l'SDK Vertex AI per Python.

Quando installi l'SDK Vertex AI per Python, altri SDK Google Cloud su cui da cui dipende l'installazione. In questo tutorial vengono utilizzati due di questi SDK:

  • Cloud Storage - Quando utilizzi l'SDK Vertex AI per Python per creare per le chiamate API di Vertex AI, Vertex AI archivia gli artefatti in nel bucket Cloud Storage. Il bucket viene chiamato bucket gestione temporanea. Devi specificare il bucket di staging quando inizializzi l'SDK Vertex AI per Python. Per ulteriori informazioni, consulta il client Python per l'API Cloud Storage di Google.

  • BigQuery: Vertex AI addestra il modello utilizzando un set di dati pubblico BigQuery. L'SDK BigQuery deve essere installato per accedere e scaricare il set di dati usato in questo tutorial. Per maggiori informazioni informazioni, consulta Client API BigQuery librerie.

Per installare l'SDK Vertex AI Python e gli SDK dipendenti, esegui il seguente codice.

# Install the Vertex AI SDK
! pip3 install --upgrade --quiet google-cloud-aiplatform

Il flag --quiet elimina l'output in modo da visualizzare solo gli errori, se presenti. Il punto esclamativo (!) indica che si tratta di un comando della shell.

Poiché questo è il primo codice che esegui nel nuovo notebook, inseriscilo nella cella di codice vuota nella parte superiore del notebook. Dopo aver inserito il codice in una cella di codice, fai clic su  Esegui le celle selezionate e vai avanti o utilizza la scorciatoia da tastiera Shift + Enter per eseguire il codice.

Esegui il codice per installare l'SDK.

Man mano che avanzi in questo tutorial, esegui il codice nella cella di codice vuota che viene visualizzata automaticamente sotto il codice eseguito più di recente. Se vuoi aggiungere manualmente una nuova cella di codice, fai clic sul pulsante  Inserisci una cella sotto del file del notebook.

Aggiungi nuova cella di codice.

Imposta l'ID progetto e la regione

In questo passaggio devi impostare l'ID progetto e la regione. Devi prima assegnarli a in modo che sia possibile farvi riferimento facilmente più avanti in questo tutorial. Successivamente, utilizza il comando gcloud config per impostarli per la sessione Google Cloud. In un secondo momento, li utilizzerai insieme all'URI del bucket Cloud Storage per inizializzare l'SDK Vertex AI per Python.

Imposta l'ID progetto

Per impostare l'ID progetto:

  1. Individua l'ID del tuo progetto Google Cloud. Per ulteriori informazioni, consulta Trovare l'ID progetto.

  2. Esegui il codice seguente in una cella di codice del tuo blocco note. Nel codice, sostituisci PROJECT_ID con l'ID progetto che hai appena individuato. L'output generato da questo comando è Updated property [core/project].

    project_id = "PROJECT_ID"  # @param {type:"string"}
    # Set the project id
    ! gcloud config set project ${project_id}
    

Imposta la regione

Questo tutorial utilizza la regione us-central1. Per impostare la regione, procedi come segue:

  1. Esegui il seguente codice per impostare la variabile region utilizzata da Vertex AI su us-central1. Questo comando non genera output. Per per ulteriori informazioni, consulta la sezione Scegliere posizione.

    region = "us-central1"  # @param {type: "string"}
    

Crea un bucket Cloud Storage

Questo tutorial richiede un bucket Cloud Storage utilizzato da Vertex AI per eseguire lo staging degli elementi. Vertex AI memorizza i dati associati al set di dati che crei e alle risorse del modello nel bucket di staging. Questi dati vengono conservati e sono disponibili in tutte le sessioni. In questo tutorial, Vertex AI archivia anche nel bucket di gestione temporanea. Specifica il bucket di staging quando inizializzi l'SDK Vertex AI per Python.

Ogni nome del bucket Cloud Storage deve essere univoco a livello globale. Se scegli un nome utilizzato, il comando per creare il bucket ha esito negativo. Il codice seguente utilizza un timestamp e il nome del progetto per creare un nome di bucket univoco. Aggiungi il nome del bucket a gs:// per creare l'URI per il tuo bucket Cloud Storage. Il comando shell echo mostra l'URI in modo da poter verificare che sia stato creato correttamente.

  1. Per impostare il nome e l'URI del bucket, esegui il seguente codice. L'ultima riga visualizza l'URI del bucket Cloud Storage.

    bucket_name = "bucket-name-placeholder"  # @param {type:"string"}
    bucket_uri = f"gs://{bucket_name}"
    
    from datetime import datetime
    timestamp = datetime.now().strftime("%Y%m%d%H%M%S")
    
    if bucket_name == "" or bucket_name is None or bucket_name == "bucket-name-placeholder":
        bucket_name = project_id + "aip-" + timestamp
        bucket_uri = "gs://" + bucket_name
    ! echo $bucket_uri
    
  2. Per creare un bucket utilizzando la libreria client Cloud Storage e l'URI del bucket, esegui il seguente codice. Questo codice non genera output.

    from google.cloud import storage
    client = storage.Client(project=project_id)
    
    # Create a bucket
    bucket = client.create_bucket(bucket_name, location=region)
    
  3. Per verificare che il bucket sia stato creato correttamente, esegui questo comando:

    print("Bucket {} created.".format(bucket.name))
    

Inizializza l'SDK Vertex AI per Python

Per inizializzare l'SDK Vertex AI per Python, devi prima importare la relativa libreria,aiplatform. A questo punto, chiami aiplatform.init e passi i valori per i seguenti parametri:

  • project: il project specifica il progetto Google Cloud da utilizzare quando si utilizza l'SDK Vertex AI per Python per effettuare chiamate all'API Vertex AI. In questo tutorial specifichi il tuo progetto Google Cloud con il relativo nome. Tu può anche specificare il progetto con il relativo numero.

  • location: il location specifica la regione Google Cloud da utilizzare quando si effettuano chiamate API. Se non specifichi una posizione, l'SDK Vertex AI per Python utilizza us-central1.

  • staging_bucket: il parametro staging_bucket specifica il bucket Cloud Storage utilizzato per eseguire lo staging degli elementi quando utilizzi l'SDK Vertex AI per Python. Tu specifica il bucket con un URI che inizia con gs://. In questo tutorial, userai l'URI creato in precedenza in Creare un bucket Cloud Storage.

Per impostare il progetto, la regione e il bucket di gestione temporanea Google Cloud, esegui . Questo comando non genera output.

from google.cloud import aiplatform

# Initialize the Vertex AI SDK
aiplatform.init(project=project_id, location=region, staging_bucket=bucket_uri)

Inizializza BigQuery

Questo tutorial utilizza un set di dati pubblico di BigQuery sui pinguini per addestrare un modello. Dopo che Vertex AI ha addestrato il modello, devi specificare i parametri rappresentano le caratteristiche dei pinguini e il modello le utilizza per prevedere la specie di pinguino che rappresentano. Per ulteriori informazioni di set di dati pubblici, consulta Set di dati pubblici BigQuery.

Prima di utilizzare il set di dati BigQuery, devi inizializzare BigQuery con l'ID progetto. Per farlo, esegui il seguente comando. Questo comando non genera output.

from google.cloud import bigquery

# Set up BigQuery client
bq_client = bigquery.Client(project=project_id)