Aggiungere l'esecuzione della pipeline all'esperimento

Puoi utilizzare la console Google Cloud o l'SDK Vertex AI per Python per aggiungere un'esecuzione della pipeline a un esperimento o a un'esecuzione dell'esperimento.

Console Google Cloud

Segui le istruzioni riportate di seguito per eseguire una pipeline ML e associarla a un esperimento e, facoltativamente, a un esperimento eseguito utilizzando la console Google Cloud. Le esecuzioni dell'esperimento possono essere create solo tramite l'SDK Vertex AI per Python (consulta Creare e gestire le esecuzioni dell'esperimento).
  1. Nella console Google Cloud, nella sezione Vertex AI, vai alla pagina Pipeline.
    Vai a Pipeline
  2. Nell'elenco a discesa Regione, seleziona la regione in cui vuoi eseguire una pipeline.
  3. Fai clic su Crea esecuzione per aprire il riquadro Crea esecuzione pipeline.
  4. Specifica i seguenti dettagli di Esegui.
    • Nel campo File, fai clic su Scegli per aprire il selettore dei file. Vai al file JSON della pipeline compilata che vuoi eseguire, seleziona la pipeline e fai clic su Apri.
    • Il nome della pipeline predefinito è il nome specificato nella definizione della pipeline. Facoltativamente, specifica un nome della pipeline diverso.
    • Specifica un nome esecuzione per identificare in modo univoco questa esecuzione della pipeline.
  5. Per specificare che questa esecuzione della pipeline utilizza un account di servizio personalizzato, una chiave di crittografia gestita dal cliente o una rete VPC in coppia, fai clic su Opzioni avanzate (facoltativo).
    Segui le istruzioni riportate di seguito per configurare opzioni avanzate come un account di servizio personalizzato.
    • Per specificare un account di servizio, seleziona un account di servizio dall'elenco a discesa Account di servizio.
      Se non specifichi un account di servizio, Vertex AI Pipelines esegue la pipeline utilizzando l'account di servizio Compute Engine predefinito.
      Scopri di più sulla configurazione di un account di servizio da utilizzare con Vertex AI Pipelines.
    • Per utilizzare una chiave di crittografia gestita dal cliente (CMEK), seleziona Usa una chiave di crittografia gestita dal cliente. Viene visualizzato l'elenco a discesa Seleziona una chiave gestita dal cliente. Nell'elenco a discesa Seleziona una chiave gestita dal cliente, seleziona la chiave che vuoi utilizzare.
    • Per utilizzare una rete VPC in peering in questa esecuzione della pipeline, inserisci il nome della rete VPC nella casella Rete VPC in peering.
  6. Fai clic su Continua.
    Viene visualizzato il riquadro della posizione Cloud Storage e dei parametri della pipeline.
    • Obbligatorio: inserisci la directory di output di Cloud Storage, ad esempio gs://location_of_directory.
    • (Facoltativo) Specifica i parametri da utilizzare per questa esecuzione della pipeline.
  7. Fai clic su Invia per creare l'esecuzione della pipeline.
  8. Una volta inviata, la pipeline viene visualizzata nella tabella della console Google Cloud.
  9. Nella riga associata alla pipeline, fai clic su  Visualizza altro > Aggiungi all'esperimento
    • Seleziona un esperimento esistente o creane uno nuovo.
    • (Facoltativo) Se all'esperimento sono associate esecuzioni, queste vengono visualizzate nel menu a discesa. Seleziona un'esecuzione dell'esperimento esistente.
  10. Fai clic su Salva.

Confrontare l'esecuzione di una pipeline con le esecuzioni dell'esperimento utilizzando la console Google Cloud

  1. Nella console Google Cloud, vai alla pagina Esperimenti.
    Vai a Esperimenti.
    Nella pagina Esperimenti viene visualizzato un elenco di esperimenti.
  2. Seleziona l'esperimento a cui vuoi aggiungere l'esecuzione della pipeline.
    Viene visualizzato un elenco di esecuzioni.
  3. Seleziona le esecuzioni da confrontare, poi fai clic su Confronta
    .
  4. Fai clic sul pulsante Aggiungi esecuzione. Viene visualizzato un elenco di esecuzioni
  5. Seleziona l'esecuzione della pipeline da aggiungere. La corsa viene aggiunta.

SDK Vertex AI per Python {:#sdk-add-pipeline-run}

I seguenti esempi utilizzano l'API PipelineJob.

Associare l'esecuzione della pipeline a un esperimento

Questo esempio mostra come associare un'esecuzione della pipeline a un esperimento. Quando vuoi confrontare le esecuzioni della pipeline, devi associarle a un esperimento. Consulta init nella documentazione di riferimento dell'SDK Vertex AI per Python.

Python

from typing import Any, Dict, Optional

from google.cloud import aiplatform


def log_pipeline_job_to_experiment_sample(
    experiment_name: str,
    pipeline_job_display_name: str,
    template_path: str,
    pipeline_root: str,
    project: str,
    location: str,
    parameter_values: Optional[Dict[str, Any]] = None,
):
    aiplatform.init(project=project, location=location)

    pipeline_job = aiplatform.PipelineJob(
        display_name=pipeline_job_display_name,
        template_path=template_path,
        pipeline_root=pipeline_root,
        parameter_values=parameter_values,
    )

    pipeline_job.submit(experiment=experiment_name)

  • experiment_name: fornisci un nome per l'esperimento. Puoi trovare l'elenco degli esperimenti nella console Google Cloud selezionando Esperimenti nel riquadro di navigazione della sezione.
  • pipeline_job_display_name: il nome definito dall'utente di questa pipeline.
  • template_path: il percorso del file JSON o YAML PipelineJob o PipelineSpec. Può essere un percorso locale o un URI Cloud Storage. Esempio: "gs://project.name"
  • pipeline_root: la radice delle uscite della pipeline. Per impostazione predefinita è il bucket di staging.
  • parameter_values: la mappatura dei nomi dei parametri di runtime ai relativi valori che controllano l'esecuzione della pipeline.
  • project: il tuo ID progetto. Puoi trovare questi ID nella pagina di benvenuto della console Google Cloud.
  • location: consulta l'elenco delle località disponibili.

Associare l'esecuzione della pipeline all'esecuzione dell'esperimento

Il sample fornito include l'associazione di un'esecuzione della pipeline a un'esecuzione dell'esperimento.

Casi d'uso:

  • Quando esegui l'addestramento di un modello locale e poi la valutazione su quel modello (la valutazione viene eseguita utilizzando una pipeline). In questo caso, devi scrivere le metriche di valutazione dell'esecuzione della pipeline in un'esecuzione dell'esperimento.
  • Quando esegui nuovamente la stessa pipeline più volte. Ad esempio, se modifichi i parametri di input o se un componente non funziona e devi eseguirlo di nuovo.

Quando associ un'esecuzione della pipeline a un'esecuzione dell'esperimento, i parametri e le metriche non vengono visualizzati automaticamente e devono essere registrati manualmente utilizzando le API di logging.

Nota: quando il parametro facoltativo resume è specificato come TRUE, la corsa avviata in precedenza viene ripresa. Se non specificato, il valore predefinito di resume è FALSE e viene creata una nuova esecuzione.

Consulta init, start_run e log nella documentazione di riferimento dell'SDK Vertex AI per Python.

Python

from google.cloud import aiplatform


def log_pipeline_job_sample(
    experiment_name: str,
    run_name: str,
    pipeline_job: aiplatform.PipelineJob,
    project: str,
    location: str,
):
    aiplatform.init(experiment=experiment_name, project=project, location=location)

    aiplatform.start_run(run=run_name, resume=True)

    aiplatform.log(pipeline_job=pipeline_job)

  • experiment_name: fornisci un nome per l'esperimento. Puoi trovare l'elenco degli esperimenti nella console Google Cloud selezionando Esperimenti nel riquadro di navigazione della sezione.
  • run_name: specifica un nome per l'esecuzione.
  • pipeline_job: un PipelineJob di Vertex AI
  • project: il tuo ID progetto. Puoi trovarli nella pagina di benvenuto della console Google Cloud.
  • location: consulta l'elenco delle località disponibili

Visualizza l'elenco delle esecuzioni della pipeline nella console Google Cloud

  1. Nella console Google Cloud, nella sezione Vertex AI, vai alla pagina Pipeline.

    Vai alla pagina Pipeline

  2. Verifica di essere nel progetto corretto.

  3. Un elenco di esperimenti ed esecuzioni associati alle esecuzioni della pipeline del progetto viene visualizzato rispettivamente nelle colonne Esperimento e Esecuzione esperimento.

Elenco di esperimenti Vertex AI

Codelab

Passaggi successivi

Esempio di notebook pertinente