Monitoraggio della derivazione degli artefatti della pipeline

Ogni esecuzione della pipeline creata utilizzando Vertex AI Pipelines ha diversi parametri e artefatti associati, come modelli, set di dati, modelli di pipeline e componenti. La derivazione di un artefatto della pipeline include i fattori che hanno contribuito alla sua creazione, nonché gli artefatti e i metadati derivati dall'artefatto. Ad esempio, la derivazione di un modello può includere quanto segue:

  • I dati di addestramento, test e valutazione utilizzati per creare il modello.

  • Gli iperparametri utilizzati durante l'addestramento del modello.

  • I metadati registrati dal processo di addestramento e valutazione, come l'accuratezza del modello.

  • Gli artefatti che discendono da questo modello, come i risultati delle previsioni batch.

Puoi utilizzare questi metadati per rispondere a domande come:

  • Perché una determinata esecuzione della pipeline ha prodotto un modello particolarmente accurato?

  • Quale esecuzione della pipeline ha prodotto il modello più accurato e quali iperparametri sono stati utilizzati per addestrare il modello?

  • A seconda dei passaggi della pipeline, potresti essere in grado di rispondere alle domande sulla governance del sistema. Ad esempio, potresti utilizzare i metadati per determinare quale versione del tuo modello era in produzione in un determinato momento.

Per visualizzare e analizzare la derivazione degli artefatti della pipeline, puoi utilizzare Vertex ML Metadata o Dataplex.

La seguente tabella illustra le differenze tra Vertex ML Metadata e Dataplex:

Funzionalità Vertex ML Metadata Dataplex
Tipi di metadati della pipeline acquisiti Tutti gli elementi di input e di output prodotti da un'esecuzione della pipeline. Artefatti di input e output che possono essere mappati a nomi completamente qualificati (FQN) supportati da Dataplex, in genere utilizzando i componenti della pipeline di Google Cloud.
Area geografica Letture in una singola regione. Letture globali, ovvero in più regioni.
Progetti Letture di un singolo progetto. Letture a livello di organizzazione in più progetti.
Servizi integrati Integrato con Vertex AI Pipelines, Vertex AI Experiments, Vertex AI Model Registry e set di dati. Integrato con più prodotti Google Cloud, come Vertex AI, BigQuery, Cloud Composer e Dataproc.
Vuoi attivare? No, sempre attivo. Attiva la funzionalità per progetto abilitando l'API Data Lineage.

Mappare gli artefatti Vertex ML Metadata a Dataplex

Per mappare gli artefatti Vertex ML Metadata ai nomi completi in Dataplex, devi svolgere i seguenti passaggi:

  • Utilizza i componenti della pipeline di Google Cloud durante la creazione di modelli Vertex AI e set di dati gestiti.

  • Utilizza i titoli dello schema personalizzato (google.VertexDataset o google.VertexModel) mentre specifichi il nome della risorsa del modello o del set di dati gestito nel campo metadata come illustrato nell'esempio seguente:

{
  "name": "projects/example-project/locations/us-central1/metadataStores/default/artifacts/example-artifact",
  "displayName": "My dataset",
  "uri": "https://us-central1-aiplatform.googleapis.com/v1/projects/example-project/locations/us-central1/datasets/example-dataset",
   ...
  "schemaTitle": "google.VertexDataset",
  "schemaVersion": "0.0.1",
  "metadata": {
    "resourceName": "projects/example-project/locations/us-central1/datasets/example-dataset"
  }
}

Analizza la derivazione degli artefatti della pipeline utilizzando Vertex ML Metadata

Quando esegui una pipeline utilizzando Vertex AI Pipelines, gli artefatti e i parametri di esecuzione vengono memorizzati tramite Vertex ML Metadata. Vertex ML Metadata semplifica l'analisi della derivazione degli artefatti della pipeline, evitandoti la difficoltà di tenere traccia dei metadati della pipeline.

Se non hai mai utilizzato Vertex ML Metadata, leggi l'introduzione a Vertex ML Metadata.

Segui queste istruzioni per visualizzare il grafico della cronologia per un elemento della pipeline utilizzando Vertex ML Metadata:

  1. Nella sezione Vertex AI della console Google Cloud, vai alla pagina Metadati.

    Vai a Metadati

    La pagina Metadati elenca gli elementi creati nell'archivio dei metadati predefinito.

  2. Nell'elenco a discesa Regione, seleziona la regione in cui è stata creata l'esecuzione.

  3. Fai clic sul nome visualizzato di un elemento per visualizzarne il grafico della struttura.

    Viene visualizzato un grafico statico che mostra gli artefatti e le esecuzioni che fanno parte di questo grafico di derivazione.

  4. Fai clic su un elemento o un'esecuzione per saperne di più.

Analizzare la derivazione degli artefatti della pipeline utilizzando Dataplex

Dataplex Data Catalog rileva i metadati delle risorse Google Cloud, tra cui gli elementi delle pipeline Vertex AI come i modelli Vertex AI, i set di dati gestiti e altre risorse Google Cloud rilevabili in Data Catalog. Puoi scoprire questi elementi utilizzando la funzionalità di ricerca dei metadati di Data Catalog e visualizzare i relativi grafici della struttura.

Per ulteriori informazioni sulla funzionalità di ricerca dei metadati di Data Catalog, consulta Cercare e visualizzare gli asset di dati con Data Catalog.

Tieni presente che Data Catalog potrebbe non essere disponibile in tutte le regioni in cui è supportato Vertex AI Pipelines. Se Data Catalog non è supportato nella tua regione, utilizza Vertex ML Metadata. Visualizza l'elenco delle regioni supportate per Data Catalog.

Segui queste istruzioni per visualizzare il grafico della struttura di un elemento della pipeline su Dataplex:

  1. Per lanciare una query di ricerca Dataplex nella console Google Cloud, vai alla pagina Dataplex Search.

    Vai alla pagina Cerca di Dataplex

  2. Utilizza i filtri per cercare gli elementi. Ad esempio, puoi utilizzare il filtro Tipi di dati per specificare il tipo di elemento, ad esempio modello, set di dati o tabella BigQuery. Per ulteriori informazioni sulla ricerca in Data Catalog, consulta Cercare asset di dati

    Puoi anche definire la query nel campo di ricerca.

  3. Per visualizzare la linea di un elemento, fai clic sul nome dell'elemento e poi sulla scheda Linea.

    Nel grafico della cronologia, i processi Vertex AI sono preceduti da Icona della linea di Vertex AI. Sono inclusi gli elementi della pipeline, i componenti della pipeline e i modelli di pipeline.

    • Per visualizzare i dettagli di un processo, fai clic sul processo nel grafico della struttura.

    • Per i processi basati sulle attività della pipeline dalle esecuzioni della pipeline, puoi eseguire le seguenti operazioni:

      • Visualizza l'esecuzione della pipeline in Vertex AI facendo clic su Apri in Vertex AI nella scheda Dettagli. Per visualizzare i dettagli di runtime di un'esecuzione della pipeline, ad esempio stati, timestamp e attributi, fai clic su Altro. Per visualizzare l'esecuzione della pipeline in Vertex AI, fai clic su Apri in Vertex AI.
    • Per i processi basati su un modello di pipeline, puoi eseguire le seguenti operazioni:

      • Visualizza i dettagli del modello in Vertex AI facendo clic su Apri in Vertex AI nella scheda Dettagli.

      • Visualizza l'elenco delle attività di pipeline create nelle esecuzioni della pipeline nella scheda Esecuzioni. Per visualizzare i dettagli del modello di pipeline in Vertex AI, fai clic su Altro e poi su Apri in Vertex AI.

Passaggi successivi