Monitoraggio della derivazione degli artefatti della pipeline

A ogni esecuzione della pipeline creata utilizzando Vertex AI Pipelines sono associati diversi artefatti e parametri, come modelli, set di dati, modelli di pipeline e componenti. La derivazione di un artefatto della pipeline include i fattori che hanno contribuito alla sua creazione, nonché gli artefatti e i metadati derivati da quell'artefatto. Ad esempio, la derivazione di un modello può includere quanto segue:

  • I dati di addestramento, test e valutazione utilizzati per creare il modello.

  • Gli iperparametri utilizzati durante l'addestramento del modello.

  • I metadati registrati dal processo di addestramento e valutazione, come l'accuratezza del modello.

  • Gli artefatti che discendono da questo modello, come i risultati delle previsioni batch.

Puoi utilizzare questi metadati per rispondere a domande come le seguenti:

  • Perché l'esecuzione di una determinata pipeline ha prodotto un modello particolarmente preciso?

  • Quale esecuzione della pipeline ha prodotto il modello più preciso e quali iperparametri sono stati utilizzati per addestrare il modello?

  • A seconda dei passaggi della pipeline, potresti essere in grado di rispondere a domande sulla governance del sistema. Ad esempio, puoi utilizzare i metadati per determinare quale versione del modello era in produzione in un determinato momento.

Per visualizzare e analizzare la derivazione dell'artefatto della pipeline, puoi utilizzare Vertex ML Metadata o Dataplex.

La seguente tabella illustra le differenze tra Vertex ML Metadata e Dataplex:

Selezione delle Vertex ML Metadata Dataplex
Tipi di metadati della pipeline acquisiti Tutti gli artefatti di input e di output prodotti da un'esecuzione di una pipeline. Artefatti di input e di output che possono essere mappati a nomi completi (FQN) supportati da Dataplex, in genere utilizzando i componenti di pipeline di Google Cloud
Geografia Letture a regione singola. Letture globali, ovvero in più regioni.
Progetti Lettura di singoli progetti. Letture a livello di organizzazione in più progetti.
Servizi integrati Integrazione con Vertex AI Pipelines, Vertex AI Experiments, Vertex AI Model Registry e i set di dati Integrato con diversi prodotti Google Cloud, come Vertex AI, BigQuery, Cloud Composer e Dataproc.
Vuoi attivarla? No, sempre attive. Attivazione richiesta per ogni archivio di metadati ML.

Mappa gli artefatti di Vertex ML Metadata a Dataplex

Per mappare gli artefatti di Vertex ML Metadata ai nomi di dominio completi in Dataplex, devi:

  • Utilizzare i componenti di pipeline di Google Cloud durante la creazione di modelli Vertex AI e set di dati gestiti.

  • Utilizza titoli di schema personalizzati (google.VertexDataset o google.VertexModel) mentre specifichi il nome della risorsa del modello o del set di dati gestito nel campo metadata, come illustrato nell'esempio seguente:

{
  "name": "projects/example-project/locations/us-central1/metadataStores/default/artifacts/example-artifact",
  "displayName": "My dataset",
  "uri": "https://us-central1-aiplatform.googleapis.com/v1/projects/example-project/locations/us-central1/datasets/example-dataset",
   ...
  "schemaTitle": "google.VertexDataset",
  "schemaVersion": "0.0.1",
  "metadata": {
    "resourceName": "projects/example-project/locations/us-central1/datasets/example-dataset"
  }
}

Analizza la derivazione degli artefatti delle pipeline utilizzando Vertex ML Metadata

Quando esegui una pipeline utilizzando Vertex AI Pipelines, gli artefatti e parametri dell'esecuzione della pipeline vengono archiviati utilizzando Vertex ML Metadata. Vertex ML Metadata semplifica l'analisi della sequenza degli artefatti della pipeline, evitando di dover tenere traccia dei metadati della pipeline.

Se non hai mai utilizzato Vertex ML Metadata, leggi l'introduzione a Vertex ML Metadata.

Segui queste istruzioni per visualizzare il grafico di derivazione per un artefatto della pipeline utilizzando Vertex ML Metadata:

  1. Nella sezione Vertex AI della console Google Cloud, vai alla pagina Metadati.

    Vai a Metadati

    La pagina Metadati elenca gli artefatti creati nell'archivio di metadati predefinito.

  2. Nell'elenco a discesa Regione, seleziona la regione in cui è stata creata l'esecuzione.

  3. Fai clic sul Nome visualizzato di un artefatto per vedere il relativo grafico della derivazione.

    Viene visualizzato un grafico statico che mostra gli artefatti ed esecuzioni che fanno parte di questo grafico di derivazione.

  4. Fai clic su un artefatto o un'esecuzione per saperne di più.

Analizza la derivazione degli artefatti della pipeline utilizzando Dataplex

Dataplex Data Catalog rileva i metadati dalle risorse Google Cloud, che includono gli artefatti di Vertex AI Pipelines come i modelli Vertex AI, i set di dati gestiti e altre risorse Google Cloud rilevabili in Data Catalog. Puoi scoprire questi artefatti utilizzando la funzionalità di ricerca dei metadati di Data Catalog e visualizzare i relativi grafici di derivazione.

Per saperne di più sulla funzionalità di ricerca dei metadati di Data Catalog, consulta Cercare e visualizzare asset di dati con Data Catalog.

Segui queste istruzioni per visualizzare il grafico di derivazione per un artefatto della pipeline su Dataplex:

  1. Per avviare una query di ricerca Dataplex nella console Google Cloud, vai alla pagina Ricerca Dataplex.

    Vai alla pagina Cerca di Dataplex

  2. Utilizza i filtri per cercare gli artefatti. Ad esempio, puoi utilizzare il filtro Tipi di dati per specificare il tipo di artefatto, come il modello, il set di dati o la tabella BigQuery. Per ulteriori informazioni sulla ricerca di Data Catalog, consulta Cercare asset di dati

    Puoi anche definire la query nel campo di ricerca.

  3. Per visualizzare la derivazione di un artefatto, fai clic sul nome dell'elemento e poi sulla scheda derivazione.

    Nel grafico della derivazione, i processi di Vertex AI sono preceduti da Icona di derivazione di Vertex AI. Questi includono artefatti e componenti della pipeline e modelli di pipeline.

    • Per visualizzare i dettagli di un processo, fai clic sul processo nel grafico della derivazione.

    • Per i processi basati sulle attività della pipeline dalle esecuzioni della pipeline, puoi:

      • Visualizza l'esecuzione della pipeline in Vertex AI facendo clic su Apri in Vertex AI nella scheda Dettagli. Per visualizzare i dettagli del runtime di un'esecuzione di una pipeline, come stati, timestamp e attributi, fai clic su Altro. Per visualizzare l'esecuzione della pipeline in Vertex AI, fai clic su Apri in Vertex AI.
    • Per i processi basati su un modello di pipeline, puoi fare quanto segue:

      • Visualizza i dettagli del modello in Vertex AI facendo clic su Apri in Vertex AI nella scheda Dettagli.

      • Visualizza l'elenco delle attività della pipeline create nelle esecuzioni della pipeline nella scheda Esecuzioni. Per visualizzare i dettagli del modello di pipeline in Vertex AI, fai clic su Altro e poi su Apri in Vertex AI.

Passaggi successivi