Monitoraggio della derivazione degli artefatti della pipeline

A ogni esecuzione della pipeline creata utilizzando Vertex AI Pipelines sono associate diverse artefatti e parametri, come modelli, set di dati, modelli di pipeline componenti. La derivazione di un artefatto della pipeline include i fattori che ha contribuito alla sua creazione, nonché artefatti e metadati derivati l'artefatto. Ad esempio, la derivazione di un modello può includere quanto segue:

  • I dati di addestramento, test e valutazione utilizzati per creare il modello.

  • Gli iperparametri utilizzati durante l'addestramento del modello.

  • I metadati registrati dal processo di addestramento e valutazione, come l'accuratezza del modello.

  • Gli artefatti che discendono da questo modello, come i risultati delle previsioni batch.

Puoi utilizzare questi metadati per rispondere a domande come le seguenti:

  • Perché una determinata esecuzione della pipeline ha prodotto un modello particolarmente accurato?

  • Quale esecuzione della pipeline ha prodotto il modello più accurato e quali iperparametri sono stati utilizzati per addestrare il modello?

  • A seconda dei passaggi della pipeline, potresti essere in grado di rispondere alle domande sulla governance di sistema. Ad esempio, potresti utilizzare i metadati per determinare quale versione del tuo modello era in produzione in un determinato momento.

Per visualizzare e analizzare la derivazione dell'artefatto della pipeline, puoi utilizzare Vertex ML Metadata o Dataplex.

La seguente tabella illustra le differenze tra Vertex ML Metadata e Dataplex:

Funzionalità Vertex ML Metadata Dataplex
Tipi di metadati della pipeline acquisiti Tutti gli artefatti di input e output prodotti dall'esecuzione di una pipeline. Artefatti di input e output che possono essere mappati a nomi completi (FQN) supportati da Dataplex, in genere utilizzando i componenti della pipeline di Google Cloud.
Area geografica Letture in una singola regione. Letture globali, ovvero in più regioni.
Progetti Letture di un singolo progetto. Letture a livello di organizzazione in più progetti.
Servizi integrati Integrato con Vertex AI Pipelines, Vertex AI Experiments, Vertex AI Model Registry e set di dati. Integrato con più prodotti Google Cloud, come Vertex AI, BigQuery, Cloud Composer e Dataproc.
Vuoi attivare la funzionalità? No, sempre attivo. Attiva la funzionalità per progetto abilitando l'API Data Lineage.

Mappare gli artefatti Vertex ML Metadata a Dataplex

Per mappare gli artefatti di Vertex ML Metadata ai nomi di dominio completi in Dataplex, devi effettuare le seguenti operazioni:

  • Utilizzare i componenti della pipeline di Google Cloud durante la creazione di modelli Vertex AI e e gestire set di dati gestiti.

  • Utilizza titoli personalizzati per lo schema (google.VertexDataset o google.VertexModel) mentre specifichi il nome della risorsa del modello o del set di dati gestito nel campo metadata come illustrato nell'esempio seguente:

{
  "name": "projects/example-project/locations/us-central1/metadataStores/default/artifacts/example-artifact",
  "displayName": "My dataset",
  "uri": "https://us-central1-aiplatform.googleapis.com/v1/projects/example-project/locations/us-central1/datasets/example-dataset",
   ...
  "schemaTitle": "google.VertexDataset",
  "schemaVersion": "0.0.1",
  "metadata": {
    "resourceName": "projects/example-project/locations/us-central1/datasets/example-dataset"
  }
}

Analizzare la derivazione degli artefatti della pipeline utilizzando Vertex ML Metadata

Quando esegui una pipeline utilizzando Vertex AI Pipelines, gli artefatti e i parametri di esecuzione vengono memorizzati tramite Vertex ML Metadata. Vertex ML Metadata semplifica l'analisi della derivazione degli artefatti della pipeline, evitandoti la difficoltà di tenere traccia dei metadati della pipeline.

Se non hai mai utilizzato Vertex ML Metadata, leggi l'introduzione a Vertex ML Metadata.

Segui queste istruzioni per visualizzare il grafico della derivazione di una pipeline utilizzando Vertex ML Metadata:

  1. Nella sezione Vertex AI della console Google Cloud, vai alla pagina Metadati.

    Vai a Metadati

    La pagina Metadati elenca gli elementi creati nell'archivio dei metadati predefinito.

  2. Nell'elenco a discesa Regione, seleziona la regione in cui è stata eseguita l'esecuzione in cui è stato creato.

  3. Fai clic sul nome visualizzato di un elemento per visualizzarne il grafico della struttura.

    Un grafico statico che mostra gli artefatti e le esecuzioni che fanno parte di questo viene visualizzato un grafico della derivazione.

  4. Fai clic su un elemento o un'esecuzione per saperne di più.

Analizzare la derivazione degli artefatti della pipeline utilizzando Dataplex

Dataplex Data Catalog rileva i metadati delle risorse Google Cloud, tra cui gli elementi delle pipeline Vertex AI come i modelli Vertex AI, i set di dati gestiti e altre risorse Google Cloud rilevabili in Data Catalog. Puoi scoprire questi elementi utilizzando la funzionalità di ricerca dei metadati di Data Catalog e visualizzare i relativi grafici della struttura.

Per ulteriori informazioni sulla funzionalità di ricerca dei metadati di Data Catalog, consulta Cercare e visualizzare gli asset di dati con Data Catalog.

Tieni presente che Data Catalog potrebbe non essere disponibile in tutte le regioni in cui è supportato Vertex AI Pipelines. Se Data Catalog è non supportato nella tua regione, utilizza Vertex ML Metadata. Visualizza l'elenco delle regioni supportate per Data Catalog.

Segui queste istruzioni per visualizzare il grafico della struttura di un elemento della pipeline su Dataplex:

  1. Per avviare una query di ricerca in Dataplex nella console Google Cloud, vai alla pagina Dataplex Search.

    Vai alla pagina Cerca di Dataplex

  2. Utilizza i filtri per cercare gli artefatti. Ad esempio, puoi utilizzare il filtro Tipi di dati per specificare il tipo di elemento, ad esempio modello, set di dati o tabella BigQuery. Per ulteriori informazioni sulla ricerca in Data Catalog, consulta Cercare asset di dati

    Puoi anche definire la query nel campo di ricerca.

  3. Per visualizzare la derivazione di un artefatto, fai clic sul nome dell'artefatto, quindi sulla scheda Derivazione.

    Nel grafico della derivazione, i processi di Vertex AI sono preceduti da Icona di Vertex AI Derivazione. Questi includono artefatti della pipeline, componenti di pipeline e modelli di pipeline.

    • Per visualizzare i dettagli di un processo, fai clic sul processo nel grafico della struttura.

    • Per i processi basati sulle attività della pipeline dalle esecuzioni della pipeline, puoi eseguire le seguenti operazioni:

      • Visualizza l'esecuzione della pipeline in Vertex AI facendo clic su Apri in Vertex AI nella scheda Dettagli. Per visualizzare i dettagli di runtime di un'esecuzione della pipeline, ad esempio stati, timestamp e attributi, fai clic su Altro. Per visualizzare l'esecuzione della pipeline in Vertex AI, fai clic su Apri in Vertex AI.
    • Per i processi basati su un modello di pipeline, puoi eseguire le seguenti operazioni:

      • Visualizza i dettagli del modello in Vertex AI facendo clic su Apri in Vertex AI nella scheda Dettagli.

      • Visualizza l'elenco delle attività della pipeline create nelle esecuzioni della pipeline in Scheda Esecuzioni. Per visualizzare i dettagli del modello di pipeline in Vertex AI, fai clic su Altro e poi su Apri in Vertex AI.

Passaggi successivi