Considerazioni sulla derivazione dei dati

La cronologia dei dati è abilitata in base al progetto, non al sistema. Ciò significa che, dopo aver attivato l'API Data Lineage, le informazioni sulla cronologia possono essere registrate automaticamente per più sistemi nel progetto, a seconda del controllo della cronologia a livello di prodotto di ciascun sistema.

Il monitoraggio automatico della derivazione è supportato per i seguenti sistemi:

Controlli di derivazione a livello di prodotto nei sistemi supportati da Google Cloud
Sistema Controlli di derivazione disponibili
BigQuery,
Cloud Data Fusion
Non è possibile configurare il monitoraggio della cronologia solo per Cloud Data Fusion o BigQuery quando l'API Data Lineage è abilitata in un progetto.
Cloud Composer Cloud Composer utilizza il controllo di integrazione della sequenza di creazione dei dati a livello di ambiente. La derivazione dei dati viene attivata automaticamente per tutti i nuovi ambienti Cloud Composer, a condizione che soddisfino i requisiti. Per ulteriori informazioni, consulta Derivazione dei dati con Dataplex. Per gli ambienti esistenti, puoi abilitare o disabilitare l'integrazione della derivazione dei dati nelle impostazioni dell'ambiente.
Dataproc I job Spark di Dataproc possono acquisire gli eventi della cronologia e pubblicarli nell'API Data Lineage. Per ulteriori informazioni, consulta Integrazione di Dataproc con la derivazione dei dati.
Vertex AI La derivazione dei dati viene abilitata automaticamente per gli artefatti e i parametri di Vertex AI, come modelli, set di dati, modelli di pipeline e componenti. La derivazione di una pipeline include i fattori che hanno contribuito alla sua creazione, nonché gli artefatti e i metadati derivati in seguito. Consulta Monitorare la derivazione degli artefatti della pipeline per saperne di più.

Impatto sulla fatturazione

Quando attivi l'API Data Lineage in un progetto, esamina l'impatto sugli addebiti di fatturazione poiché l'API Data Lineage è attivata su base per progetto (per maggiori dettagli, consulta la sezione precedente).

In caso di più regioni, ad esempio Unione Europea (eu), Asia (asia), e Stati Uniti (us), e per BigQuery Omni, l'elaborazione della derivazione è distribuito in regioni specifiche e i costi dipendono dalle regioni in cui viene eseguita l'elaborazione (vedi esempi di prezzi di Data Catalog).

Conformità della derivazione dei dati

  • La derivazione dei dati registra i metadati relativi allo spostamento dei dati, ma non acquisisce i dati stessi. Consulta il modello di informazioni sulla struttura dei dati e il riferimento all'API Data Lineage per informazioni dettagliate sui campi inclusi nei metadati.
  • La derivazione dei dati all'interno di Dataplex offre il supporto di VPC-SC.
  • Dataplex non offre la possibilità di utilizzare Chiavi di crittografia gestite dal cliente per proteggere i metadati di derivazione raccolti.

Limitazioni della derivazione dei dati

Quando selezioni un nodo nel grafico della struttura, il riquadro laterale dei dettagli del nodo sarà vuoto se:

  1. le risorse si trovano in un'altra organizzazione
  2. L'utente non è membro dell'organizzazione che ospita la risorsa.