Visualizza derivazione in Dataplex

Questa pagina descrive come visualizzare la derivazione dei dati generata dalle tue pipeline di Cloud Data Fusion con altri spostamenti di dati su Google Cloud, a fini di rilevamento e governance. Puoi visualizzare i grafici sulla derivazione per le origini dati supportate nella pagina Dataplex nella console o utilizzare l'API Data Lineage per recuperare i record completi.

Plug-in che supportano la derivazione dei dati in Dataplex

Cloud Data Fusion e Dataplex supportano la derivazione a livello di asset per i seguenti plug-in:

  • Amazon S3
  • BigQuery
  • Sink di BigQuery Multi Table (versione 6.9.1 e successive)
  • Cloud Spanner
  • Cloud Storage
  • Cloud SQL per MySQL
  • Cloud SQL for PostgreSQL
  • Dataplex
  • FTP
  • Database generico
  • HTTP
  • MSSQL/SQL Server
  • Origine di più tabelle di database (versione 6.9.1 e successive)
  • MySQL
  • Oracle
  • PostgreSQL
  • OData SAP
  • ODP SAP
  • Tabella SAP

Per ulteriori informazioni, consulta i plug-in di Cloud Data Fusion.

Prima di iniziare

Per attivare la visualizzazione dei grafici sulla derivazione di Cloud Data Fusion nella pagina Dataplex nella console:

  1. Crea una pipeline di dati che utilizzi solo i plug-in supportati.

  2. Abilita l'API Data Lineage nel progetto che contiene la tua istanza di Cloud Data Fusion.

  3. Concedi il ruolo Produttore di eventi Data Lineage (roles/datalineage.producer) all'account di servizio gestito da Cloud Data Fusion. Per ulteriori informazioni, consulta i ruoli di derivazione predefiniti di Data Catalog.

    Istanze senza RBAC

    Se controllo dell'accesso basato sui ruoli (RBAC) non è abilitato sull'istanza, concedi il ruolo Producer eventi Data Lineage (roles/datalineage.producer) all'agente di servizio dell'API Cloud Data Fusion.

    Per concedere il ruolo richiesto:

    1. Nella console Google Cloud, vai alla pagina IAM.

      Vai a IAM

    2. Seleziona la casella di controllo Includi concessioni di ruoli fornite da Google.

    3. Seleziona l'account di servizio dell'agente di servizio dell'API Cloud Data Fusion come principale e fai clic su Modifica.

    4. Fai clic su Aggiungi un altro ruolo e seleziona il ruolo Produttore di eventi Data Lineage.

    5. Fai clic su Salva.

    Istanze con RBAC

    Per le istanze per cui è abilitato il controllo dell'accesso basato sui ruoli (RBAC), l'account di servizio a cui concedi il ruolo ha il seguente formato: datafusion-system@TENANT_PROJECT_ID.iam.gserviceaccount.com. Non viene visualizzato nell'elenco delle entità nella pagina IAM.

    Per concedere il ruolo richiesto:

    1. Nella console Google Cloud, vai alla pagina IAM.

      Vai a IAM

    2. Fai clic su Concedi accesso.

    3. Nel campo Nuove entità, inserisci l'account di servizio dell'agente di servizio dell'API Cloud Data Fusion: datafusion-system@TENANT_PROJECT_ID.iam.gserviceaccount.com.

    4. Seleziona il ruolo Producer eventi di derivazione dati.

    5. Fai clic su Salva.

Quando è disponibile la derivazione

La visualizzazione della derivazione in Dataplex presenta le seguenti limitazioni:

Visualizzare i grafici sulla derivazione dei dati

Per visualizzare i grafici sulla derivazione delle entità in tutti i servizi Google Cloud:

  1. Vai all'istanza in Cloud Data Fusion ed esegui una pipeline di dati che utilizza plug-in supportati.

  2. Visualizza i grafici sulla derivazione nella pagina Dataplex nella console e trova l'asset per cui vuoi visualizzare le informazioni sulla derivazione.

Passaggi successivi