Panoramica della connettività gestita

Questo documento fornisce una panoramica delle pipeline di connettività gestite che puoi utilizzare per importare i metadati da origini di terze parti in Dataplex.

La connettività gestita consente di importare i metadati in Dataplex su larga scala. Una pipeline di connettività gestita estrae i metadati dalle origini dati e poi li importa in Dataplex. Se necessario, la pipeline crea anche gruppi di voci Dataplex Catalog progetto Google Cloud. Puoi orchestrare i flussi di lavoro e pianificare i job di importazione in base alle tue esigenze.

Puoi creare i tuoi connettori personalizzati per estrarre i metadati da origini di terze parti. Ad esempio, puoi creare un connettore per estrarre i metadati da origini come MySQL, SQL Server, Oracle, Snowflake, Databricks e altre. Per i passaggi per la creazione un connettore personalizzato di esempio, consulta Sviluppa un connettore personalizzato per l'importazione dei metadati.

Per la procedura di esecuzione di una pipeline di connettività gestita, vedi Importare metadati da un'origine personalizzata utilizzando Workflows.

Come funziona la connettività gestita

Il seguente diagramma mostra una pipeline di connettività gestita.

Una pipeline di connettività gestita.

A livello generale, ecco come funziona la connettività gestita:

  1. Crea un connettore per l'origine dati.

    Il connettore deve essere un'immagine Artifact Registry che può essere eseguita su Dataproc Serverless.

  2. Esegui la pipeline di connettività gestita in Workflows, una piattaforma di orchestrazione.

  3. La pipeline di connettività gestita esegue le seguenti operazioni:

    1. Crea un gruppo di voci di destinazione in base alla configurazione, se il gruppo di voci non esiste ancora.
    2. Esegue il connettore. Il connettore estrae i metadati dai tuoi dati. e genera un file di importazione dei metadati che può essere importato Dataplex Catalog.
    3. Monitora l'avanzamento dell'estrazione dei metadati.
    4. Esegue un job di importazione dei metadati per importarli in Dataplex Catalog.
    5. Monitora l'avanzamento del job di importazione dei metadati.

La pipeline di connettività gestita utilizza Dataproc Serverless per eseguire metodi dell'API di importazione dei metadati di Dataplex e del connettore per eseguire il job di importazione dei metadati.

I metadati importati sono costituiti dalle voci di Dataplex Catalog e dai relativi aspetti. Per ulteriori informazioni Metadati Dataplex Catalog; consulta Panoramica di Dataplex Catalog.

Passaggi successivi