Dataflow - Attività di creazione job

L'attività Dataflow - Crea job consente di creare un job in Cloud Dataflow per eseguire una pipeline di dati creata utilizzando uno degli SDK Apache Beam.

Cloud Dataflow è un servizio Google Cloud completamente gestito per l'esecuzione di pipeline di elaborazione dati in modalità flusso e batch.

Prima di iniziare

Assicurati di eseguire le attività seguenti nel progetto Google Cloud prima di configurare l'attività Dataflow - Crea job:

  1. Abilita l'API Dataflow (dataflow.googleapis.com).

    Abilita l'API Dataflow

  2. Crea un profilo di autenticazione. L'Apigee Integration utilizza un profilo di autenticazione per connettersi a un endpoint di autenticazione per l'attività Dataflow - Crea job.

    Per informazioni su come concedere ruoli o autorizzazioni aggiuntivi a un account di servizio, vedi Concessione, modifica e revoca dell'accesso.

Configura l'attività Dataflow - Crea job

  1. Nell'interfaccia utente di Apigee, seleziona la tua organizzazione Apigee.
  2. Fai clic su Sviluppa > Integrazioni.
  3. Seleziona un'integrazione esistente o creane una nuova facendo clic su Crea integrazione.

    Se stai creando una nuova integrazione:

    1. Inserisci un nome e una descrizione nella finestra di dialogo Crea integrazione.
    2. Seleziona una regione per l'integrazione dall'elenco delle regioni supportate.
    3. Fai clic su Crea.

    In questo modo viene aperta l'integrazione nel designer dell'integrazione.

  4. Nella barra di navigazione del designer dell'integrazione, fai clic su +Aggiungi un'attività/un trigger > Tasks per visualizzare l'elenco delle attività disponibili.
  5. Fai clic sull'elemento Dataflow - Create Job e posizionalo nel designer dell'integrazione.
  6. Fai clic sull'elemento Dataflow - Crea job nel designer per visualizzare il riquadro di configurazione delle attività Dataflow - Crea job.
  7. Vai ad Autenticazione e seleziona un profilo di autenticazione esistente che vuoi utilizzare.

    Facoltativo. Se non hai creato un profilo di autenticazione prima di configurare l'attività, fai clic su + Nuovo profilo di autenticazione e segui i passaggi descritti in Creare un nuovo profilo di autenticazione.

  8. Vai a Input attività e configura i campi di input visualizzati utilizzando la seguente tabella Parametri di input attività.

    Le modifiche ai campi di immissione vengono salvate automaticamente.

Parametri di input dell'attività

La seguente tabella descrive i parametri di input dell'attività Dataflow - Crea job:

Proprietà Tipo di dati Descrizione
Regione Stringa Località di Cloud Dataflow per il job.
ProjectsId Stringa L'ID del tuo progetto Google Cloud.
Località Stringa L'endpoint a livello di regione che contiene il job.
Richiesta JSON Vedi Struttura JSON della richiesta.

Output attività

L'attività Dataflow - Crea job restituisce l'istanza del Job appena creata.

Strategia di gestione degli errori

Una strategia di gestione degli errori per un'attività specifica l'azione da intraprendere se l'attività non riesce a causa di un errore temporaneo. Per informazioni su come utilizzare una strategia di gestione degli errori e per conoscere i diversi tipi di strategie di gestione degli errori, consulta Strategie di gestione degli errori.

Passaggi successivi

  1. Aggiungi bordi e condizioni degli spigoli.
  2. Testa e pubblica l'integrazione.
  3. Configura un attivatore.
  4. Aggiungi un'attività di mappatura dei dati.
  5. Vedi tutte le attività per i servizi Google Cloud.