L'attività Dataflow - Crea job consente di creare un job in Cloud Dataflow per eseguire una pipeline di dati creata utilizzando uno degli SDK Apache Beam.
Cloud Dataflow è un servizio Google Cloud completamente gestito per eseguire pipeline di elaborazione dei dati in modalità flusso e batch.
Prima di iniziare
Assicurati di eseguire le attività seguenti nel progetto Google Cloud prima di configurare l'attività Dataflow - Creazione del job:
- Abilita l'API Dataflow (
dataflow.googleapis.com
). - Crea un profilo di autenticazione. Apigee Integration utilizza un profilo di autenticazione per connettersi a un endpoint di autenticazione per l'attività Dataflow - Creazione job.
Per informazioni sulla concessione di ulteriori ruoli o autorizzazioni a un account di servizio, consulta Concessione, modifica e revoca dell'accesso.
Configura l'attività Dataflow - Creazione di un job
- Nell'UI di Apigee, seleziona la tua organizzazione Apigee.
- Fai clic su Sviluppo > Integrazioni.
- Seleziona un'integrazione esistente o creane una nuova facendo clic su Crea integrazione.
Se stai creando una nuova integrazione:
- Inserisci un nome e una descrizione nella finestra di dialogo Crea integrazione.
- Seleziona una regione per l'integrazione dall'elenco delle regioni supportate.
- Fai clic su Crea.
Viene aperta l'integrazione nel designer dell'integrazione.
- Nella barra di navigazione del designer dell'integrazione, fai clic su +Aggiungi un'attività/un attivatore > Tasks per visualizzare l'elenco delle attività disponibili.
- Fai clic sull'elemento Dataflow - Crea job e posizionalo nel progettista dell'integrazione.
- Fai clic sull'elemento Dataflow - Crea job in Designer per visualizzare il riquadro di configurazione dell'attività Dataflow - Crea job.
- Vai ad Autenticazione e seleziona un profilo di autenticazione esistente che vuoi utilizzare.
Facoltativo. Se non hai creato un profilo di autenticazione prima di configurare l'attività, fai clic su + Nuovo profilo di autenticazione e segui i passaggi descritti in Creare un nuovo profilo di autenticazione.
- Vai a Input attività e configura i campi di input visualizzati utilizzando la seguente tabella Parametri di input dell'attività.
Le modifiche ai campi di immissione vengono salvate automaticamente.
Parametri di input dell'attività
Nella tabella seguente vengono descritti i parametri di input dell'attività Dataflow - Creazione di un job:
Proprietà | Tipo di dati | Descrizione |
---|---|---|
Regione | Stringa | Località Cloud Dataflow per il job. |
ProjectsId | Stringa | L'ID del tuo progetto Google Cloud. |
Località | Stringa | L'endpoint a livello di regione che contiene questo job. |
Richiesta | JSON | Vedi Richiedere la struttura JSON. |
Output attività
L'attività Dataflow - Crea job restituisce l'istanza appena creata del Job.
Strategia di gestione degli errori
Una strategia di gestione degli errori per un'attività specifica l'azione da eseguire se l'attività non riesce a causa di un errore temporaneo. Per informazioni su come utilizzare una strategia di gestione degli errori e per conoscere i diversi tipi di strategie di gestione degli errori, consulta Strategie di gestione degli errori.
Passaggi successivi
- Aggiungi perimetrali e condizioni perimetrali.
- Testa e pubblica l'integrazione.
- Configura un attivatore.
- Aggiungi un'attività di mappatura dei dati.
- Vedi tutte le attività per i servizi Google Cloud.