Consulta los conectores compatibles para Application Integration.

Tarea Dataflow - Create Job

La tarea Dataflow - Create Job te permite crear un trabajo en Cloud Dataflow para ejecutar una canalización de datos compilada con uno de los SDK de Apache Beam.

Cloud Dataflow es un servicio de Google Cloud completamente administrado para ejecutar canalizaciones de procesamiento de datos por lotes y transmisiones.

Antes de comenzar

Asegúrate de realizar las siguientes tareas en tu proyecto de Google Cloud antes de configurar la tarea Dataflow - Create Job:

  1. Habilita la API de Dataflow (dataflow.googleapis.com).

    Habilitar la API de Dataflow

  2. Crea un perfil de autenticación. Application Integration usa un perfil de autenticación para conectarse a un extremo de autenticación de la tarea Dataflow: Crear trabajo.

    Para obtener información sobre cómo otorgar roles o permisos adicionales a una cuenta de servicio, consulta Cómo otorgar, cambiar y revocar el acceso a los recursos.

Configura la tarea Dataflow - Create Job

  1. En la consola de Google Cloud, ve a la página Application Integration.

    Ir a Application Integration

  2. En el menú de navegación, haz clic en Integraciones.

    Aparecerá la página Integraciones con todas las integraciones disponibles en el proyecto de Google Cloud.

  3. Selecciona una integración existente o haz clic en Crear integración para crear una nueva.

    Si creas una integración nueva, haz lo siguiente:

    1. Ingresa un nombre y una descripción en el panel Create Integration.
    2. Selecciona una región para la integración.
    3. Selecciona una cuenta de servicio para la integración. Puedes cambiar o actualizar los detalles de la cuenta de servicio de una integración en cualquier momento desde el panel Resumen de la integración en la barra de herramientas de integración.
    4. Haz clic en Crear.

    Esto abrirá la integración en la página del editor de integración.

  4. En la barra de navegación del editor de integración, haz clic en Tasks para ver la lista de tareas disponibles.
  5. Haz clic y coloca el elemento Dataflow - Create Job en el editor de integración.
  6. Haz clic en el elemento Dataflow - Create Job en el diseñador para ver el panel de configuración de la tarea Dataflow - Create Job.
  7. Ve a Autenticación y selecciona un perfil de autenticación existente que desees usar.

    Opcional. Si no creaste un perfil de autenticación antes de configurar la tarea, haz clic en + Nuevo perfil de autenticación y sigue los pasos que se mencionan en Crea un perfil de autenticación nuevo.

  8. Ve a Entrada de tarea y configura los campos de entrada que se muestran con la siguiente tabla de parámetros de entrada de la tarea.

    Los cambios en los campos de entrada se guardan de forma automática.

Parámetros de entrada de la tarea

En la siguiente tabla, se describen los parámetros de entrada de la tarea Dataflow - Create Job:

Propiedad Tipo de datos Descripción
Región String Ubicación de Cloud Dataflow para el trabajo.
ProjectsId String Tu ID del proyecto de Google Cloud.
Ubicación String El extremo regional que contiene este trabajo.
Solicitud JSON Consulta la estructura de JSON de solicitud.

Resultado de la tarea

La tarea Dataflow - Create Job muestra la instancia de trabajo recién creada.

Estrategia de manejo de errores

Una estrategia de manejo de errores de una tarea específica la acción que se debe realizar si la tarea falla debido a un error temporal. Para obtener información sobre cómo usar una estrategia de manejo de errores y conocer los diferentes tipos de estrategias de manejo de errores, consulta Estrategias de manejo de errores.

¿Qué sigue?

  1. Agrega perímetros y condiciones perimetrales.
  2. Prueba y publica tu integración.
  3. Configura un activador.
  4. Agrega una tarea de asignación de datos.
  5. Consulta todas las tareas para los servicios de Google Cloud.