Complementos de Cloud Data Fusion

Un complemento es un módulo personalizable que se puede usar para ampliar las capacidades de Cloud Data Fusion. Los distintos tipos se dividen en varias categorías: fuentes, transformaciones, analíticas, acciones, sumideros, controladores de errores, editores de alertas y condiciones. En la tabla de referencia de más abajo encontrarás una lista completa de todos los complementos disponibles en Cloud Data Fusion. Si necesitas un complemento que no existe, puedes crear el tuyo propio con las API correspondientes de Cloud Data Fusion.

En esta tabla se describen los distintos tipos de complementos disponibles en Cloud Data Fusion.

Tipo Descripción
Fuentes Las fuentes son conectores a bases de datos, archivos o flujos en tiempo real de los que obtienes los datos. Te permiten ingerir datos mediante una interfaz sencilla. Así no tienes que preocuparte de programar conexiones de nivel inferior.
Transformaciones Con las transformaciones puedes manipular los datos después de ingerirlos. Por ejemplo, puedes clonar un registro. También puedes especificar el formato JSON. Hasta puedes escribir transformaciones personalizadas con el complemento de JavaScript.
Analíticas Los complementos de analíticas se utilizan para realizar agregaciones, como la agrupación o unión de datos de distintas fuentes, además de ejecutar analíticas y operaciones de aprendizaje automático. Data Fusion integra complementos que abarcan varias de las operaciones citadas.
Acciones Los complementos de acciones definen una acción personalizada que se programa para que se lleve a cabo durante un flujo de trabajo, pero sin manipular directamente los datos de ese flujo. Por ejemplo, si usas la acción personalizada de base de datos, puedes ejecutar un comando arbitrario de base de datos al final del flujo de procesamiento. Si lo prefieres, puedes activar una acción para trasladar archivos dentro de Cloud Storage.
Sumideros Los datos deben escribirse en un sumidero. Cloud Data Fusion contiene varios sumideros, como Cloud Storage, BigQuery, Cloud Spanner, bases de datos relacionales, sistemas de archivos y mainframes.
Controladores de errores Cuando los nodos encuentran valores nulos, errores lógicos u otras causas de errores, puedes usar un controlador de errores para detectarlos. Puedes conectarlo a la salida de cualquier complemento de transformación o analítica, que detectará los errores. Después puedes procesar esos errores por separado dentro del flujo de procesamiento.
Editores de alertas Otro tipo de complemento son los editores de alertas, que te permiten publicar notificaciones cuando ocurren eventos poco comunes. Los procesos posteriores se pueden suscribir a esas notificaciones para activar un procesamiento personalizado de las alertas.
Condiciones Los flujos de procesamiento también ofrecen complementos de flujo de control con las denominadas condiciones. Estos complementos te permiten dividir el flujo de procesamiento en dos ramas separadas, dependiendo de si el predicado de la condición especificada devuelve el valor verdadero o falso.