Organiza tus páginas con colecciones
Guarda y categoriza el contenido según tus preferencias.
En esta página, se explica cómo quitar errores comunes de un conjunto de datos cuando preparas
los datos en el espacio de trabajo de Wrangler de Cloud Data Fusion Studio.
Los siguientes tipos de errores ocurren en los conjuntos de datos:
Errores sistémicos, como fallas de servicio o de instancia
Errores lógicos, como fallas en la ejecución de canalizaciones
Errores de datos, como números de tarjetas de crédito, formatos de fecha o códigos postales no válidos
Wrangler proporciona un conjunto de más de 50 directivas para ayudarte a quitar errores comunes de un conjunto de datos.
En la pestaña Datos, ve al nombre de una columna y haz clic en la flecha del expansor arrow_drop_down.
Selecciona Enviar a error y, luego, selecciona la condición que envía los registros incorrectos a error.
Wrangler quita del muestreo los valores que coinciden con la condición especificada y agrega la directiva send to error a la receta. Cuando ejecutas la canalización de datos, la transformación se aplica a todos los valores de la columna.
Agrega un complemento de recopilador de errores a una canalización de datos
Cuando agregas una transformación de Wrangler con una receta que incluye la directiva send to
error a una canalización de datos, puedes conectarla al complemento Error Collector. Por lo general, el complemento Error Collector se conecta a un complemento de receptor downstream, como un receptor de BigQuery.
Cuando ejecutas la canalización, los registros marcados por la directiva send to error van del paso de transformación de Wrangler en tu canalización al paso de Error Collector y al paso de sink. Cuando finalice la ejecución, podrás examinar esos registros marcados que se escribieron en el destino.
Si tu receta incluye la transformación send to error, pero la canalización
no incluye el complemento Error Collector, los registros marcados por la directiva send to
error se descartan durante la ejecución de la canalización.
[[["Fácil de comprender","easyToUnderstand","thumb-up"],["Resolvió mi problema","solvedMyProblem","thumb-up"],["Otro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Información o código de muestra incorrectos","incorrectInformationOrSampleCode","thumb-down"],["Faltan la información o los ejemplos que necesito","missingTheInformationSamplesINeed","thumb-down"],["Problema de traducción","translationIssue","thumb-down"],["Otro","otherDown","thumb-down"]],["Última actualización: 2025-09-04 (UTC)"],[[["\u003cp\u003eWrangler, within Cloud Data Fusion Studio, helps remove systemic, logical, and data errors from datasets using over 50 directives.\u003c/p\u003e\n"],["\u003cp\u003eYou can send bad records to error in Wrangler by selecting the 'Send to error' option under a column and specifying the conditions for flagging the record.\u003c/p\u003e\n"],["\u003cp\u003eThe 'send to error' directive, when added to a pipeline's recipe in Wrangler, flags records which can be sent to the Error Collector plugin and subsequently a sink.\u003c/p\u003e\n"],["\u003cp\u003eIf the Error Collector plugin is not used, records flagged by the 'send to error' directive are dropped during the pipeline run.\u003c/p\u003e\n"]]],[],null,["# Send records to error\n\nThis page explains how to remove common errors from a dataset when you prepare\ndata in the Wrangler workspace of the Cloud Data Fusion Studio.\n\nThe following types of errors occur in datasets:\n\n- Systemic errors, such as service or instance failures\n- Logical errors, such as pipeline run failures\n- Data errors, such as invalid credit card numbers, invalid date formats, or invalid zip codes\n\nWrangler provides a set of over 50 directives to help you remove common errors\nfrom a dataset.\n\nTo send records to error, follow these steps:\n\n1. [Go to the Wrangler workspace in Cloud Data Fusion](/data-fusion/docs/concepts/wrangler-overview#navigate-to-wrangler).\n2. On the **Data** tab, go to a column name and click the arrow_drop_down expander arrow.\n3. Select **Send to error**, and then select the condition that sends bad records to error.\n\nWrangler removes values that match the specified condition from the sample and\nadds the `send to error` directive to the recipe. When you run the data\npipeline, the transformation is applied to all values in the column.\n\nAdd an error collector plugin to a data pipeline\n------------------------------------------------\n\nWhen you add a Wrangler transformation with a recipe that includes the `send to\nerror` directive to a data pipeline, you can choose to connect it to the Error\nCollector plugin. The Error Collector plugin is usually connected to a\ndownstream sink plugin, such as a BigQuery sink.\n\nWhen you run the pipeline, the records flagged by the `send to error` directive\ngo from the Wrangler transformation step in your pipeline, to the Error Collector\nstep, to the sink step. When the run finishes, you can examine those flagged\nrecords written to the sink.\n\nIf your recipe includes the `send to error` transformation, but the pipeline\ndoesn't include the Error Collector plugin, the records flagged by the `send to\nerror` directive are dropped during the pipeline run.\n\nWhat's next\n-----------\n\n- Learn more about [Wrangler directives](/data-fusion/docs/concepts/wrangler-overview#apply_directives)."]]