Mantieni tutto organizzato con le raccolte
Salva e classifica i contenuti in base alle tue preferenze.
Questa pagina spiega come rimuovere gli errori comuni da un set di dati quando prepari i dati nello spazio di lavoro Wrangler di Cloud Data Fusion Studio.
Nei set di dati si verificano i seguenti tipi di errori:
Errori sistemici, ad esempio errori di servizio o di istanza
Errori logici, ad esempio errori di esecuzione della pipeline
Errori nei dati, ad esempio numeri di carte di credito non validi, formati di date non validi o
codici postali non validi
Wrangler fornisce un insieme di oltre 50 direttive per aiutarti a rimuovere gli errori comuni
da un set di dati.
Nella scheda Dati, vai a un nome di colonna e fai clic sulla freccia di espansione arrow_drop_down.
Seleziona Invia a errore, quindi seleziona la condizione che invia i record errati a errore.
Wrangler rimuove dal campione i valori corrispondenti alla condizione specificata e aggiunge la direttiva send to error alla ricetta. Quando esegui la pipeline di dati, la trasformazione viene applicata a tutti i valori della colonna.
Aggiungere un plug-in di raccolta degli errori a una pipeline di dati
Quando aggiungi una trasformazione di Wrangler con una ricetta che include la direttiva send to
error a una pipeline di dati, puoi scegliere di collegarla al plug-in ErrorCollector. Il plug-in Error Collector è solitamente collegato a un plug-in di destinazione a valle, ad esempio un'area di destinazione BigQuery.
Quando esegui la pipeline, i record segnalati dalla direttiva send to error passano dal passaggio di trasformazione di Wrangler nella pipeline al passaggio del Raccogli errori e al passaggio del sink. Al termine dell'esecuzione, puoi esaminare i record contrassegnati come problematici scritti nello sink.
Se la ricetta include la trasformazione send to error, ma la pipeline non include il plug-in Error Collector, i record segnalati dalla direttiva send to error vengono eliminati durante l'esecuzione della pipeline.send to
error
[[["Facile da capire","easyToUnderstand","thumb-up"],["Il problema è stato risolto","solvedMyProblem","thumb-up"],["Altra","otherUp","thumb-up"]],[["Difficile da capire","hardToUnderstand","thumb-down"],["Informazioni o codice di esempio errati","incorrectInformationOrSampleCode","thumb-down"],["Mancano le informazioni o gli esempi di cui ho bisogno","missingTheInformationSamplesINeed","thumb-down"],["Problema di traduzione","translationIssue","thumb-down"],["Altra","otherDown","thumb-down"]],["Ultimo aggiornamento 2025-09-04 UTC."],[[["\u003cp\u003eWrangler, within Cloud Data Fusion Studio, helps remove systemic, logical, and data errors from datasets using over 50 directives.\u003c/p\u003e\n"],["\u003cp\u003eYou can send bad records to error in Wrangler by selecting the 'Send to error' option under a column and specifying the conditions for flagging the record.\u003c/p\u003e\n"],["\u003cp\u003eThe 'send to error' directive, when added to a pipeline's recipe in Wrangler, flags records which can be sent to the Error Collector plugin and subsequently a sink.\u003c/p\u003e\n"],["\u003cp\u003eIf the Error Collector plugin is not used, records flagged by the 'send to error' directive are dropped during the pipeline run.\u003c/p\u003e\n"]]],[],null,["# Send records to error\n\nThis page explains how to remove common errors from a dataset when you prepare\ndata in the Wrangler workspace of the Cloud Data Fusion Studio.\n\nThe following types of errors occur in datasets:\n\n- Systemic errors, such as service or instance failures\n- Logical errors, such as pipeline run failures\n- Data errors, such as invalid credit card numbers, invalid date formats, or invalid zip codes\n\nWrangler provides a set of over 50 directives to help you remove common errors\nfrom a dataset.\n\nTo send records to error, follow these steps:\n\n1. [Go to the Wrangler workspace in Cloud Data Fusion](/data-fusion/docs/concepts/wrangler-overview#navigate-to-wrangler).\n2. On the **Data** tab, go to a column name and click the arrow_drop_down expander arrow.\n3. Select **Send to error**, and then select the condition that sends bad records to error.\n\nWrangler removes values that match the specified condition from the sample and\nadds the `send to error` directive to the recipe. When you run the data\npipeline, the transformation is applied to all values in the column.\n\nAdd an error collector plugin to a data pipeline\n------------------------------------------------\n\nWhen you add a Wrangler transformation with a recipe that includes the `send to\nerror` directive to a data pipeline, you can choose to connect it to the Error\nCollector plugin. The Error Collector plugin is usually connected to a\ndownstream sink plugin, such as a BigQuery sink.\n\nWhen you run the pipeline, the records flagged by the `send to error` directive\ngo from the Wrangler transformation step in your pipeline, to the Error Collector\nstep, to the sink step. When the run finishes, you can examine those flagged\nrecords written to the sink.\n\nIf your recipe includes the `send to error` transformation, but the pipeline\ndoesn't include the Error Collector plugin, the records flagged by the `send to\nerror` directive are dropped during the pipeline run.\n\nWhat's next\n-----------\n\n- Learn more about [Wrangler directives](/data-fusion/docs/concepts/wrangler-overview#apply_directives)."]]