Barras de qualidade de dados

Logo abaixo do nome da coluna na grade de dados há uma faixa horizontal que identifica problemas de qualidade de dados entre os valores da amostra na coluna.

Figura: barras de qualidade de dados

Cada faixa de cores identifica o número relativo de registros que se enquadram nas seguintes definições de qualidade de dados:

CorTipoDescrição
VerdeVálidoValor válido para o tipo de dados selecionado no momento.
VermelhoIncompatível

Um valor que não corresponde ao tipo listado de dados. Por exemplo, se uma coluna do tipo Zip inclui MISSING, ela é considerada um valor incompatível.

Para mais informações, consulte Localizar dados incorretos.

PretoAusente

O valor está vazio ou é nulo. Para mais informações, consulte Gerenciar valores nulos.

Você pode usar a barra de qualidade de dados de uma coluna para criar uma etapa da receita a fim de lidar com os dados selecionados. Por exemplo, clique no conjunto de valores vermelho na barra de qualidade de dados para gerar um conjunto de cartões de sugestão para resolver valores incompatíveis na coluna.

Dica: o histograma também pode mostrar variações indesejadas nos valores. Por exemplo, se a coluna armazena dados de latitude, a precisão pode ser muito refinada (por exemplo, 37.764013 e 37.76022 em vez de 37.76). Você pode usar as etapas da receita para arredondar os dados a um nível de precisão mais usável e, desse modo, reduzir o número de valores exclusivos na coluna a uma contagem mais gerenciável. Consulte a Função ROUND.

Para saber mais, veja Tipos de dados compatíveis.

Esta página foi útil? Conte sua opinião sobre:

Enviar comentários sobre…

Documentação do Google Cloud Dataprep
Precisa de ajuda? Acesse nossa página de suporte.