Princípios básicos do fluxo de trabalho

O Cloud Dataprep by TRIFACTA® permite que analistas, especialistas em dados e outros especialistas em domínio limpem e transformem rapidamente conjuntos de dados de diferentes tamanhos para uso em toda a empresa. Usando um conjunto inovador de ferramentas baseadas na Web, você pode importar conjuntos de dados complexos e transformá-los para uso em praticamente qualquer sistema de destino. As principais capacidades incluem:

  • Importar de arquivos planos, bancos de dados ou sistemas de armazenamento distribuídos

  • Localizar e remover ou modificar dados ausentes ou incompatíveis.
  • Desaninhar estruturas de dados complexas.
  • Identificar valores atípicos estatísticos nos dados para revisão e gerenciamento.
  • Executar pesquisas de um conjunto de dados em outro conjunto de dados de referência.
  • Agregar dados em coluna usando uma variedade de funções de agregação.
  • Normalizar valores da coluna para uso e modelagem estatística mais consistente.
  • Mesclar conjuntos de dados com junções.
  • Anexar um conjunto de dados a outro com operações de união.

A maioria dessas operações pode ser executada com alguns cliques no mouse. Nesta seção, fornecemos uma visão geral básica de fluxos de trabalho comuns com o Cloud Dataprep by TRIFACTA.

Pré-requisitos

Antes de começar, verifique:

  1. Conta do Cloud Dataprep: você tem uma conta do Cloud Dataprep e pode fazer login.

  2. Dados de exemplo: você deve usar um conjunto de dados de amostra durante este fluxo de trabalho.

Fluxo de trabalho básico

  1. Analisar a visão geral do objeto: antes de começar, analise a visão geral dos objetos criados e mantidos no Cloud Dataprep by TRIFACTA. Consulte Visão geral do objeto.
  2. Importar dados: integre dados de diversas de origens. Consulte Princípios básicos de importação.
  3. Categorizar dados: antes, durante e depois da transformação dos dados, você pode usar as ferramentas visuais de geração de perfil para analisar e tomar decisões rapidamente sobre seus dados. Consulte Princípios básicos de criação de perfis.
  4. Construir receitas de transformação: use as várias visualizações da página "Transformer" para criar suas receitas transformadas e visualizar os resultados em dados amostrados. Consulte Princípios básicos da transformação.
  5. Executar job: inicie um job para executar a receita no conjunto de dados completo. Revise os resultados e itere como necessário. Consulte Princípios básicos da execução de jobs.

  6. Exportar resultados: exporte os dados de resultados gerados para uso fora do Cloud Dataprep by TRIFACTA. Consulte Princípios básicos da exportação.
Esta página foi útil? Conte sua opinião sobre:

Enviar comentários sobre…

Documentação do Google Cloud Dataprep
Precisa de ajuda? Acesse nossa página de suporte.