Cloud Dataprep by Trifacta

Um serviço inteligente de dados na nuvem para exploração visual, limpeza e preparação de dados para análise e machine learning.

Preparação de dados inteligente

Preparação de dados inteligente

O Cloud Dataprep by Trifacta é um serviço de dados inteligente que permite a exploração visual, a limpeza e a preparação de dados estruturados e não estruturados para análise, geração de relatórios e machine learning. Por se tratar de um serviço sem servidor que funciona em qualquer escala, não há infraestrutura para implantar ou gerenciar. Sua próxima transformação ideal de dados é sugerida e prevista em cada entrada na IU. Assim, você não precisa escrever nenhum código. Além disso, com o esquema, o tipo de dados, as possíveis junções e a detecção de anomalias de maneira automática, você pula a demorada etapa de criação do perfil dos dados e se concentra na análise deles.

Simplicidade sem servidor

Simplicidade sem servidor

O Cloud Dataprep é um serviço de parceiros integrado operado pela Trifacta e se baseia na solução de preparação de dados líder do setor, o Trifacta Wrangler. O Google trabalha com a Trifacta para proporcionar uma experiência inigualável ao usuário, que elimina a necessidade de instalação antecipada de software, gastos à parte com licenciamento ou sobrecarga operacional contínua. O Cloud Dataprep é totalmente gerenciado e pode ser escalonado de acordo com a demanda para atender às suas necessidades cada vez maiores de preparação de dados. Assim, você mantém o foco na análise.

Rapidez na exploração e detecção de anomalias

Rapidez na exploração e detecção de anomalias

Entenda e explore os dados em poucos instantes por meio de distribuições visuais. O Cloud Dataprep detecta automaticamente esquemas, tipos de dados, possíveis junções e anomalias, como valores ausentes, discrepâncias e elementos duplicados para que você pule a demorada etapa de criação do perfil dos dados e se concentre na exploração e na análise.

Facilidade e eficiência na preparação de dados

Facilidade e eficiência na preparação de dados

A cada ação que você realiza na IU, o Cloud Dataprep sugere e prevê automaticamente a próxima transformação ideal de dados. Depois que você define a sequência de transformações, o Cloud Dataprep usa o Cloud Dataflow como base, permitindo processar conjuntos de dados estruturados e não estruturados de qualquer tamanho com apenas alguns cliques, sem precisar escrever nenhum código.

Clientes do Cloud Dataprep

Com o Cloud Dataprep, é possível explorar rapidamente novos conjuntos de dados e, graças à flexibilidade desse serviço, ele atende a todas as nossas necessidades de transformação de dados. A preparação de dados na Merkle é concluída em questão de minutos, não horas ou dias, o que acelera em 90% o tempo dedicado a esse processo.

Henry Culver, arquiteto de TI da Merkle

Arquitetura do Cloud Dataprep

Arquitetura do Cloud Dataprep

Recursos do Cloud Dataprep

Transformação preditiva

O Cloud Dataprep usa um algoritmo de inferência reservado para interpretar o intent de transformação dos dados da seleção de um usuário. Um conjunto classificado de sugestões e padrões das seleções de correspondência é gerado automaticamente.

Parametrização

Execute um roteiro em várias instâncias de conjuntos de dados idênticos ao parametrizar uma variável para substituir as partes do caminho do arquivo que são alteradas a cada atualização. Essa variável pode ser modificada conforme necessário no ambiente de execução do job.

Colaboração

Em um ambiente de equipe, pode ser útil ter vários usuários trabalhando nos mesmos recursos ou criar cópias de trabalho de boa qualidade que sirvam de modelo para outras pessoas. O Cloud Dataprep permite que os usuários colaborem nos mesmos objetos de fluxo em tempo real ou criem cópias para outros usarem em trabalhos independentes.

Correspondência de padrões

Utilize correspondência colunar de padrões para identificar os padrões de dados de interesse para você e evidenciá-los na interface, visando o uso deles na criação dos roteiros. Além disso, nas etapas dos roteiros, é possível aplicar expressões regulares ou padrões do Cloud Dataprep para localizar padrões e transformar os dados correspondentes nos seus conjuntos.

Criação de perfis visuais

Veja e explore seus dados por meio de distribuições visuais interativas que auxiliam na descoberta, limpeza e transformação. As representações visuais ajudam a interpretar grandes volumes de dados, e as técnicas inovadoras de criação de perfis do Cloud Dataprep permitem a exibição das principais informações estatísticas em um formato dinâmico e fácil de usar.

Amostragem

Para otimizar o desempenho, o Cloud Dataprep gera automaticamente uma ou mais amostras de dados a serem exibidas e manipuladas no aplicativo cliente. No entanto, é possível alterar o tamanho, o escopo e o método usado para criá-las com facilidade.

Programação

Programe a execução de roteiros nos seus fluxos de maneira recorrente ou conforme necessário. Após a execução do job programado, será possível coletar o resultado no local de saída indicado disponível no formulário publicado que você especificou.

Correspondência de destino

Defina esquemas de destino por meio de conjuntos de dados importados ou criados e atribua roteiros existentes para sistematizar e agilizar seus esforços. Os destinos aparecem na página do Transformer e podem ser aplicados a todo o conjunto de dados ou a colunas específicas em que você precise trabalhar.

Tipos de dados comuns

Transforme conjuntos de dados estruturados e não estruturados, armazenados nos formatos CSV, JSON ou de tabelas relacionais de qualquer tamanho (de megabytes a petabytes) com a mesma facilidade e simplicidade.

Integrado ao Google Cloud Platform

Processe dados armazenados no Cloud Storage, BigQuery ou no seu computador e, depois, exporte dados refinados para o BigQuery ou o Cloud Storage para armazenamento, análise, visualização ou machine learning. Com o Cloud Identity and Access Management, é possível gerenciar o acesso dos usuários e a segurança dos dados de maneira simples.

Preços do Cloud Dataprep

O Cloud Dataprep é um aplicativo da Web interativo em que os usuários podem definir as regras de preparação de dados por meio da interação com uma amostra. Não há custos extras para o uso do aplicativo na exploração de dados de amostras, definição de etapas de transformação e exportação da amostra transformada. É possível executar o fluxo no conjunto de dados completo como um job do Cloud Dataprep (por meio do Google Cloud Dataflow). Veja mais detalhes no nosso guia de preços.

Recursos

Google Cloud

Primeiros passos

Aprenda e crie

Ainda não conhece o GCP? Comece a usar qualquer produto do GCP gratuitamente com US$ 300 de crédito.

Precisa de mais ajuda?

Nossos especialistas ajudarão você a criar a solução certa ou encontrar o parceiro ideal para suas necessidades.

Enviar comentários sobre…

Cloud Dataprep by Trifacta