Assista sob demanda: Google Data Cloud Summit para conhecer as inovações mais recentes em análise, IA, Business Intelligence e bancos de dados.

Dataprep by Trifacta

Um serviço inteligente de dados na nuvem para análise visual, limpeza e preparação de dados para análise e machine learning.

Há um ícone do Dataprep em frente a um laptop aberto. À esquerda do laptop, há uma planilha com o logotipo da Trifacta, há uma pilha de páginas da Web à direita e, atrás do laptop, há um gráfico de barras dentro de uma nuvem.

Preparação de dados inteligente

O Cloud Dataprep by Trifacta é um serviço de dados inteligente que permite a análise visual, a limpeza e a preparação de dados estruturados e não estruturados para análise, geração de relatórios e machine learning. Como o Dataprep não tem servidor e funciona em qualquer escala, não há infraestrutura para implantar ou gerenciar. Sua próxima transformação ideal de dados é sugerida e prevista com cada entrada na IU, assim você não precisa escrever código.

Novidades

Monitor de computador com dados na tela dele

Simplicidade sem servidor

O Dataprep é um serviço integrado de parceiros operado pela Trifacta e baseado na solução de preparação de dados da empresa que é líder do setor. O Google trabalha com a Trifacta para proporcionar uma experiência inigualável ao usuário, que elimina a necessidade de instalação antecipada de software, gastos extras com licenciamento ou sobrecarga operacional contínua. O Dataprep é totalmente gerenciado e pode ser escalonado de acordo com a demanda para atender às suas necessidades crescentes de preparação de dados. Assim você se concentra na análise.

Gráfico estilizado com um ícone de cronômetro

Rapidez na exploração e detecção de anomalias

Entenda e analise os dados rapidamente por meio de distribuições. O Dataprep detecta automaticamente esquemas, tipos de dados, possíveis junções e anomalias, como valores ausentes, outliers e elementos duplicados para que você pule a demorada etapa de avaliação da qualidade de seus dados e se concentre na análise.

Um documento com texto e marcas de seleção azuis saindo de uma caixa de papelão à direita. À esquerda está o ícone do Dataprep.

Facilidade e eficiência na preparação de dados

A cada ação que você realiza na IU, o Cloud Dataprep sugere e prevê automaticamente a próxima transformação ideal de dados. Depois que você define a sequência de transformações, o Dataprep usa o Dataflow ou o BigQuery como base, permitindo processar conjuntos de dados estruturados e não estruturados de qualquer tamanho com apenas alguns cliques, sem precisar escrever nenhum código.

Recursos do Dataprep

Edições Starter, Professional e Enterprise.

Transformação preditiva

O Dataprep usa o próprio algoritmo de inferência para interpretar a intent de transformação dos dados da seleção de um usuário. Um conjunto classificado de sugestões e padrões das seleções de correspondência é gerado automaticamente.

Transformações avançadas

Aproveite centenas de funções de transformação para transformar seus dados no recurso que quiser. Com um clique do mouse, aplique agregação, pivot, unpivot, mesclagens, união, extração, cálculo, comparação, condição, merge, expressões regulares e muito mais.

Capacidade de processamento otimizada

O Dataprep seleciona automaticamente o melhor mecanismo de processamento do Google Cloud subjacente para transformar os dados o mais rápido possível. Com base na localidade e volume de dados, o Dataprep aproveita o BigQuery (transformações ELT no local) para preparar os dados, o Dataflow ou para o pequeno volume, o mecanismo na memória do Dataprep.

Criação de perfis ativos

Confira e explore seus dados usando distribuições visuais interativas que auxiliam na descoberta, na limpeza e na transformação. As representações visuais ajudam a interpretar grandes volumes de dados, e as técnicas inovadoras de criação de perfis do Cloud Dataprep permitem a exibição das principais informações estatísticas em um formato dinâmico e fácil de usar.

Regras de qualidade dos dados

As regras de qualidade sugerem indicadores de qualidade para monitorar e corrigir a precisão, a integridade, a consistência, a validade e a exclusividade dos dados, garantindo que você tenha uma visão abrangente da limpeza dos dados.

Colaboração

Em um ambiente de equipe, pode ser útil ter vários usuários trabalhando nos mesmos recursos ou criar cópias de trabalho de boa qualidade que sirvam de modelo para outras pessoas. O Cloud Dataprep permite que os usuários colaborem nos mesmos objetos de fluxo em tempo real ou criem cópias para outros usarem em trabalhos independentes.

Conectividade abrangente

Além da conectividade padrão do BigQuery, Cloud Storage, Microsoft Excel e Planilhas Google, aprimore sua análise de autoatendimento com centenas de fontes de dados, como Salesforce, Oracle, Microsoft SQL Server, MySQL e PostgreSQL, entre outros.

Orquestração de pipeline de dados

Programe e automatize os jobs de preparação de dados encadeando-os em ordem sequencial e condicional. Alerte os usuários sobre o sucesso ou a falha e acione tarefas externas (como o Cloud Functions). Aproveite as APIs abrangentes para integrar o Cloud Dataprep como parte da solução completa de uma empresa.

Operacionalização em escala empresarial

Adote uma prática de implantação contínua com importação/exportação de receitas em edições e versões, parâmetros de fluxo, configuração personalizada para ajuste de desempenho do Google Dataflow ou BigQuery e APIs avançadas para automatizar o ciclo de vida de desenvolvimento de software e o monitoramento.

Tipos de dados comuns

Transforme conjuntos de dados estruturados ou não estruturados, armazenados nos formatos CSV, JSON, em tabelas relacionais ou dados de aplicativos SaaS de qualquer tamanho (de megabytes a petabytes) com a mesma facilidade e simplicidade.

Correspondência de padrões

Utilize correspondência colunar de padrões para identificar os padrões de dados relevantes e evidenciá-los na interface a fim de usá-los na criação dos roteiros. Além disso, durante as etapas de criação, é possível aplicar expressões regulares ou padrões do Dataprep para localizar padrões e transformar os dados correspondentes nos seus conjuntos.

Padronização

Agrupar valores por semelhanças com base na ortografia ou na pronúncia independente do idioma e criar clusters padronizados de valores consistentes.

Amostragem

Para otimizar o desempenho, o Dataprep gera automaticamente uma ou mais amostras de dados para exibição e manipulação no aplicativo cliente. No entanto, é possível alterar facilmente o tamanho, o escopo e o método usado para a criação.

Segurança avançada

Expanda os padrões de segurança atuais fornecendo controle de acesso a dados individuais usando uma combinação de papéis de IAM do Google e o BigQuery, o Cloud Storage e os direitos de acesso do Planilhas Google para determinar o acesso.

Arquitetura de pipeline do Dataprep ELT

À esquerda, a coluna "Ingestão" contém dados brutos no BigQuery, Cloud Storage, Planilhas Google, Excel, bancos de dados, aplicativos e uploads de arquivos. Uma seta aponta para a direita, onde está a coluna "Preparação e armazenamento". Essa linha passa pelo Cloud Dataprep e Dataflow até chegar numa parte que mostra que os dados são refinados no BigQuery e no Cloud Storage. Abaixo dessa coluna, está a seção "Governança e Automação", que mostra os itens Data Catalog, Cloud Functions e Cloud Composer. A linha continua indo para a direita até a coluna "Análise e ML". Nela, são exibidos os ícones do BigQuery/BigQueryML, Looker, Google Data Studio, serviços de BI para parceiros (logotipo da Qlik) e Cloud AI Platform.
Logotipo da Merkle

"O Dataprep nos permite analisar rapidamente novos conjuntos de dados, e a flexibilidade dele oferece suporte a todas as nossas necessidades de transformação de dados. A preparação de dados na Merkle é concluída em questão de minutos, não horas ou dias, o que acelera em 90% o tempo dedicado a esse processo."

Henry Culver, arquiteto de TI da Merkle

Leia a história

Nossos clientes

Preços

Consulte nossa página de preços no Google Cloud Marketplace.

Vá além

Comece a criar no Google Cloud com US$ 300 em créditos e mais de 20 produtos do programa Sempre gratuito.

Precisa de ajuda para começar?
Trabalhe com um parceiro confiável
Continue navegando

Vá além

Inicie seu próximo projeto, confira tutoriais interativos e gerencie sua conta.

Precisa de ajuda para começar?
Trabalhe com um parceiro confiável
Confira dicas e práticas recomendadas