Dataprep di Trifacta

Un servizio dati cloud intelligente per esplorare in modo visivo, ripulire e preparare i dati per l'analisi e il machine learning.

Visualizza la documentazione per questo prodotto.

Preparazione intelligente dei dati

Preparazione intelligente dei dati

Cloud Dataprep di Trifacta è un servizio dati intelligente che consente di esplorare in modo visivo, ripulire e preparare dati strutturati e non strutturati per l'analisi, il reporting e il machine learning. Dato che Cloud Dataprep è serverless e funziona su qualsiasi scala, non è necessario eseguire il deployment o gestire alcuna infrastruttura. La prossima trasformazione ideale dei dati viene suggerita e prevista a ogni input nell'interfaccia utente, quindi non hai bisogno di scrivere codice.

Novità

Semplicità serverless

Cloud Dataprep è un servizio partner integrato gestito da Trifacta e basato sulla soluzione di preparazione dati leader del settore. Google lavora a stretto contatto con Trifacta per fornire un'esperienza utente semplificata che elimini la necessità di installazione preliminare di software, costi di licenze distinti o overhead operativo ricorrente. Cloud Dataprep è completamente gestito e garantisce scalabilità on demand per soddisfare le tue crescenti esigenze in termini di preparazione dei dati, così potrai concentrarti sull'analisi.

Esplorazione rapida e rilevamento anomalie

Comprendi ed esplora i dati immediatamente con le distribuzioni visive dei dati. Cloud Dataprep rileva automaticamente schemi, tipi di dati, possibili unioni e anomalie quali valori mancanti, eccezioni e duplicati, così puoi saltare il lungo lavoro di valutazione della qualità dei dati e passare direttamente all'esplorazione e all'analisi.

Preparazione dei dati semplice ed efficace

Ogni gesto nell'interfaccia utente di Cloud Dataprep suggerisce e prevede automaticamente la successiva trasformazione ideale dei dati. Una volta definita la sequenza di trasformazioni, Cloud Dataprep utilizza Cloud Dataflow in background, consentendoti di elaborare set di dati strutturati o non strutturati di qualsiasi dimensione con un semplice clic, senza scrivere alcuna riga di codice.

Funzionalità

Trasformazione predittiva

Cloud Dataprep utilizza un algoritmo di inferenza proprietario per interpretare l'intento di trasformazione dei dati selezionati da un utente. Viene generato automaticamente un insieme classificato di suggerimenti e pattern a cui abbinare le selezioni.

Trasformazioni avanzate

Sfrutta centinaia di funzioni di trasformazione per trasformare i tuoi dati nell'asset di cui hai bisogno. Ti basta fare clic con il mouse per eseguire aggregazione, pivot, unpivot, unioni, estrazione, calcolo, confronto, condizione, merge, espressioni regolari e altro ancora.

Parametrizzazione

Esegui una formula su più istanze di set di dati identici parametrizzando una variabile per sostituire le parti del percorso del file che cambiano con ciascun aggiornamento. Questa variabile può essere modificata secondo necessità durante la fase runtime del job.

Collaborazione

Negli ambienti dove si opera in squadra, può essere utile consentire a più utenti di lavorare sugli stessi asset o creare copie di buona qualità da utilizzare come modelli per altri team. Cloud Dataprep consente agli utenti di collaborare agli stessi oggetti di flusso in tempo reale o di creare copie che altri possano utilizzare per lavorare in maniera indipendente.

Corrispondenza di pattern

Utilizza la corrispondenza dei pattern a colonna per identificare i pattern di dati di tuo interesse e visualizzarli nell'interfaccia al fine di utilizzarli nella creazione delle tue formule. Inoltre, nei passaggi della tua formula, puoi applicare espressioni regolari o pattern di Cloud Dataprep per individuare pattern e trasformare i dati corrispondenti nei tuoi set di dati.

Standardizzazione

Raggruppa i valori per analogie in base all'ortografia o alla pronuncia indipendentemente dalla lingua e crea cluster standardizzati di valori coerenti.

Profilazione attiva

Visualizza ed esplora i tuoi dati attraverso distribuzioni visive interattive dei tuoi dati per facilitare la scoperta, la pulizia e la trasformazione. Le rappresentazioni visive aiutano a interpretare grandi volumi di dati e le innovative tecniche di profilazione di Cloud Dataprep mostrano le informazioni statistiche chiave in un formato dinamico e facile da utilizzare.

Campionamento

Per l'ottimizzazione delle prestazioni, Cloud Dataprep genera automaticamente uno o più campioni dei dati al fine di visualizzarli e manipolarli nell'applicazione client. Tuttavia, è possibile modificare facilmente la dimensione dei campioni, l'ambito del campione e il metodo tramite cui quest'ultimo viene creato.

Programmazione

Programma l'esecuzione di formule nei tuoi flussi su base ricorrente o in base alle necessità. Quando il job programmato viene eseguito correttamente, è possibile raccogliere l'output con wrangling nel percorso di output specificato, dove è disponibile nel formato pubblicato che hai specificato.

Targeting rapido

Definisci gli schemi target attraverso set di dati importati o creati e assegnali a una formula esistente per sistematizzare e velocizzare le tue attività di wrangling. Gli schemi target vengono visualizzati nella pagina Transformer (Trasformatore) e possono essere applicati all'intero set di dati o a colonne selezionate del set di dati su cui eseguire il wrangling.

Tipi di dati comuni

Trasforma set di dati strutturati o non strutturati, archiviati in formato CSV, JSON o di tabella relazionale, di qualsiasi dimensione (dai megabyte ai petabyte) con la massima semplicità.

Integrazione con Google Cloud Platform

Elabora i dati archiviati in Cloud Storage, BigQuery o dal desktop, quindi esporta i dati perfezionati in BigQuery o Cloud Storage per l'archiviazione, l'analisi, la visualizzazione o il machine learning. Grazie a Cloud Identity and Access Management l'accesso degli utenti e la sicurezza dei dati vengono gestiti facilmente.

Architettura di Cloud Dataprep

Architettura di Cloud Dataprep

Cloud Dataprep ci consente di esplorare rapidamente nuovi set di dati e la sua flessibilità supporta tutte le nostre esigenze di trasformazione dei dati. Il lavoro di preparazione dei dati in Merkle adesso si completa in pochi minuti, anziché in ore o giorni, accelerando il tempo di preparazione dei dati del 90%.

Henry Culver, IT Architect, Merkle

I nostri clienti

Risorse

Prezzi

Cloud Dataprep è un'applicazione web interattiva in cui gli utenti possono definire regole di preparazione dei dati mediante l'interazione con un campione degli stessi. Per l'esecuzione sul set di dati completo, il flusso può essere eseguito come un job di Cloud Dataprep (utilizzando Google Cloud Dataflow). Scopri altre informazioni e visualizza i dettagli completi nella guida ai prezzi.

Fai un passo avanti

Inizia a creare su Google Cloud con $ 300 di crediti gratuiti e oltre 20 prodotti Always Free.

Hai bisogno di aiuto per iniziare?
Collabora con un partner di fiducia
Continua la navigazione