Cloud Dataprep di Trifacta

Un servizio dati cloud intelligente per esplorare in modo visivo, ripulire e preparare i dati per l'analisi e il machine learning.

Visualizza la documentazione per questo prodotto.

Preparazione intelligente dei dati

Preparazione intelligente dei dati

Cloud Dataprep di Trifacta è un servizio dati intelligente che consente di esplorare in modo visivo, ripulire e preparare dati strutturati e non strutturati per l'analisi, il reporting e il machine learning. Dato che Cloud Dataprep è serverless e funziona su qualsiasi scala, non è necessario eseguire il deployment o gestire alcuna infrastruttura. La prossima trasformazione ideale dei dati viene suggerita e prevista a ogni input nell'interfaccia utente, quindi non hai bisogno di scrivere codice. Grazie al rilevamento automatico di schemi, tipi di dati, possibili unioni e anomalie, puoi saltare il lungo lavoro di profilazione dei dati e concentrarti sull'analisi.

Semplicità serverless

Cloud Dataprep è un servizio partner integrato gestito da Trifacta e basato sulla soluzione di preparazione dati leader del settore Trifacta Wrangler. Google lavora a stretto contatto con Trifacta per fornire un'esperienza utente semplificata che elimini la necessità di installazione preliminare di software, costi di licenze distinti o costi operativi generali ricorrenti. Cloud Dataprep è completamente gestito e garantisce scalabilità on demand per soddisfare le tue crescenti esigenze in termini di preparazione dei dati, così potrai concentrarti sull'analisi.

Esplorazione rapida e rilevamento anomalie

Comprendi ed esplora i dati immediatamente con le distribuzioni visive dei dati. Cloud Dataprep rileva automaticamente schemi, tipi di dati, possibili unioni e anomalie quali valori mancanti, eccezioni e duplicati, così puoi saltare il lungo lavoro di profilazione dei dati e passare direttamente all'esplorazione e all'analisi dei dati.

Preparazione dei dati semplice ed efficace

Ogni gesto nell'interfaccia utente di Cloud Dataprep suggerisce e prevede automaticamente la successiva trasformazione ideale dei dati. Una volta definita la sequenza di trasformazioni, Cloud Dataprep utilizza Cloud Dataflow in modo approfondito, consentendoti di elaborare set di dati strutturati o non strutturati di qualsiasi dimensione con un semplice clic, senza scrivere alcuna riga di codice.

Funzionalità

Trasformazione predittiva

Cloud Dataprep utilizza un algoritmo di inferenza proprietario per interpretare l'intento di trasformazione dei dati selezionati da un utente. Viene generato automaticamente un insieme classificato di suggerimenti e modelli a cui abbinare le selezioni.

Parametrizzazione

Esegui una formula su più istanze di set di dati identici parametrizzando una variabile per sostituire le parti del percorso del file che cambiano con ciascun aggiornamento. Questa variabile può essere modificata secondo necessità durante la fase runtime del job.

Collaborazione

Negli ambienti dove si opera in squadra, può essere utile consentire a più utenti di lavorare sugli stessi asset o creare copie di lavori di buona qualità da utilizzare come modelli per altri team. Cloud Dataprep consente agli utenti di collaborare agli stessi oggetti di flusso in tempo reale o di creare copie che altri possano utilizzare per lavorare in maniera indipendente.

Corrispondenza di pattern

Utilizza la corrispondenza dei pattern a colonna per identificare i pattern di dati di tuo interesse e visualizzarli nell'interfaccia al fine di utilizzarli nella creazione delle tue formule. Inoltre, nei passaggi della tua formula, puoi applicare espressioni regolari o pattern di Cloud Dataprep per individuare pattern e trasformare i dati corrispondenti nei tuoi set di dati.

Profilazione visiva

Visualizza ed esplora i tuoi dati attraverso distribuzioni visive interattive dei tuoi dati per facilitare la scoperta, la pulizia e la trasformazione. Le rappresentazioni visive aiutano a interpretare grandi volumi di dati e le innovative tecniche di profilazione di Cloud Dataprep mostrano le informazioni statistiche chiave in un formato dinamico e facile da utilizzare.

Campionamento

Per l'ottimizzazione delle prestazioni, Cloud Dataprep genera automaticamente uno o più campioni dei dati al fine di visualizzarli e manipolarli nell'applicazione client. Tuttavia, è possibile modificare facilmente la dimensione dei campioni, l'ambito del campione e il metodo tramite cui quest'ultimo viene creato.

Programmazione

Programma l'esecuzione di formule nei tuoi flussi su base ricorrente o in base alle necessità. Quando il job programmato viene eseguito con successo, è possibile raccogliere l'output con wrangling nel percorso di output specificato, dove è disponibile nel formato pubblicato che hai specificato.

Corrispondenza di target

Definisci gli schemi target attraverso set di dati importati o creati e assegnali a una formula esistente per sistematizzare e velocizzare le tue attività di wrangling. Gli schemi target vengono visualizzati nella pagina Trasformatore e possono essere applicate all'intero set di dati o a colonne selezionate del set di dati su cui eseguire il wrangling.

Tipi di dati comuni

Trasforma set di dati strutturati o non strutturati, archiviati in formato CSV, JSON o di tabella relazionale, di qualsiasi dimensione (dai megabyte ai petabyte) con la massima semplicità.

Integrazione con Google Cloud Platform

Elabora i dati archiviati in Cloud Storage, BigQuery o dal desktop, quindi esporta i dati perfezionati in BigQuery o Cloud Storage per l'archiviazione, l'analisi, la visualizzazione o il machine learning. Grazie a Cloud Identity and Access Management l'accesso degli utenti e la sicurezza dei dati vengono gestiti facilmente.

Architettura di Cloud Dataprep

Architettura di Cloud Dataprep

Cloud Dataprep ci consente di esplorare rapidamente nuovi set di dati e la sua flessibilità supporta tutte le nostre esigenze di trasformazione dei dati. Il lavoro di preparazione dei dati in Merkle adesso si completa in pochi minuti, non in ore o giorni, accelerando il nostro tempo di preparazione dei dati del 90%.

Henry Culver, IT Architect, Merkle

I nostri clienti

Risorse

Prezzi

Cloud Dataprep è un'applicazione web interattiva in cui puoi definire regole di preparazione dei dati mediante l'interazione con un campione dei tuoi dati. L'uso dell'applicazione per l'esplorazione dei dati del campione, la definizione dei passaggi di trasformazione e l'esportazione del campione trasformato non comportano alcun addebito. Per l'esecuzione del flusso sul set di dati completo, il flusso può essere eseguito come un job di Cloud Dataprep (utilizzando Google Cloud Dataflow). Scopri altre informazioni e visualizza i dettagli completi nella guida ai prezzi.

Google Cloud

Inizia

Impara e crea

Non hai mai usato GCP? Inizia a utilizzare gratuitamente qualsiasi prodotto GCP con un credito di $ 300.

Hai bisogno di ulteriore assistenza?

I nostri esperti ti aiuteranno a creare la soluzione adeguata o a trovare il partner adatto alle tue esigenze.

Invia feedback per...

Cloud Dataprep by Trifacta