Scopri di più sulle ultime innovazioni relative a database, analisi e AI al Data Cloud Summit. Dal vivo e on demand a partire dal 26 maggio.

Dataprep di Trifacta

Un servizio dati cloud intelligente per esplorare in modo visivo, ripulire e preparare i dati per l'analisi e il machine learning.

Visualizza la documentazione di questo prodotto.

L'icona di Dataprep è posizionata davanti a un laptop aperto con una pila di pagine web a destra, un foglio di lavoro con il logo Trifacta a sinistra e un grafico a barre nel cloud dietro

Preparazione intelligente dei dati

Cloud Dataprep di Trifacta è un servizio dati intelligente che consente di esplorare in modo visivo, ripulire e preparare dati strutturati e non strutturati per l'analisi, il reporting e il machine learning. Dato che Cloud Dataprep è serverless e funziona su qualsiasi scala, non è necessario eseguire il deployment o gestire alcuna infrastruttura. La prossima trasformazione ideale dei dati viene suggerita e prevista a ogni input nell'interfaccia utente, quindi non hai bisogno di scrivere codice.

Novità

Monitor di un computer con dati visualizzati

Semplicità serverless

Dataprep è un servizio partner integrato gestito da Trifacta e basato sulla soluzione di preparazione dati leader del settore. Google lavora a stretto contatto con Trifacta per fornire un'esperienza utente semplificata che elimini la necessità di installazione preliminare di software, costi di licenze distinti o overhead operativo ricorrente. Dataprep è completamente gestito e garantisce scalabilità on demand per soddisfare le tue crescenti esigenze in termini di preparazione dei dati, così potrai concentrarti sull'analisi.

Grafico stilizzato con l'icona di un cronometro

Esplorazione rapida e rilevamento di anomalie

Comprendi ed esplora i dati immediatamente con le distribuzioni visive dei dati. Dataprep rileva automaticamente schemi, tipi di dati, possibili unioni e anomalie quali valori mancanti, eccezioni e duplicati, così puoi saltare il lungo lavoro di valutazione della qualità dei dati e passare direttamente all'esplorazione e all'analisi.

Una pagina con testo e spunte blu sul margine destro emerge da una scatola aperta. L'icona di Dataprep è posizionata a sinistra.

Preparazione dei dati semplice ed efficace

Ogni gesto nell'interfaccia utente di Dataprep suggerisce e prevede automaticamente la successiva trasformazione ideale dei dati. Una volta definita la sequenza di trasformazioni, Dataprep utilizza Dataflow o BigQuery in background, consentendoti di elaborare set di dati strutturati o non strutturati di qualsiasi dimensione con un semplice clic, senza scrivere alcuna riga di codice.

Caratteristiche di Dataprep

Versioni Starter, Professional ed Enterprise

Trasformazione predittiva

Dataprep utilizza un algoritmo di inferenza proprietario per interpretare l'intento di trasformazione dei dati selezionati da un utente. Viene generato automaticamente un insieme classificato di suggerimenti e pattern a cui abbinare le selezioni.

Trasformazioni avanzate

Sfrutta centinaia di funzioni di trasformazione per trasformare i tuoi dati nell'asset di cui hai bisogno. Ti basta fare clic con il mouse per eseguire aggregazione, pivot, unpivot, unioni, estrazione, calcolo, confronto, condizione, merge, espressioni regolari e altro ancora.

Velocità effettiva di elaborazione ottimizzata

Dataprep seleziona in automatico il miglior motore sottostante di elaborazione di Google Cloud per trasformare i dati il più rapidamente possibile. In base alla località e al volume dei dati, per prepararli Dataprep utilizza BigQuery (trasformazioni ELT in loco), Dataflow oppure il proprio motore in memoria per volumi ridotti.

Profilazione attiva

Visualizza ed esplora i tuoi dati attraverso distribuzioni visive interattive dei tuoi dati per facilitare la scoperta, la pulizia e la trasformazione. Le rappresentazioni visive aiutano a interpretare grandi volumi di dati e le innovative tecniche di profilazione di Dataprep mostrano le informazioni statistiche chiave in un formato dinamico e facile da utilizzare.

Regole sulla qualità dei dati

Le regole sulla qualità dei dati suggeriscono indicatori di qualità dei dati per monitorare e correggere l'accuratezza, la completezza, la coerenza, la validità e l'unicità dei dati, assicurando una visione completa della pulizia dei dati.

Collaborazione

Negli ambienti dove si opera in squadra, può essere utile consentire a più utenti di lavorare sugli stessi asset o creare copie di buona qualità da utilizzare come modelli per altri team. Dataprep consente agli utenti di collaborare agli stessi oggetti di flusso in tempo reale o di creare copie che altri possano utilizzare per lavorare in maniera indipendente.

Connettività completa

Oltre alla connettività standard di BigQuery, Cloud Storage, Microsoft Excel e Fogli Google, arricchisci le tue analisi self-service con centinaia di origini dati come Salesforce, Oracle, Microsoft SQL Server, MySQL, PostgreSQL e molte altre.

Orchestrazione delle pipeline di dati

Pianifica e automatizza i job di preparazione dei dati concatenandoli in ordine sequenziale e condizionale. Avvisa gli utenti in caso di esito positivo o negativo e attiva attività esterne (come Cloud Functions). Sfrutta API complete per integrare Dataprep come parte di una soluzione end-to-end aziendale.

Operazionalizzazione su scala aziendale

Adotta una pratica di deployment continuo con importazione/esportazione di formule tra edizioni e versioni diverse, parametri di flusso, configurazione personalizzata per Dataflow o BigQuery, ottimizzazione delle prestazioni e API avanzate per automatizzare i cicli di vita e il monitoraggio dello sviluppo software.

Tipi di dati comuni

Trasforma set di dati strutturati o non strutturati, archiviati nei formati CSV, JSON o tabelle relazionali, o dati di applicazioni SaaS di qualsiasi dimensione, dai megabyte ai petabyte, con la massima semplicità e senza alcun problema.

Corrispondenza di pattern

Utilizza la corrispondenza dei pattern a colonna per identificare i pattern di dati di tuo interesse e visualizzarli nell'interfaccia al fine di utilizzarli nella creazione delle tue formule. Inoltre, nei passaggi della tua formula, puoi applicare espressioni regolari o pattern di Dataprep per individuare pattern e trasformare i dati corrispondenti nei tuoi set di dati.

Standardizzazione

Raggruppa i valori per analogie in base all'ortografia o alla pronuncia indipendentemente dalla lingua e crea cluster standardizzati di valori coerenti.

Campionamento

Per l'ottimizzazione delle prestazioni, Dataprep genera automaticamente uno o più campioni dei dati al fine di visualizzarli e manipolarli nell'applicazione client. Tuttavia, è possibile modificare facilmente la dimensione dei campioni, l'ambito del campione e il metodo tramite cui quest'ultimo viene creato.

Sicurezza avanzata

Espandi gli attuali standard di sicurezza fornendo il controllo individuale dell'accesso ai dati utilizzando una combinazione di ruoli IAM di Google e diritti di accesso BigQuery, Cloud Storage e Fogli Google per determinare l'accesso.

Architettura della pipeline ELT di Dataprep

A sinistra, la colonna Importazione contiene dati non elaborati in BigQuery, Cloud Storage, Fogli Google, Microsoft Excel, Database, Applicazioni e Caricamento di file. Il flusso si sposta verso destra attraversando la colonna Preparazione e archiviazione in Dataprep e Dataflow; i dati vengono perfezionati in BigQuery e Cloud Storage. Sotto questa colonna appare Governance e automazione con Data Catalog, Cloud Functions e Cloud Composer. Il flusso continua nella colonna di destra Analisi e machine learning con BigQuery/BigQueryML, Looker, Google Data Studio, servizi di BI dei partner (logo Qlik) e Cloud AI Platform.

Dataprep ci consente di esplorare rapidamente nuovi set di dati e la sua flessibilità supporta tutte le nostre esigenze di trasformazione dei dati. Il lavoro di preparazione dei dati in Merkle adesso si completa in pochi minuti, anziché in ore o giorni, accelerando il tempo di preparazione dei dati del 90%.

Henry Culver, IT Architect, Merkle

I nostri clienti

Risorse

Prezzi

Dataprep è un'applicazione web interattiva in cui gli utenti possono definire regole di preparazione dei dati mediante l'interazione con un campione degli stessi. Il flusso può essere eseguito come job Dataprep (utilizzando Dataflow).per l'esecuzione sul set di dati completo.  Il prezzo è suddiviso in due variabili: progettazione ed esecuzione. Il prezzo della progettazione è calcolato a progetto per un numero illimitato di utenti. Il prezzo di esecuzione è calcolato in base all'utilizzo di Dataflow per l'esecuzione di job in Dataprep. Scopri di più e visualizza i dettagli completi nella nostra pagina dei prezzi in Google Cloud Marketplace. 

Fai un passo avanti

Inizia a creare su Google Cloud con 300 $ di crediti gratuiti e oltre 20 prodotti Always Free.

Hai bisogno di aiuto per iniziare?
Collabora con un partner di fiducia
Continua la navigazione