Cloud Dataprep van Trifacta

Een intelligente cloud-dataservice om gegevens visueel te verkennen, op te schonen en gereed te maken voor analyse en machine learning.

Bekijk de documentatie voor dit product.

Intelligente gegevensvoorbereiding

Intelligente gegevensvoorbereiding

Cloud Dataprep van Trifacta is een intelligente dataservice waarmee u gestructureerde en ongestructureerde gegevens visueel kunt verkennen, opschonen en voorbereiden voor analyse en machine learning. Omdat Cloud Dataprep serverloos is en op elke schaal werkt, is er geen infrastructuur die moet worden geïmplementeerd of beheerd. Bij elke UI-invoer suggereert en voorspelt Dataprep de volgende ideale gegevenstransformatie, dus u hoeft geen code te schrijven. En dankzij de automatische detectie van het schema, het gegevenstype en de mogelijke samenvoegingen en afwijkingen, kunt u tijdrovende gegevensprofilering overslaan en meteen overgaan tot gegevensanalyse.

Serverloze eenvoud

Cloud Dataprep is een geïntegreerde partnerservice beheerd door Trifacta en is gebaseerd op hun toonaangevende oplossing voor gegevensvoorbereiding, Trifacta Wrangler. Google werkt nauw samen met Trifacta voor een naadloze gebruikerservaring, zonder dat u vooraf software moet installeren, afzonderlijke licentiekosten moet betalen of te maken krijgt met doorlopende operationele overhead. Cloud Dataprep is volledig beheerd en schaalt naadloos als de hoeveelheid gegevens die u wilt voorbereiden daarom vraagt, zodat u zich op de analyses kunt blijven richten.

Snelle verkenning en detectie van afwijkingen

Krijg meteen inzicht in gegevens en verken ze dankzij visuele gegevensdistributies. Cloud Dataprep detecteert automatisch schema's, gegevenstypen, mogelijke samenvoegingen en afwijkingen zoals ontbrekende waarden, uitschieters en duplicaten. Hierdoor kunt u de tijdrovende profilering van uw gegevens overslaan en meteen beginnen met het verkennen en analyseren van de gegevens.

Eenvoudige en krachtige gegevensvoorbereiding

Bij elke actie in de UI suggereert en voorspelt Cloud Dataprep automatisch de volgende ideale gegevenstransformatie. Nadat u uw reeks transformaties heeft gedefinieerd, maakt Cloud Dataprep gebruik van Cloud Dataflow, zodat u gestructureerde of ongestructureerde datasets van elke grootte kunt verwerken. U hoeft alleen maar te klikken, code schrijven is niet nodig.

Functies

Voorspellende transformatie

Cloud Dataprep gebruikt een uniek inferentie-algoritme om te detecteren op welke manier een gebruiker de geselecteerde gegevens mogelijk wil transformeren. Er wordt automatisch een passende, gerangschikte reeks suggesties en patronen voor de selecties gegenereerd.

Parametrisering

Voer een stappenplan uit voor meerdere instanties van identieke datasets door een variabele te parametriseren om de delen van het bestandspad te vervangen die bij elke vernieuwing veranderen. Deze variabele kan naar behoefte tijdens de runtime van een taak worden gewijzigd.

Samenwerking

In teamomgevingen kan het nuttig zijn om meerdere gebruikers aan dezelfde items te laten werken of om bijvoorbeeld kopieën te maken van werk van goede kwaliteit die als templates voor anderen kunnen fungeren. Met Cloud Dataprep kunnen gebruikers in realtime samenwerken aan dezelfde stroomobjecten of kopieën maken die anderen kunnen gebruiken voor onafhankelijk werk.

Patroonovereenkomsten

Gebruik patroonovereenkomsten in kolommen om voor u interessante gegevenspatronen te identificeren en deze in de interface te gebruiken om uw eigen stappenplannen te ontwerpen. Bovendien kunt u in uw stappenplannen reguliere expressies of Cloud Dataprep-patronen toepassen om patronen te vinden en de overeenkomende gegevens in uw datasets te transformeren.

Visuele profilering

Bekijk en verken uw gegevens met interactieve visuele distributies van uw gegevens om u te helpen bij het ontdekken, opschonen en transformeren ervan. Visuele weergaven helpen u om grote hoeveelheden gegevens te interpreteren. De innovatieve profileringsmethoden van Cloud Dataprep brengen ook belangrijke statistische informatie in beeld in een dynamische en gebruiksvriendelijke indeling.

Steekproeven

Cloud Dataprep genereert automatisch een of meer steekproeven van de gegevens, zodat deze in de client-app kunnen worden weergegeven en gebruikt. Zo optimaliseert u direct de efficiëntie. U kunt de grootte van de steekproeven, het bereik ervan en de methode waarmee ze worden genomen, eenvoudig wijzigen.

Planning

Plan de uitvoering van stappenplannen in uw workflows op een terugkerende basis of alleen wanneer dat nodig is. Als de geplande taak wordt uitgevoerd, kunt u de getransformeerde uitvoer op de opgegeven uitvoerlocatie ophalen. Deze is beschikbaar in de indeling die u heeft opgegeven.

Doelovereenkomsten

Definieer doelschema's via geïmporteerde of gemaakte datasets en wijs een bestaand stappenplan toe om uw transformaties te systematiseren en versnellen. Doelen verschijnen op de transformatiepagina en kunnen worden toegepast op de gehele dataset of op geselecteerde kolommen van de dataset die u wilt transformeren.

Veelgebruikte gegevenstypen

U kunt gestructureerde en ongestructureerde datasets transformeren. Hierbij maakt het niet uit in welke indeling ze zijn opgeslagen – csv, json of relationele tabelindeling – en hoe groot de datasets zijn, megabytes of petabytes – de verwerking blijft altijd even eenvoudig.

Geïntegreerd met Google Cloud Platform

Verwerk gegevens die zijn opgeslagen in Cloud Storage, BigQuery of op uw desktop en exporteer de bewerkte gegevens vervolgens naar BigQuery of Cloud Storage voor opslag, analyse, visualisatie of machine learning. Met Cloud Identity and Access Management beheert u naadloos de gebruikerstoegang en de gegevensbeveiliging.

De architectuur van Cloud Dataprep

De architectuur van Cloud Dataprep

Met Cloud Dataprep kunnen we snel nieuwe datasets verkennen en door de flexibiliteit van de tool wordt voldaan aan al onze behoeften op het gebied van gegevenstransformatie. Gegevensvoorbereiding wordt bij Merkle nu binnen een paar minuten voltooid in plaats van in uren of dagen. We hebben onze gegevens daarom nu 90% sneller klaar.

Henry Culver, IT Architect, Merkle

Onze klanten

Hulpbronnen

Prijzen

Cloud Dataprep is een interactieve web-app waarin gebruikers regels voor gegevensvoorbereiding definiëren aan de hand van een steekproef uit hun data. Het gebruik van de app om steekproeven te verkennen, transformatiestappen te definiëren en de getransformeerde steekproef te exporteren, is geheel kosteloos. Als u de workflow voor de volledige dataset wilt uitvoeren, kunt u deze uitvoeren als een Cloud Dataprep-taak (met Google Cloud Dataflow). Volledige prijsinformatie vindt u in ons prijsoverzicht.

Google Cloud

Aan de slag

Leren en ontwerpen

Nieuw bij GCP? Ga kosteloos aan de slag met een GCP-product en een tegoed van $ 300.

Meer hulp nodig?

Onze experts helpen u de juiste oplossing te ontwerpen of de juiste partner te vinden.