Dataprep van Trifacta

Een intelligente cloud-dataservice voor het visueel verkennen, opschonen en voorbereiden van gegevens voor analyse en machine learning.

Bekijk de documentatie voor dit product.

Intelligente gegevensvoorbereiding

Intelligente gegevensvoorbereiding

Cloud Dataprep van Trifacta is een intelligente dataservice waarmee u gestructureerde en ongestructureerde gegevens visueel kunt verkennen, opschonen en voorbereiden voor analyse en machine learning. Omdat Cloud Dataprep serverloos is en op elke schaal werkt, is er geen infrastructuur die moet worden geïmplementeerd of beheerd. Bij elke UI-invoer suggereert en voorspelt Dataprep de volgende ideale gegevenstransformatie, dus u hoeft geen code te schrijven.

Wat is er nieuw

Serverloze eenvoud

Cloud Dataprep is een geïntegreerde partnerservice beheerd door Trifacta en is gebaseerd op hun toonaangevende oplossing voor gegevensvoorbereiding. Google werkt nauw samen met Trifacta voor een naadloze gebruikerservaring, zonder dat u vooraf software moet installeren, afzonderlijke licentiekosten moet betalen of te maken krijgt met doorlopende operationele overhead. Cloud Dataprep is volledig beheerd en schaalt naadloos wanneer de hoeveelheid gegevens die u wilt voorbereiden daarom vraagt, zodat u zich op het analyseren kunt blijven richten.

Snelle verkenning en detectie van afwijkingen

Krijg meteen inzicht in gegevens en verken ze dankzij visuele gegevensdistributies. Cloud Dataprep detecteert automatisch schema's, gegevenstypen, mogelijke samenvoegingen en afwijkingen zoals ontbrekende waarden, uitschieters en duplicaten. Hierdoor kunt u tijdrovende kwaliteitsbeoordeling van uw gegevens overslaan en meteen beginnen met het verkennen en analyseren van de gegevens.

Eenvoudige en krachtige gegevensvoorbereiding

Bij elke actie in de UI suggereert en voorspelt Cloud Dataprep automatisch de volgende ideale gegevenstransformatie. Nadat u uw reeks transformaties heeft gedefinieerd, maakt Cloud Dataprep gebruik van Cloud Dataflow, zodat u gestructureerde of ongestructureerde datasets van elke grootte kunt verwerken. U hoeft alleen maar te klikken. Code schrijven is niet nodig.

Kenmerken

Voorspellende transformatie

Cloud Dataprep gebruikt een eigen inferentie-algoritme om te detecteren op welke manier een gebruiker de geselecteerde gegevens mogelijk wil transformeren. Er wordt automatisch een passende, gerangschikte reeks suggesties en patronen voor de selecties gegenereerd.

Uitgebreide transformaties

Transformeer uw gegevens in de gewenste vorm met behulp van honderden functies. Tal van functies past u toe met een simpele muisklik, zoals aggregatie, pivot, unpivot, samenvoegen via joins, unions en merges, extraheren, berekeningen uitvoeren, vergelijken, voorwaarden toepassen en reguliere expressies.

Parametrisering

Voer een stappenplan uit voor meerdere instanties van identieke datasets door een variabele te parametriseren om de delen van het bestandspad te vervangen die bij elke vernieuwing veranderen. Deze variabele kan naar behoefte worden veranderd tijdens de runtime van een taak.

Samenwerking

In teamomgevingen kan het nuttig zijn om meerdere gebruikers aan dezelfde items te laten werken of om bijvoorbeeld kopieën te maken van werk van goede kwaliteit die als templates voor anderen kunnen fungeren. Met Cloud Dataprep kunnen gebruikers in realtime samenwerken aan dezelfde stroomobjecten of kopieën maken die anderen kunnen gebruiken voor onafhankelijk werk.

Patroonovereenkomsten

Gebruik patroonovereenkomsten in kolommen om gegevenspatronen te identificeren die belangrijk voor u zijn en deze in de interface te gebruiken om uw eigen stappenplannen te ontwerpen. Bovendien kunt u in uw stappenplannen reguliere expressies of Cloud Dataprep-patronen toepassen om patronen te vinden en de overeenkomende gegevens in uw datasets te transformeren.

Standaardisatie

Groepeer waarden op overeenkomsten op basis van de spelling of (taalonafhankelijke) uitspraak en maak gestandaardiseerde clusters van consistente waarden.

Actieve profilering

Bekijk en verken uw gegevens met interactieve visuele distributies van uw gegevens om u te helpen bij het ontdekken, opschonen en transformeren ervan. Visuele weergaven helpen u om grote hoeveelheden gegevens te interpreteren. De innovatieve profileringsmethoden van Cloud Dataprep brengen ook belangrijke statistische informatie in beeld in een dynamische en gebruiksvriendelijke indeling.

Sampling

Cloud Dataprep genereert automatisch een of meer steekproeven van de gegevens, zodat deze in de client-app kunnen worden weergegeven en gebruikt. Zo optimaliseert u direct de efficiëntie. U kunt de grootte van de steekproeven, het bereik ervan en de methode waarmee ze worden genomen, eenvoudig wijzigen.

Planning

Plan de uitvoering van stappenplannen in uw workflows op een terugkerende basis of alleen wanneer dat nodig is. Als de geplande taak wordt uitgevoerd, kunt u de getransformeerde uitvoer op de opgegeven uitvoerlocatie ophalen. Deze is beschikbaar in de indeling die u heeft opgegeven.

Snelle targeting

Definieer doelschema's via geïmporteerde of gemaakte datasets en wijs een bestaand stappenplan toe om uw transformaties te systematiseren en versnellen. Doelen verschijnen op de transformatiepagina en kunnen worden toegepast op de gehele dataset of op geselecteerde kolommen van de dataset die u wilt transformeren.

Veelgebruikte gegevenstypen

U kunt gestructureerde en ongestructureerde datasets transformeren. Hierbij maakt het niet uit in welke indeling ze zijn opgeslagen (csv, json of relationele tabelindeling) en hoe groot de datasets zijn (megabytes of petabytes). De verwerking blijft altijd even eenvoudig.

Geïntegreerd met Google Cloud Platform

Verwerk gegevens die zijn opgeslagen in Cloud Storage, BigQuery of op uw desktop en exporteer de bewerkte gegevens vervolgens naar BigQuery of Cloud Storage voor opslag, analyse, visualisatie of machine learning. Met Cloud Identity and Access Management beheert u naadloos de gebruikerstoegang en de gegevensbeveiliging.

De architectuur van Cloud Dataprep

De architectuur van Cloud Dataprep

Met Cloud Dataprep kunnen we snel nieuwe datasets verkennen en door de flexibiliteit van de tool wordt voldaan aan al onze behoeften op het gebied van gegevenstransformatie. Gegevensvoorbereiding wordt bij Merkle nu binnen een paar minuten voltooid in plaats van in uren of dagen. We hebben onze gegevens daarom nu 90% sneller klaar.

Henry Culver, IT Architect, Merkle

Onze klanten

Hulpbronnen

Prijzen

Cloud Dataprep is een interactieve web-app waarin gebruikers regels voor gegevensvoorbereiding definiëren aan de hand van een steekproef uit hun data. Als u de workflow voor de volledige dataset wilt uitvoeren, kunt u deze uitvoeren als een Cloud Dataprep-taak (met Google Cloud Dataflow). Volledige prijsinformatie vindt u in ons prijsoverzicht.

De volgende stap

Ga aan de slag in Google Cloud met $ 300 aan gratis tegoed en meer dan 20 Always Free-producten.

Heeft u hulp nodig om aan de slag te gaan?
Werk samen met een betrouwbare partner