Cloud Dataprep van Trifacta

Een intelligente cloud-dataservice om gegevens visueel te verkennen, op te schonen en gereed te maken voor analyse en machine learning.
Intelligente gegevensvoorbereiding

Intelligente gegevensvoorbereiding

Cloud Dataprep van Trifacta is een intelligente dataservice waarmee u gestructureerde en ongestructureerde gegevens visueel kunt verkennen en opschonen, en gereed kunt maken voor analyse en machine learning. Omdat Cloud Dataprep serverloos is en op elke schaal werkt, is er geen infrastructuur die moet worden geïmplementeerd of beheerd. Bij elke UI-invoer suggereert en voorspelt Dataprep de volgende ideale gegevenstransformatie, dus u hoeft geen code te schrijven. En dankzij de automatische detectie van het schema, het gegevenstype en de mogelijke samenvoegingen en afwijkingen kunt u tijdrovende gegevensprofilering overslaan en meteen overgaan tot gegevensanalyse.

Serverloze eenvoud

Cloud Dataprep is een geïntegreerde partnerservice beheerd door Trifacta en is gebaseerd op hun toonaangevende oplossing voor gegevensvoorbereiding, Trifacta Wrangler. Google werkt nauw samen met Trifacta voor een naadloze gebruikerservaring, zonder dat u vooraf software moet installeren, afzonderlijke licentiekosten moet betalen of last heeft van doorlopende operationele overhead. Cloud Dataprep is volledig beheerd en schaalt naadloos wanneer de hoeveelheid gegevens die u wilt voorbereiden daarom vraagt, zodat u zich op het analyseren kunt blijven richten.

Snelle opsporing en detectie van afwijkingen

Krijg meteen inzicht in gegevens en verken ze dankzij visuele gegevensdistributies. Cloud Dataprep detecteert automatisch schema's, gegevenstypen, mogelijke samenvoegingen en afwijkingen zoals ontbrekende waarden, uitschieters en duplicaten. Hierdoor kunt u de tijdrovende profilering van uw gegevens overslaan en meteen beginnen met het verkennen en analyseren van de gegevens.

Eenvoudige en krachtige gegevensvoorbereiding

Bij elk gebaar in de UI suggereert en voorspelt Cloud Dataprep automatisch de volgende ideale gegevenstransformatie. Nadat u uw reeks transformaties heeft gedefinieerd, maakt Cloud Dataprep gebruik van Cloud Dataflow onder de motorkap, zodat u gestructureerde of ongestructureerde datasets van elke grootte kunt verwerken. U hoeft alleen maar te klikken, code schrijven is niet nodig.

Functies

Voorspellende transformatie

Cloud Dataprep gebruikt een eigen inferentie-algoritme om te herleiden op welke manier een gebruiker de geselecteerde gegevens mogelijk wil transformeren. Er wordt automatisch een gerangschikte reeks suggesties en patronen gegenereerd voor de te matchen selecties.

Parametrisering

Voer een stappenplan uit voor meerdere instanties van identieke datasets door een variabele te parametriseren om de delen van het bestandspad te vervangen die bij elke vernieuwing veranderen. Deze variabele kan naar behoefte tijdens de runtime van een taak worden gewijzigd.

Samenwerking

In teamomgevingen kan het nuttig zijn om meerdere gebruikers aan dezelfde items te laten werken of om kopieën te maken van werk van goede kwaliteit. Deze kopieën kunnen als sjabloon voor anderen fungeren. Met Cloud Dataprep kunnen gebruikers in realtime samenwerken aan dezelfde stroomobjecten of kopieën maken die anderen kunnen gebruiken voor onafhankelijk werk.

Patroonovereenkomsten

Gebruik patroonovereenkomsten in kolommen om voor u interessante gegevenspatronen te identificeren en deze in de interface te gebruiken om uw eigen stappenplannen te ontwerpen. Bovendien kunt u in uw stappenplannen reguliere expressies of Cloud Dataprep-patronen toepassen om patronen te vinden en de overeenkomende gegevens in uw datasets te transformeren.

Visuele profilering

Bekijk en verken uw gegevens door middel van interactieve visuele distributies van uw gegevens om u te helpen bij het ontdekken, opschonen en transformeren ervan. Visuele weergaven helpen u om grote hoeveelheden gegevens te interpreteren. Daarnaast visualiseren de innovatieve profileringsmethoden van Cloud Dataprep belangrijke statistische informatie in een dynamische en gebruiksvriendelijke indeling.

Sampling

Cloud Dataprep genereert automatisch een of meer voorbeelden van de gegevens, zodat deze in de client-app kunnen worden weergegeven en gebruikt. Zo optimaliseert u direct de efficiëntie. U kunt de grootte van de voorbeelden, het bereik ervan en de methode waarmee het voorbeeld wordt gemaakt, eenvoudig wijzigen.

Planning

Plan de uitvoering van stappenplannen in uw workflows op een terugkerende basis of alleen wanneer dat nodig is. Wanneer de geplande taak wordt uitgevoerd, kunt u de getransformeerde uitvoer op de opgegeven uitvoerlocatie ophalen. Deze is beschikbaar in de indeling die u heeft opgegeven.

Doelovereenkomsten

Definieer doelschema's via geïmporteerde of gemaakte datasets, en wijs een bestaand stappenplan toe om uw transformaties te systematiseren en te versnellen. Doelen verschijnen op de transformatiepagina en kunnen worden toegepast op de gehele dataset of op geselecteerde kolommen van de dataset die u wilt transformeren.

Veelgebruikte gegevenstypen

U kunt verschillende gestructureerde en ongestructureerde datasets transformeren. Hierbij maakt het niet uit in welke indeling ze zijn opgeslagen, csv, json of relationele tabelindeling, en hoe groot de datasets zijn, megabytes of terabytes – de verwerking blijft altijd even eenvoudig.

Geïntegreerd met Google Cloud Platform

Verwerk gegevens die zijn opgeslagen in Cloud Storage, BigQuery of op uw desktop en exporteer de verfijnde gegevens vervolgens naar BigQuery of Cloud Storage voor opslag, analyse, visualisatie of machine learning. Met Cloud Identity and Access Management beheert u naadloos de gebruikerstoegang en de gegevensbeveiliging.

De architectuur van Cloud Dataprep

De architectuur van Cloud Dataprep

Met Cloud Dataprep kunnen we snel nieuwe datasets verkennen en door de flexibiliteit van de tool wordt voldaan aan al onze behoeften op het gebied van gegevenstransformatie. De gegevensvoorbereiding wordt bij Merkle nu voltooid binnen een paar minuten in plaats van uren of dagen, waardoor we onze gegevens nu 90% sneller kunnen voorbereiden.

Henry Culver, IT Architect, Merkle

Onze klanten

Hulpmiddelen

Prijzen

Cloud Dataprep is een interactieve web-app waarin gebruikers regels voor gegevensvoorbereiding definiëren aan de hand van een gegevensvoorbeeld. Het gebruik van de app om voorbeeldgegevens te verkennen, transformatiestappen te definiëren en het getransformeerde voorbeeld te exporteren, is geheel kosteloos. Als u de workflow voor de volledige dataset wilt uitvoeren, kunt u deze uitvoeren als een Cloud Dataprep-taak (met Google Cloud Dataflow). Ga voor alle informatie naar ons prijsoverzicht.

Google Cloud

Aan de slag

Leren en ontwerpen

Nieuw bij GCP? Ga kosteloos aan de slag met een GCP-product en een tegoed van $ 300.

Heeft u meer hulp nodig?

Onze experts helpen u de juiste oplossing te ontwerpen of de juiste partner te vinden.

Feedback verzenden over...