Cloud Dataprep von Trifacta

Intelligenter Clouddatendienst für die visuelle Erkundung, Bereinigung und Vorbereitung von Daten für Analysen und maschinelles Lernen

Intelligente Vorbereitung von Daten

Intelligente Vorbereitung von Daten

Cloud Dataprep by Trifacta ist ein intelligenter Dienst für die visuelle Erkundung, Bereinigung und Vorbereitung von strukturierten und unstrukturierten Daten für Analysen, Berichte und maschinelles Lernen. Cloud Dataprep ist serverlos und eignet sich für Daten jeder Größenordnung – es muss keine Infrastruktur bereitgestellt oder verwaltet werden. Bei jeder Eingabe auf der Benutzeroberfläche wird die nächstbeste Datentransformation vorgeschlagen und vorausberechnet. Dadurch wird das Schreiben von Code überflüssig. Cloud Dataprep erkennt automatisch Schemas, Datentypen, Möglichkeiten zur Zusammenführung und Anomalien. Das zeitaufwendige Erstellen von Datenprofilen gehört somit der Vergangenheit an und Sie können direkt zur Datenanalyse übergehen.

Serverlose Einfachheit

Serverlose Einfachheit

Cloud Dataprep ist ein integrierter Partnerdienst, der von Trifacta verwaltet wird und auf der branchenführenden Datenvorbereitungslösung Trifacta Wrangler basiert. Google arbeitet eng mit Trifacta zusammen, um einen reibungslosen Ablauf zu gewährleisten, durch den die Vorabinstallation von Software, separate Lizenzgebühren und operativer Aufwand vermieden werden. Cloud Dataprep ist vollständig verwaltet und kann bei Bedarf nahtlos skaliert werden, um den wachsenden Anforderungen an die Vorbereitung von Daten nachzukommen. Sie können sich also ganz auf die Analyse konzentrieren.

Schnelle Erkundung und Anomalieerkennung

Schnelle Erkundung und Anomalieerkennung

Dank visueller Datenverteilung lassen sich Daten im Handumdrehen untersuchen und verstehen. Cloud Dataprep erkennt automatisch Schemas, Datentypen, Möglichkeiten zur Zusammenführung und Anomalien wie fehlende Werte, Ausreißer und Duplikate. Somit können Sie die zeitaufwendige Aufgabe der Datenprofilerstellung überspringen und direkt zur Datenanalyse übergehen.

Einfache und effektive Datenvorbereitung

Einfache und effektive Datenvorbereitung

Bei jeder Bewegung auf der Benutzeroberfläche wird durch Cloud Dataprep Ihre nächstbeste Datentransformation vorgeschlagen und vorhergesagt. Nachdem Sie eine Sequenz von Transformationen definiert haben, verwendet Cloud Dataprep im Hintergrund Cloud Dataflow. Somit können Sie strukturierte und unstrukturierte Datasets jeder Größe bequem mit Klicks statt mit Code verarbeiten.

Kunden von Cloud Dataprep

Mit Cloud Dataprep können wir neue Datasets schnell untersuchen. Aufgrund der Flexibilität dieser Lösung können wir allen unseren Anforderungen zur Datentransformation nachkommen. Da wir nur noch Minuten statt Stunden für die Datenvorbereitung benötigen, konnten wir unsere Datenvorbereitungszeit um 90 % beschleunigen.

Henry Culver, IT Architect, Merkle

Architektur von Cloud Dataprep

Architektur von Cloud Dataprep

Funktionen von Cloud Dataprep

Predictive Transformation

Cloud Dataprep nutzt einen proprietären Ableitungsalgorithmus, um die Absicht der Datentransformation basierend auf der Datenauswahl eines Nutzers zu interpretieren. Es wird automatisch eine Reihe von Vorschlägen und Mustern für die entsprechende Auswahl generiert.

Parametrisierung

Zum Ausführen eines Schemas auf mehreren Instanzen identischer Datasets können Sie eine Variable parametrisieren, um diejenigen Teile des Dateipfades zu ersetzen, die sich bei jeder Aktualisierung ändern. Diese Variable kann bei Bedarf zur Joblaufzeit geändert werden.

Zusammenarbeit

In Teamumgebungen kann es hilfreich sein, wenn mehrere Nutzer mit denselben Ressourcen arbeiten oder Kopien von qualitativ guter Arbeit erstellen können, damit diese anderen als Vorlagen dienen. Mit Cloud Dataprep haben Nutzer die Möglichkeit, gemeinsam mit denselben Ablaufobjekten zu arbeiten oder Kopien für andere Mitarbeiter zu erstellen, die diese für unabhängige Arbeiten verwenden können.

Musterabgleich

Nutzen Sie den Spaltenmusterabgleich, um relevante Datenmuster zu identifizieren und diese auf der Benutzeroberfläche zum Erstellen von Schemas bereitzustellen. Außerdem können Sie in Ihren Schemaschritten reguläre Ausdrücke oder Cloud Dataprep-Muster anwenden, um Muster zu ermitteln und die übereinstimmenden Daten in den Datasets zu transformieren.

Visuelle Profile

Mit der interaktiven visuellen Datenverteilung können Sie Daten sehen und untersuchen. Die Erkennung, Bereinigung und Transformation von Daten wird somit vereinfacht. Visuelle Darstellungen ermöglichen die Auswertung großer Datenmengen. Mit den innovativen Profilerstellungstechniken von Cloud Dataprep können Sie wichtige statistische Informationen in einem dynamischen und einfach anwendbaren Format visualisieren.

Probenahme

Zur Leistungsverbesserung generiert Cloud Dataprep automatisch eine oder mehrere Stichproben der Daten, um diese in der Client-Anwendung anzuzeigen und zu bearbeiten. Sie können die Größe und den Umfang der Stichprobe sowie deren Erfassungsmethode jedoch mühelos ändern.

Planung

Sie können eine regelmäßige oder bedarfsbasierte Ausführung von Schemas in Ihren Abläufen planen. Nach erfolgreicher Ausführung des geplanten Jobs können Sie die Wrangle-codierte Ausgabe aus dem angegebenen Ausgabespeicherort im von Ihnen festgelegten Veröffentlichungsformat abrufen.

Zielabgleich

Definieren Sie Zielschemas über importierte oder erstellte Datasets und weisen Sie diese einem vorhandenen Schema zu, um die Wrangling-Codierung zu systematisieren und zu beschleunigen. Die Ziele werden auf der Seite "Transformer" angezeigt und können auf das gesamte Dataset oder ausgewählte Spalten des Datasets angewendet werden, für das Sie die Wrangle-Codierung durchführen müssen.

Gängige Datentypen

Strukturierte und unstrukturierte Datasets, die in CSV-, JSON- oder relationalen Tabellenformaten gespeichert sind, lassen sich unabhängig von ihrer Größe – Megabyte oder Terabyte – einfach und intuitiv transformieren.

In die Google Cloud Platform integriert

Verarbeiten Sie Daten, die in Cloud Storage, BigQuery oder auf Ihrem Desktop gespeichert sind. Die bereinigten Daten können dann zur Speicherung, Analyse oder maschinellen Verarbeitung nach BigQuery oder Cloud Storage exportiert werden. Der Nutzerzugriff und die Datensicherheit werden mit Cloud Identity and Access Management nahtlos verwaltet.

Cloud Dataprep-Preise

Cloud Dataprep ist eine interaktive Webanwendung, in der Nutzer die Datenvorbereitungsregeln anhand einer Stichprobe ihrer Daten definieren. Für die Nutzung dieser Anwendung zum Untersuchen von Daten anhand der Stichprobe, Definieren von Transformationsschritten und Exportieren der transformierten Stichprobe fallen keine Gebühren an. Der Ablauf für das vollständige Dataset kann (unter Verwendung von Google Cloud Dataflow) als Cloud Dataprep-Job ausgeführt werden. Weitere Informationen und alle Einzelheiten hierzu finden Sie in der Preisübersicht.

Ressourcen

Blogsymbol

Mühelos Einblicke gewinnen: Data Studio und Cloud Dataprep sind jetzt allgemein verfügbar

Videosymbol

Google Cloud OnAir: Daten-Wrangling mit Cloud Dataprep

Schnellstart-Symbol

Erste Schritte mit dem Cloud Dataprep-Schnellstart

Quicklab-Symbol

Mit Cloud Dataprep arbeiten

Quicklab-Symbol

IoT Core-Daten in Cloud Dataprep streamen

Notizensymbol

Ankündigungen und Updates zu Cloud Dataprep

Nutzersymbol

Mit anderen Cloud Dataprep-Nutzern Kontakt aufnehmen

Seitensymbol

Data Warehouse für das Marketing erstellen

Google Cloud

Erste Schritte

Lernen und entwickeln

Sie verwenden die GCP zum ersten Mal? Sichern Sie sich zum Einstieg in ein beliebiges GCP-Produkt ein Startguthaben von 300 $.

Benötigen Sie weitere Hilfe?

Unsere Experten unterstützen Sie gern dabei, die passende Lösung oder den richtigen Partner für Ihre Anforderungen zu finden.

Feedback geben zu...

Cloud Dataprep by Trifacta