Dataprep von Trifacta
Intelligenter Cloud-Datendienst für die visuelle Erkundung, Bereinigung und Vorbereitung von Daten für Analysen und maschinelles Lernen
Intelligente Vorbereitung von Daten
Das ist neu


Serverlose Einfachheit
Dataprep ist ein integrierter Partnerdienst, der von Trifacta verwaltet wird und auf der branchenführenden Datenvorbereitungslösung des Unternehmens basiert. Google arbeitet eng mit Trifacta zusammen, um einen reibungslosen Ablauf zu ermöglichen, durch den die vorbereitende Installation von Software, separate Lizenzgebühren und operativer Aufwand vermieden werden. Dataprep ist vollständig verwaltet und kann bei Bedarf nahtlos skaliert werden, um den wachsenden Anforderungen an die Vorbereitung von Daten nachzukommen. Sie können sich also ganz auf die Analyse konzentrieren.
Schnelle Erkundung und Anomalieerkennung
Dank visueller Datenverteilung lassen sich Daten im Handumdrehen untersuchen und verstehen. Dataprep erkennt automatisch Schemas, Datentypen, Möglichkeiten zur Zusammenführung und Anomalien wie fehlende Werte, Ausreißer und Duplikate. Somit können Sie die zeitaufwendige Bewertung der Datenqualität überspringen und direkt zur Datenanalyse übergehen.
Einfache und effektive Datenvorbereitung
Bei jeder Bewegung auf der Benutzeroberfläche wird durch Dataprep automatisch die nächstbeste Datentransformation vorgeschlagen und vorhergesagt. Sobald Sie Ihre Transformationssequenz definiert haben, verwendet Dataprep Dataflow oder BigQuery im Hintergrund, damit Sie strukturierte oder unstrukturierte Datasets jeder Größe mit wenigen Klicks und ohne Code verarbeiten können.
Dataprep-Features
Starter-, Professional- und Enterprise-Versionen.
Vorausschauende Transformation
Dataprep nutzt einen eigenen Ableitungsalgorithmus, um die Absicht der Datentransformation basierend auf der Datenauswahl eines Nutzers zu interpretieren. Es wird automatisch eine Rangfolge von Vorschlägen und Mustern erstellt, die auf diese Datenauswahl abgestimmt sind.
Vielfältige Transformationen
Nutzen Sie Hunderte von Transformationsfunktionen, um aus den Daten das gewünschte Asset zu formen. Wenden Sie Aggregation, Pivot, Unpivot, Join, Union, Extraktion, Berechnung, Vergleich, Bedingung, Zusammenführung, reguläre Ausdrücke und anderes mehr mit einem Mausklick an.
Optimierter Verarbeitungsdurchsatz
Dataprep wählt automatisch die beste zugrunde liegende Google Cloud-Verarbeitungs-Engine aus, um die Daten so schnell wie möglich zu transformieren. Basierend auf der Datenlokalität und dem Volumen nutzt Dataprep zur Vorbereitung der Daten BigQuery (vorhandene ELT-Transformationen), Dataflow oder für kleine Datenmengen das In-Memory-Engine von Dataprep.
Aktive Profilerstellung
Mit der interaktiven visuellen Datenverteilung können Sie sich Daten anzeigen lassen und sie untersuchen. Die Erkennung, Bereinigung und Transformation von Daten wird somit vereinfacht. Visuelle Darstellungen ermöglichen die Auswertung großer Datenmengen. Mit den innovativen Profilerstellungsverfahren von Dataprep können Sie wichtige statistische Informationen in einem dynamischen und einfach anwendbaren Format visualisieren.
Regeln für Datenqualität
Regeln für Datenqualität schlagen Qualitätsindikatoren für die Daten vor, um die Accuracy, Vollständigkeit, Konsistenz, Gültigkeit und Eindeutigkeit der Daten zu beobachten und zu verbessern. Dabei erhalten Sie eine umfassende Übersicht über die Datenreinheit.
Zusammenarbeit
In Teamumgebungen kann es hilfreich sein, wenn mehrere Nutzer mit denselben Ressourcen arbeiten oder Kopien von qualitativ guter Arbeit erstellen, die anderen Nutzern dann als Vorlagen dienen können. Mit Dataprep haben Nutzer die Möglichkeit, gemeinsam in Echtzeit mit denselben Ablaufobjekten zu arbeiten oder Kopien für andere Mitarbeiter zu erstellen, die diese für unabhängige Arbeiten verwenden können.
Umfassende Konnektivität
Zusätzlich zur Standardkonnektivität von BigQuery, Cloud Storage, Microsoft Excel und Google Tabellen können Sie Ihre Self-Service-Analysen mit Hunderten von Datenquellen wie Salesforce, Oracle, Microsoft SQL Server, MySQL, PostgreSQL und vielen mehr erweitern.
Datenpipelineorchestrierung
Zum Planen und automatisieren Ihrer Datenaufbereitungsaufträge reihen Sie sie in sequenzieller und bedingter Reihenfolge aneinander. Benachrichtigen Sie Nutzer über Erfolg oder Misserfolg und lösen Sie externe Aufgaben wie Cloud Functions aus. Nutzen Sie umfassende APIs, um Dataprep in eine End-to-End-Lösung des Unternehmens einzubinden.
Operationalisierung für Unternehmen
Setzen Sie eine kontinuierliche Bereitstellung mit Schemaimport/-export unabhängig von Version, Ablaufparametern, benutzerdefinierter Konfiguration für die Leistungsoptimierung von Dataflow und BigQuery sowie fortgeschrittenen APIs ein. Damit automatisieren Sie Lebenszyklen von Softwareentwicklung und Monitoring.
Gängige Datentypen
Sie können strukturierte oder unstrukturierte Datasets, die in CSV-, JSON-, relationalen Tabellenformaten oder SaaS-Anwendungsdaten von beliebiger Größe (Megabyte bis Petabyte) gespeichert sind, gleichermaßen einfach transformieren.
Musterabgleich
Nutzen Sie den Spaltenmusterabgleich, um relevante Datenmuster zu identifizieren und diese auf der Benutzeroberfläche zum Erstellen von Schemas bereitzustellen. Außerdem können Sie in Ihren Schemaschritten reguläre Ausdrücke oder Dataprep-Muster anwenden, um Muster zu suchen und die übereinstimmenden Daten in Ihren Datasets zu transformieren.
Standardisierung
Gruppieren Sie Werte nach Ähnlichkeiten anhand ihrer Schreibung oder sprachunabhängigen Aussprache und bilden Sie so standardisierte Cluster konsistenter Werte.
Stichprobenerfassung
Zur Leistungsverbesserung generiert Dataprep automatisch eine oder mehrere Stichproben der Daten, die in der Clientanwendung angezeigt und bearbeitet werden können. Sie können die Größe und den Umfang der Stichprobe sowie deren Erfassungsmethode jedoch mühelos ändern.
Erweiterte Sicherheit
Erweitern Sie aktuelle Sicherheitsstandards durch individuelle Datenzugriffssteuerung. Nutzen Sie dazu eine Kombination aus Google IAM-Rollen und Zugriffsrechten für BigQuery, Cloud Storage und Google Tabellen.
ELT-Pipelinearchitektur von Dataprep
„Mit Dataprep können wir neue Datasets schnell untersuchen. Dank der Flexibilität dieser Lösung kommen wir all unseren Anforderungen zur Datentransformation nach. Da wir bei Merkle jetzt nur noch Minuten statt Stunden für die Datenvorbereitung benötigen, konnten wir diese um 90 % beschleunigen.“
Henry Culver, IT Architect, Merkle
WeiterlesenUnsere Kunden
Ressourcen
-
Erste Schritte mit der Dataprep-Kurzanleitung
-
Dataprep-Produktankündigungen und -Updates
-
Mit anderen Dataprep-Nutzern Kontakt über Stack Overflow aufnehmen
-
Dataprep von Trifacta – FAQSo sorgt Trifacta für die Einhaltung geltender Vorschriften zu Sicherheit, Privatsphäre und Datenschutz
-
So nutzen Sie Cloud Functions, um eine Dataprep-Pipeline bei Dateiankunft zu automatisieren
-
Lab zum selbstbestimmten Lernen zu Dataprep
-
ML-Automatisierung mit BigQuery ML, Dataprep und Cloud Composer
-
Data Warehouse für das Marketing erstellen
-
IoT Core-Daten in Dataprep streamen
Preise
Unsere Preisseite finden Sie im Google Cloud Marketplace.
Profitieren Sie von einem Guthaben über 300 $, um Google Cloud und mehr als 20 „Immer kostenlos“-Produkte kennenzulernen.
Starten Sie Ihr nächstes Projekt, nutzen Sie interaktive Anleitungen und verwalten Sie Ihr Konto.