On demand ansehen: Google Data Cloud Summit, um sich über die neuesten Innovationen in den Bereichen Analyse, KI, Business Intelligence und Datenbanken zu informieren.

Dataprep by Trifacta

Intelligenter Cloud-Datendienst für die visuelle Erkundung, Bereinigung und Vorbereitung von Daten für Analysen und maschinelles Lernen

Dataprep-Symbol befindet sich vor einem offenen Laptop, mit einem Stack von Webseiten rechts, einer Tabelle mit Trifacta-Logo links und einem Balkendiagramm in der Cloud dahinter

Intelligente Vorbereitung von Daten

Dataprep by Trifacta ist ein intelligenter Dienst für die visuelle Erkundung, Bereinigung und Vorbereitung von strukturierten und unstrukturierten Daten für Analysen, Berichte und maschinelles Lernen. Dataprep ist serverlos und eignet sich für Daten jeder Größenordnung – es muss keine Infrastruktur bereitgestellt oder verwaltet werden. Bei jeder Eingabe in der Benutzeroberfläche wird Ihnen die ideale nächste Datentransformation vorgeschlagen und vorausberechnet. Damit wird das Schreiben von Code überflüssig.

Das ist neu

Computerbildschirm mit angezeigten Daten

Serverlose Einfachheit

Dataprep ist ein integrierter Partnerdienst, der von Trifacta verwaltet wird und auf der branchenführenden Datenvorbereitungslösung von Trifacta basiert. Google arbeitet eng mit Trifacta zusammen, um einen reibungslosen Ablauf zu gewährleisten, durch den die vorbereitende Installation von Software, separate Lizenzgebühren und operativer Overhead vermieden werden. Dataprep ist vollständig verwaltet und kann bei Bedarf nahtlos skaliert werden, um den wachsenden Anforderungen an die Vorbereitung von Daten nachzukommen. Sie können sich also ganz auf die Analyse konzentrieren.

Stilisierte Grafik mit einem Stoppuhrsymbol

Schnelle Erkundung und Anomalieerkennung

Dank visueller Datenverteilung lassen sich Daten im Handumdrehen untersuchen und verstehen. Dataprep erkennt automatisch Schemas, Datentypen, Möglichkeiten zur Zusammenführung und Anomalien wie fehlende Werte, Ausreißer und Duplikate. Somit können Sie die zeitaufwändige Bewertung der Datenqualität überspringen und direkt zur Datenanalyse übergehen.

Eine Seite mit Text und blauen Check-ins am rechten Rand kommt von einem geöffneten Karton. Das Dataprep-Symbol befindet sich links.

Einfache und effektive Datenvorbereitung

Bei jeder Bewegung auf der Benutzeroberfläche wird durch Dataprep Ihre nächstbeste Datentransformation vorgeschlagen und vorhergesagt. Sobald Sie Ihre Transformationssequenz definiert haben, verwendet Dataprep Dataflow oder BigQuery im Hintergrund, sodass Sie strukturierte oder unstrukturierte Datasets jeder Größe mit wenigen Klicks, nicht durch Code, verarbeiten können.

Vorteile von Dataprep

Starter-, Professional- und Enterprise-Versionen.

Vorausschauende Transformation

Dataprep nutzt einen proprietären Ableitungsalgorithmus, um die Absicht der Datentransformation anhand der Datenauswahl eines Nutzers zu interpretieren. Es wird automatisch eine Rangfolge von Vorschlägen und Mustern erstellt, die auf diese Datenauswahl abgestimmt sind.

Vielfältige Transformationen

Nutzen Sie Hunderte von Transformationsfunktionen, um aus den Daten das gewünschte Asset zu formen. Wenden Sie Aggregation, Pivot, Unpivot, Join, Union, Extraktion, Berechnung, Vergleich, Bedingung, Zusammenführung, reguläre Ausdrücke und anderes mehr mit einem Mausklick an.

Optimierter Verarbeitungsdurchsatz

Dataprep wählt automatisch die beste zugrunde liegende Google Cloud-Verarbeitungs-Engine aus, um die Daten so schnell wie möglich zu transformieren. Basierend auf dem Ort der Datenlokalität und dem Volumen nutzt Dataprep (ELT-Transformationen) BigQuery, um die Daten, Dataflow oder das kleine In-Memory-Engine von Dataprep in kleinen Datasets vorzubereiten.

Aktive Profilerstellung

Mit der interaktiven visuellen Datenverteilung können Sie Daten sehen und untersuchen. Die Erkennung, Bereinigung und Transformation von Daten wird somit vereinfacht. Visuelle Darstellungen ermöglichen die Auswertung großer Datenmengen. Mit den innovativen Profilerstellungstechniken von Dataprep können Sie wichtige statistische Informationen in einem dynamischen und einfach anwendbaren Format visualisieren.

Regeln für Datenqualität

Regeln für Datenqualität schlagen Qualitätsindikatoren für die Daten vor, um die Genauigkeit, Vollständigkeit, Konsistenz, Gültigkeit und Eindeutigkeit der Daten zu beobachten und zu beheben. Dabei erhalten Sie eine umfassende Übersicht über die Datenreinheit.

Zusammenarbeit

In Teamumgebungen kann es hilfreich sein, wenn mehrere Nutzer mit denselben Ressourcen arbeiten oder Kopien von qualitativ guter Arbeit erstellen, die anderen Nutzern dann als Vorlagen dienen können. Mit Dataprep haben Nutzer die Möglichkeit, gemeinsam mit denselben Ablaufobjekten zu arbeiten oder Kopien für andere Mitarbeiter zu erstellen, die diese für unabhängige Arbeiten verwenden können.

Umfassende Konnektivität

Zusätzlich zu BigQuery-, Cloud Storage-, Microsoft Excel- und Google Tabellen-Standardkonnektivität können Sie Ihre Self-Service-Analyse mit Hunderten von Datenquellen wie Salesforce, Oracle, Microsoft SQL Server, MySQL, PostgreSQL und vielen mehr erweitern.

Datenpipelineorchestrierung

Planen und automatisieren Sie Ihre Datenaufbereitungsaufträge, indem Sie sie in sequenzieller und bedingter Reihenfolge aneinanderreihen. Benachrichtigen Sie Nutzer über Erfolg oder Misserfolg und lösen Sie externe Aufgaben wie Cloud Functions aus. Nutzen Sie umfassende APIs, um Dataprep in eine End-to-End-Lösung eines Unternehmens einzubinden.

Operationalisierung für Unternehmen

Setzen Sie eine kontinuierliche Bereitstellung mit Schemaimport/-export unabhängig von Version, Ablaufparametern, benutzerdefinierter Konfiguration für die Leistungsoptimierung von Google Dataflow und fortgeschrittenen APIs ein. Damit automatisieren Sie Lebenszyklen von Softwareentwicklung und Monitoring.

Gängige Datentypen

Transformieren Sie strukturierte oder unstrukturierte Datasets, die in CSV-, JSON-, relationalen Tabellenformaten oder SaaS-Anwendungsdaten von beliebiger Größe (Megabyte bis Petabyte) gespeichert sind.

Musterabgleich

Nutzen Sie den Spaltenmusterabgleich, um relevante Datenmuster zu identifizieren und diese auf der Benutzeroberfläche zum Erstellen von Schemas bereitzustellen. Außerdem können Sie in Ihren Schemaschritten reguläre Ausdrücke oder Dataprep-Muster anwenden, um Muster zu suchen und die übereinstimmenden Daten in Ihren Datasets zu transformieren.

Standardisierung

Gruppieren Sie Werte nach Ähnlichkeiten anhand ihrer Schreibung oder sprachunabhängigen Aussprache und bilden Sie so standardisierte Cluster konsistenter Werte.

Probenahme

Zur Leistungsverbesserung generiert Dataprep automatisch eine oder mehrere Stichproben der Daten, um diese in der Client-Anwendung anzuzeigen und zu bearbeiten. Sie können die Größe und den Umfang der Stichprobe sowie deren Erfassungsmethode jedoch mühelos ändern.

Erweiterte Sicherheit

Erweitern Sie aktuelle Sicherheitsstandards durch individuelle Datenzugriffssteuerung. Nutzen Sie dazu eine Kombination aus Google IAM-Rollen und Zugriffsrechten für BigQuery, Cloud Storage und Google Tabellen.

ELT-Pipelinearchitektur von Dataprep

Links enthält die Spalte mit den Aufnahmedaten Rohdaten zu BigQuery, Cloud Storage, Google Tabellen, Microsoft Excel, Datenbanken, Anwendungen und Datei-Uploads. Der Ablauf bewegt sich nach rechts über die Spalte für Vorbereitung & Speicherung zu Cloud Dataprep und Dataflow, die Daten werden in BigQuery und Cloud Storage verfeinert. Diese Spalte enthält Governance & Automatisierung: Data Catalog, Cloud Functions, Cloud Composer. Der Ablauf bewegt sich weiter nach rechts in die Spalte für Analyse & ML, mit BigQuery/BigQueryML, Looker, Google Data Studio, Partner-BI-Diensten (Qlik-Logo hier) und Cloud AI Platform.
Logo: Merkle

„Mit Dataprep können wir schnell neue Datasets untersuchen und dank seiner Flexibilität werden alle unsere Anforderungen hinsichtlich Datentransformation erfüllt. Da wir bei Merkle jetzt nur noch Minuten statt Stunden für die Datenvorbereitung benötigen, konnten wir diese um 90 % beschleunigen."

Henry Culver, IT Architect, Merkle

Weiterlesen

Unsere Kunden

Preise

Weitere Informationen finden Sie in der Preisübersicht im Google Cloud Marketplace.

Gleich loslegen

Profitieren Sie von einem Guthaben über 300 $, um Google Cloud und mehr als 20 „Immer kostenlos“-Produkte kennenzulernen.

Benötigen Sie Hilfe beim Einstieg?
Unterstützung durch Google Cloud-Partner

Gleich loslegen

Starten Sie Ihr nächstes Projekt, nutzen Sie interaktive Anleitungen und verwalten Sie Ihr Konto.

Benötigen Sie Hilfe beim Einstieg?
Unterstützung durch Google Cloud-Partner
Tipps und Best Practices