Was ist ein Data Warehouse?

Ein Data Warehouse, auch Enterprise Data Warehouse (EDW) genannt, ist eine Unternehmensdatenplattform, die für die Analyse und Berichterstellung von strukturierten und semistrukturierten Daten aus verschiedenen Datenquellen wie Kassentransaktionen, Marketingautomatisierung, Customer-Relationship-Management und mehr verwendet wird. 

Data Warehouses umfassen eine analytische Datenbank sowie kritische analytische Komponenten und Verfahren. Sie unterstützen Ad-hoc-Analysen und benutzerdefinierte Berichte, z. B. Datenpipelines, Abfragen und Geschäftsanwendungen. Sie können riesige Mengen an aktuellen und Verlaufsdaten an einem Ort konsolidieren und integrieren und sind so konzipiert, dass sie einen langfristigen Überblick über Daten bieten. Dank dieser Data Warehouse-Funktionen ist der Data-Warehouse-Prozess zu einem zentralen Bestandteil der Unternehmensanalyse geworden, um fundierte Geschäftsentscheidungen zu unterstützen.

Erfahren Sie mehr über BigQuery, dem kostengünstigen, serverlosen Multi-Cloud-Enterprise Data Warehouse von Google Cloud.

Definition von Data Warehouse

Ein Data Warehouse ist ein Unternehmenssystem zur Analyse und Berichterstellung zu strukturierten und semistrukturierten Daten aus verschiedenen Quellen. Dazu zählen Kassentransaktionen, Marketingautomatisierung, Customer-Relationship-Management usw. Ein Data Warehouse eignet sich sowohl für Ad-hoc-Analysen als auch die Erstellung benutzerdefinierter Berichte. In einem Data Warehouse können sowohl aktuelle Daten als auch Verlaufsdaten zentral gespeichert werden. Es ist darauf ausgelegt, einen langfristigen Überblick über Daten zu bieten. Das macht das Data Warehouse zu einem zentralen Bestandteil von Business Intelligence.

Traditionelles vs. cloudbasiertes Data Warehouse

Herkömmliche Data Warehouses werden lokal gehostet, wobei Daten aus relationalen Datenbanken, Transaktionssystemen, Geschäftsanwendungen und anderen Quellsystemen einfließen. Sie sind jedoch in der Regel darauf ausgelegt, eine Teilmenge von Daten in Batches zu erfassen und diese basierend auf starren Schemas zu speichern. Daher sind sie für spontane Abfragen oder Echtzeitanalysen nicht geeignet. Unternehmen müssen außerdem ihre eigene Hardware und Software mit einem lokalen Data Warehouse erwerben, was Skalierung und Wartung kostspielig macht. In einem traditionellen Warehouse ist der Speicher im Vergleich zur Rechenleistung in der Regel begrenzt, sodass Daten schnell transformiert und dann verworfen werden, um Speicherplatz frei zu halten.

Die heutigen Data-Analytics-Aktivitäten sind in den Mittelpunkt aller Kerngeschäftsaktivitäten gerückt, einschließlich der Umsatzgenerierung, der Kostenbegrenzung, der Verbesserung von Abläufen und der Verbesserung der Kundenzufriedenheit. Daten entwickeln sich weiter und diversifizieren sich. Daher benötigen Unternehmen zuverlässigere Data Warehouse-Lösungen und fortschrittliche Analysetools, um große Datenmengen unternehmensweit zu speichern, zu verwalten und zu analysieren. 

Diese Systeme müssen skalierbar, zuverlässig und sicher genug sein für regulierte Branchen und flexibel genug, um eine Vielzahl von Datentypen und Big Data-Anwendungsfällen zu unterstützen. Außerdem müssen sie flexible Preise und Computing-Ressourcen unterstützen, sodass Sie nur für das zahlen, was Sie tatsächlich benötigen, anstatt ihre Kapazität zu erraten. Diese Anforderungen gehen weit über die Fähigkeiten der meisten Legacy Data Warehouses hinaus. Aus diesem Grund entscheiden sich viele Unternehmen für cloudbasierte Data Warehouse-Lösungen.

Ein Cloud Data Warehouse macht im Vergleich zu einem traditionellen Data Warehouse keine Kompromisse, sondern erweitert die Funktionen und wird auf einem vollständig verwalteten Dienst in der Cloud ausgeführt. Cloud Data Warehouses bieten sofortige Skalierbarkeit zur Erfüllung sich ändernder Geschäftsanforderungen sowie eine leistungsstarke Datenverarbeitung zur Unterstützung komplexer Analyseabfragen. 

Ein Cloud Data Warehouse bietet Ihnen die Flexibilität einer Cloud-Umgebung und besser vorhersehbare Kosten. Bei lokalen Data Warehouse-Lösungen sind die Vorabinvestitionen in der Regel deutlich geringer und die Vorlaufzeiten kürzer, da die physische Infrastruktur vom Cloud-Dienstanbieter verwaltet und gewartet wird. 

So funktioniert Data Warehousing in der Cloud

Wie herkömmliche Data Warehouses erfassen, integrieren und speichern Cloud Data Warehouses Daten aus internen und externen Datenquellen. Daten werden in der Regel mithilfe einer Datenpipeline aus einem Quellsystem übertragen. Die Daten werden aus dem Quellsystem extrahiert, umgewandelt und in das Data Warehouse geladen. Dieser Prozess wird als ETL (Extrahieren, Transformieren, Laden) bezeichnet. Daten können auch direkt an ein zentrales Repository gesendet und dann mithilfe von ELT-Prozessen (Extrahieren, Laden, Transformieren) konvertiert werden. Von dort aus können Nutzende verschiedene Business Intelligence-Tools (BI) verwenden, um auf Daten zuzugreifen, Erkenntnisse daraus zu gewinnen und Berichte darüber zu erstellen. Cloud Data Warehouses sollten außerdem Streaming-Anwendungsfälle unterstützen, um Daten in Echtzeit oder nahezu in Echtzeit zu nutzen.

Cloud Data Warehouses bieten strukturierte und semistrukturierte(s) Datenspeicherung, -verarbeitung, -integration, -bereinigung, -laden usw. in einer öffentlichen Cloud-Umgebung. Sie können auch mit einem Cloud Data Lake verwendet werden, um unstrukturierte Daten zu erfassen und zu speichern. Bei einigen Anbietern ist es sogar möglich, Ihr Data Warehouse und Ihr Data Lake zu vereinheitlichen, um so Ihre vereinheitlichen Unternehmensdaten zentral zu verwalten.

Je nach Cloud-Anbieter können unterschiedliche Ansätze für Cloud Data Warehouse-Dienste verfolgt werden. Einige Cloud Data Warehouses können beispielsweise eine clusterbasierte Architektur verwenden, die einem traditionellen Data Warehouse ähnelt. Im Gegensatz dazu verwenden andere eine moderne serverlose Architektur, wodurch die Verantwortung für das Datenmanagement weiter minimiert wird. Die meisten Cloud Data Warehouses bieten jedoch integrierte Funktionen zur Datenspeicherung und Kapazitätsverwaltung sowie automatische Upgrades.

Zu den weiteren wichtigen Funktionen von Cloud Data Warehouses gehören:

  • Massive Parallelverarbeitung (MSP)
  • Spaltenbasierte Datenspeicher
  • Self-Service-ETL- und ELT-Datenintegration  
  • Funktionen zur Notfallwiederherstellung und automatische Sicherungen
  • Compliance- und Data-Governance-Tools
  • Integrierte Integrationen für BI, KI und Machine Learning

Vorteile von Data Warehouses in der Cloud

Unternehmen rücken immer mehr von herkömmlichen Data Warehouses ab und migrieren in die Cloud. Dabei profitieren sie von den Kosteneinsparungen und der Skalierbarkeit von verwalteten Diensten. 

Dies sind die wichtigsten Vorteile von Cloud Data Warehousing.

Für Skalierung entwickelt

Cloud Data Warehouses sind flexibel und bieten nahezu unbegrenzten Speicherplatz und Kapazitäten. Sie können sie je nach Ihren Geschäftsanforderungen einfach hoch- oder herunterskalieren und Sie zahlen nur für das, was Sie tatsächlich nutzen. 

Initiativen für maschinelles Lernen und KI

Kunden können in Cloud Data Warehouses Machine Learning-Modelle und KI-Technologien schnell für Data Mining, die Vorhersage von Geschäftsergebnissen und die Optimierung anderer Bereiche nutzen und operationalisieren – von der Verwaltung des Datenlebenszyklus über Geschäftsprozesse bis hin zu Betriebskosten.

Bessere Verfügbarkeit

Cloud-Anbieter müssen SLAs einhalten und bieten mit einer nahtlos skalierbaren, zuverlässigen Cloud-Infrastruktur eine bessere Verfügbarkeit. Bei lokalen Data Warehouses gibt es Skalierungs- und Ressourcenbeschränkungen, die sich nachteilig auf die Leistung auswirken können.

Vorhersehbarkeit der Kosten

Die Cloud bietet flexiblere und vorhersehbarere Preise. Manche Anbieter berechnen die Kosten nach Durchsatz oder nach Stunde pro Knoten. Andere berechnen einen Festpreis für eine bestimmte Ressourcenzahl. In jedem Fall vermeiden Sie die gewaltigen Kosten eines lokalen Data Warehouse, das 24 Stunden am Tag und sieben Tage pro Woche in Betrieb ist, unabhängig davon, ob Ressourcen benötigt werden oder nicht.

Einsparung von Betriebskosten

Ein Cloud Data Warehouse ist vollständig verwaltet, sodass Sie Verwaltungsprobleme an Cloud-Anbieter auslagern können, die Service Level Agreements (SLAs) einhalten müssen. Dadurch sparen Sie Betriebskosten und Ihr firmeninternes Team gewinnt Zeit für wachstumsgenerierende Aufgaben.

Echtzeitanalysen

Cloud Data Warehouses bieten ein leistungsstärkeres Computing, das das Streaming von Daten unterstützt, sodass Sie Daten in Echtzeit abfragen können. Infolgedessen können Sie viel schneller auf Daten zugreifen und sie verwenden als mit einem lokalen Data Warehouse. So erhalten Sie schneller genauere Informationen und können fundiertere Geschäftsentscheidungen treffen.

Wofür werden Data Warehouses verwendet?

Cloud Data Warehouses bieten Unternehmen verschiedene Lösungen. Dies sind einige der häufigsten Anwendungsfälle für Data Warehouses:

Entscheidungen in Echtzeit treffen: Analysieren Sie Daten in Echtzeit, um proaktiv Herausforderungen anzugehen, Chancen zu identifizieren, Effizienz zu steigern, Kosten zu senken und proaktiv auf Geschäftsereignisse zu reagieren.

Datensilos konsolidieren: Sie können Daten aus mehreren strukturierten Quellen in Ihrem Unternehmen schnell abrufen, z. B. aus Kassensystemen, Websites und E-Mail-Listen, und sie an einem Ort zusammenführen, um Analysen durchzuführen und Einblicke zu erhalten.

Geschäftsberichte und Ad-hoc-Analysen ermöglichen: Speichern Sie Verlaufsdaten auf einem anderen Server als Betriebsdaten, sodass Endnutzer darauf zugreifen und eigene Abfragen und Berichte ausführen können, ohne die Leistung von Betriebssystemen zu beeinträchtigen oder auf Hilfe von der IT-Abteilung zu warten.

Machine Learning und KI implementieren: Es werden Verlaufsdaten und Echtzeitdaten erfasst, um Algorithmen zu entwickeln, die Prognosen liefern. So können Sie z. B. Traffic-Spitzen vorhersehen oder Kunden, die eine Website besuchen, relevante Produkte vorschlagen.

Viele Unternehmen und Branchen benötigen Datenanalysen, die nicht nur extrem umfangreich sind, sondern auch fortlaufend und in Echtzeit erfolgen müssen. So nutzen zum Beispiel manche Dienstanbieter Echtzeitdaten, um ihre Preise im Laufe des Tages dynamisch anzupassen. Versicherungen analysieren unter anderem Policen, Verkäufe, Ansprüche und Gehaltsabrechnungsdaten und nutzen Machine Learning, um Betrug zu prognostizieren. Spieleentwickler müssen das Nutzerverhalten in Echtzeit verfolgen und darauf reagieren können, um das Spielerlebnis zu verbessern. Data Warehouses machen all diese Vorgänge möglich.

Wenn für Ihr Unternehmen eine oder mehrere der folgenden Anforderungen zutreffen, ist es wahrscheinlich ein guter Kandidat für ein Data Warehouse:

  • unterschiedliche Datenquellen
  • Big Data-Analyse und -Visualisierung, sowohl asynchron als auch in Echtzeit
  • Modelle für Machine Learning und andere KI-gestützte Prozesse
  • Streamanalyse
  • Erstellung benutzerdefinierter Berichte und Ad-hoc-Analysen
  • Data Mining
  • Data Science und raumbezogene Analysen

So wählen Sie eine cloudbasierte Data-Warehouse-Lösung aus

Wenn Sie sich für ein cloudbasiertes Data Warehouse entscheiden, ist es wichtig, die Funktionsweise der Lösungen zu bewerten und ein tiefes Verständnis der bestehenden Anwendungsfälle zu haben, die Ihr Cloud Data Warehouse unterstützen muss.

Bei der Auswahl eines Anbieters sind viele weitere Aspekte zu berücksichtigen, die über die Warehousing-Funktionen hinausgehen. Dazu gehören u. a. Unterschiede in der Architektur, Skalierbarkeit, Sicherheit, Preisgestaltung und Leistung. Vielleicht stellen Sie beispielsweise fest, dass eine einfach zu implementierende Lösung nicht so einfach zu skalieren ist oder dass Sie alle Datenanalysten neu schulen und zusätzliche Lizenzen erwerben müssen, um Ihr aktuelles System zu aktualisieren.

Neben den Unterschieden zwischen den Anbietern sollten Sie auch berücksichtigen, was die Migration zu einem Cloud Data Warehouse konkret umfasst und in welchem Bezug dies zu Ihren bestehenden IT-Investitionen und spezifischen Geschäftsanforderungen steht. 

Enterprise Data Warehouses spielen eine zentrale Rolle bei der Entscheidungsfindung eines Unternehmens. Daher ist es wichtig, dass Sie ein tiefes Verständnis der Geschäftsanforderungen, aktuellen Anwendungsfälle und etwaigen Lücken bei bestehenden Lösungen haben. Es kann hilfreich sein, wichtige Stakeholder frühzeitig in den Prozess einzubeziehen, um die Auswirkungen der Ersetzung einer Legacy Data Warehouse-Lösung, die funktionalen Anforderungen zum Bewältigen von Herausforderungen und detaillierte technische Informationen über Datenquellen, Tools, Frameworks und mehr zu ermitteln.

Meistern Sie Ihre geschäftlichen Herausforderungen mit Google Cloud

Neukunden erhalten ein Guthaben im Wert von 300 $ für Google Cloud.
Sprechen Sie mit einem Google Cloud-Vertriebsexperten, um Ihre besonderen Herausforderungen im Detail zu besprechen.

Gleich loslegen

Profitieren Sie von einem Guthaben über 300 $, um Google Cloud und mehr als 20 „Immer kostenlos“-Produkte kennenzulernen.

Google Cloud
  • ‪English‬
  • ‪Deutsch‬
  • ‪Español‬
  • ‪Español (Latinoamérica)‬
  • ‪Français‬
  • ‪Indonesia‬
  • ‪Italiano‬
  • ‪Português (Brasil)‬
  • ‪简体中文‬
  • ‪繁體中文‬
  • ‪日本語‬
  • ‪한국어‬
Console
Google Cloud