Was ist Big Data?

Mit Big Data sind Daten gemeint, deren Speicherung, Verwaltung und Analyse durch herkömmliche (relationale und/oder monolithische) Datenbanksysteme üblicherweise zu teuer ist. Solche Systeme sind in der Regel nicht kosteneffizient, da sie nicht flexibel genug sind, um unstrukturierte Daten (wie Bilder, Text und Videos) zu speichern, sich an "schnelle" (Echtzeit-)Daten anzupassen oder um für die Unterstützung besonders großer Datenvolumen (Petabyte) skaliert zu werden.

Aus diesem Grund wurden in den letzten Jahren generell neue Ansätze für die Verwaltung und Verarbeitung von Big Data eingeführt, darunter Apache Hadoop- und NoSQL-Datenbanksysteme. Diese Optionen erweisen sich jedoch häufig als komplex bei der Bereitstellung, Verwaltung und Verwendung in einer lokalen Situation.

Woher kommt Big Data?

In der Vergangenheit konnten Kundendaten als gut strukturierte (beispielsweise finanzielle) Transaktionen kategorisiert werden. Heute hingegen stellt bereits die enorme Datenmenge, die Unternehmen täglich in Form von unstrukturierten Online-Kundeninteraktionen erzeugen, die vor einigen Jahren produzierte Menge in den Schatten. Die jüngste Entwicklung des "Internets der Dinge" (der Begriff beschreibt das weltweite Netzwerk von Milliarden miteinander verbundenen Geräten und Sensoren) hat zu einer Explosion des Volumens in Form von Text-, Video-, Bild- und sogar Audiodaten geführt. In einigen regulierten Branchen muss aus Compliance-Gründen häufig der Zugriff auf Daten möglich sein, die ansonsten archiviert würden.

Warum ist Big Data wichtig?

Die Fähigkeit, konsistent geschäftlichen Nutzen aus Daten zu ziehen, gehört heute zu den Merkmalen erfolgreicher Unternehmen jeder Branche und Größe. In einigen Branchen (wie Einzelhandel, Werbung und Finanzdienstleistungen, wobei immer mehr dazukommen) ist sie sogar unentbehrlich für das Weiterbestehen des Unternehmens.

Datenanalysen liefern nur dann einen höheren Wert, wenn Sie Zugriff auf mehr Daten haben. Daher stellt Big Data für Unternehmen verschiedenster Branchen eine umfangreiche Ressource dar, um fundierte geschäftliche Erkenntnisse zu gewinnen. Da maschinelles Lernen durch das "Trainieren" mit mehr Daten immer effizienter wird, ergänzen sich maschinelles Lernen und Big Data optimal.

Woher weiß ich, ob es sich bei meinen Daten um "Big Data" handelt?

Obwohl viele Unternehmen in Bezug auf das Datenvolumen noch keine Petabyte erreicht haben, kann eines der beiden anderen Merkmale von Big Data auf ihre Daten zutreffen. Und hier lässt sich nur eines garantieren: dass Ihre Datenmenge mit der Zeit wächst – und das wahrscheinlich exponentiell. So gesehen nimmt "Big Data" immer einen Anfang als "Small Data".

Warum ist die Cloud die beste Plattform für Big Data?

Das Cloud-Computing bietet Zugriff auf die Speicherung, Verarbeitung und Analyse von Daten, der skalierbarer, flexibler, kostengünstiger und sogar sicherer ist, als dies durch eine lokale Bereitstellung möglich wäre. Diese Eigenschaften sind von entscheidender Bedeutung für Kunden, bei denen das Datenvolumen exponentiell zunimmt. So stehen ihnen Speicher- und Verarbeitungsressourcen je nach Bedarf zur Verfügung und sie können einen Nutzen aus diesen Daten ziehen. Die Cloud bietet Unternehmen, die gerade erst mit dem Einsatz von Big-Data-Analysen und maschinellem Lernen beginnen und die potenzielle Komplexität lokaler Big-Data-Systeme umgehen möchten, darüber hinaus die Möglichkeit, verwaltete Dienste zu testen und nur für die tatsächlich in Anspruch genommenen Dienste (wie Google BigQuery und Google Cloud ML Engine) zu bezahlen ("Pay as you go").

Weitere Informationen