Was ist Big Data?

Mit Big Data sind Daten gemeint, deren Speicherung, Verwaltung und Analyse durch herkömmliche (relationale und/oder monolithische) Datenbanksysteme üblicherweise zu teuer ist. Solche Systeme sind in der Regel nicht kosteneffizient, da sie nicht flexibel genug sind, um unstrukturierte Daten (wie Bilder, Text und Videos) zu speichern, sich an "schnelle" (Echtzeit-)Daten anzupassen oder zu skalieren, um besonders große Datenvolumen (Petabytes) zu unterstützen.

Aus diesem Grund wurden in den letzten Jahren generell neue Ansätze für die Verwaltung und Verarbeitung von Big Data eingeführt, darunter Apache Hadoop- und NoSQL-Datenbanksysteme. Diese Optionen erweisen sich jedoch häufig bei der Bereitstellung, Verwaltung und Verwendung in einer lokalen Situation als komplex.

Woher kommt Big Data?

In der Vergangenheit konnten Kundendaten als gut strukturierte (beispielsweise finanzielle) Transaktionen kategorisiert werden. Heute hingegen stellt die enorme Datenmenge, die Unternehmen täglich in Form von unstrukturierten Online-Kundeninteraktionen erzeugen, bereits die vor einigen Jahren produzierte Menge in den Schatten. Die jüngste Entwicklung des "Internets der Dinge", einem Begriff, der das weltweite Netzwerk von Milliarden miteinander verbundener Geräte und Sensoren beschreibt, hat zu einer Explosion des Volumens in Form von Text-, Video-, Bild- und sogar Audiodaten geführt. In einigen regulierten Branchen muss der Zugriff auf Daten, die ansonsten archiviert werden würden, häufig aus Compliance-Gründen möglich sein.

Warum ist Big Data wichtig?

Die Fähigkeit, durchweg geschäftlichen Nutzen aus Daten ziehen zu können, gehört heute zu den Merkmalen erfolgreicher Unternehmen jeder Branche und Größe. In einigen Branchen (wie Einzelhandel, Werbung und Finanzdienstleistungen, wobei immer mehr dazukommen) ist dies sogar unentbehrlich für das Bestehen des Unternehmens.

Datenanalysen liefern nur dann einen höheren Wert, wenn Sie Zugriff auf mehr Daten haben. Daher stellt Big Data für Unternehmen verschiedenster Branchen eine umfangreiche Ressource dar, um fundierte geschäftliche Erkenntnisse zu gewinnen. Da maschinelles Lernen durch das "Trainieren" mit mehr Daten immer effizienter wird, ergänzen sich maschinelles Lernen und Big Data optimal.

Woher weiß ich, ob es sich bei meinen Daten um "Big Data" handelt?

Obwohl viele Unternehmen in Bezug auf das Datenvolumen noch keine Petabytes erreicht haben, kann eines der beiden anderen Merkmale von Big Data auf ihre Daten zutreffen. Wenn hierbei irgendetwas garantiert ist, dann die Tatsache, dass Ihre Datenmenge mit der Zeit wächst – und das wahrscheinlich exponentiell. So gesehen nimmt "Big Data" immer ihren Anfang als "Small Data".

Warum ist die Cloud die beste Plattform für Big Data?

Das Cloud-Computing bietet Zugriff auf die Speicherung, Verarbeitung und Analyse von Daten, der skalierbarer, flexibler, kostengünstiger und sogar sicherer ist, als dies durch eine lokale Bereitstellung möglich wäre. Diese Eigenschaften sind von entscheidender Bedeutung für Kunden, bei denen das Datenvolumen exponentiell zunimmt. So stehen ihnen Speicher- und Verarbeitungsressourcen je nach Bedarf zur Verfügung und sie können einen Nutzen aus diesen Daten ziehen. Die Cloud bietet Unternehmen, die gerade erst damit anfangen, Big-Data-Analysen und maschinelles Lernen einzusetzen, und die die potenzielle Komplexität lokaler Big-Data-Systeme umgehen möchten, darüber hinaus die Möglichkeit, verwaltete Dienste zu testen und nur für die tatsächlich in Anspruch genommenen Dienste (wie Google BigQuery und Google Cloud ML Engine) zu bezahlen ("Pay as you go").

Weitere Informationen:

Hat Ihnen diese Seite weitergeholfen? Teilen Sie uns Ihr Feedback mit: