Neuigkeiten bei Googles offener und intelligenter Daten-Cloud
Bruno Aziza
Head of Data & Analytics, Google Cloud
Wir haben das Privileg, täglich mit höchst innovativen Kunden weltweit zusammenzuarbeiten. Viele von ihnen entschieden sich für Google Cloud, weil wir über fundiertes Fachwissen in den Bereichen Datenanalyse und KI verfügen. Bei der Zusammenarbeit haben wir festgestellt, dass viele der führenden Datenunternehmen ähnliche Prioritäten haben: Datenbarrieren und -komplexität abbauen, neue Anwendungsfälle erschließen und mehr Menschen mit mehr Wirkung erreichen.
Diese disruptiven Unternehmen treiben die Dateninnovation mit einer Daten-Cloud voran, die ihre Mitarbeiter*innen befähigt, Daten aller Art, jeglichen Umfangs und aus jeder Quelle schnell zu bearbeiten – ohne Kapazitätsgrenzen. Diese Daten-Cloud bietet Bewegungsfreiheit, die Nutzer*innen wechseln ihre Workloads mühelos zwischen SQL und Spark, Business Intelligence und Machine Learning. Und für all das muss nur wenig Infrastruktur eingerichtet werden. Außerdem bildet diese Daten-Cloud das Fundament eines Ökosystems zur Schaffung von Datenprodukten, mit denen Mitarbeiter*innen, Kunden und Partner informierte Entscheidungen auf einer breiten Grundlage treffen können.
Am 11. Oktober, auf der Google Cloud Next ‘22, werden wir eine ganze Reihe neuer Funktionen vorstellen, die für diese Vision und ihre Weiterentwicklung stehen. Sollten Sie sich noch nicht für den Data Cloud-Track bei der Google Next angemeldet haben, sichern Sie sich am besten noch heute einen Platz!
Doch weil passionierte Datenfachleute nur ungern warten, möchten wir schon vor der Next eine Vorschau auf die jüngsten Daten-Cloud-Innovationen bieten.
Data Sharing ohne Barrieren, Erkenntnisse in Echtzeit, offene Ökosysteme
Gewöhnlich sind nicht alle Daten, die Sie benötigen, an einer Stelle versammelt, sondern liegen in einer Vielzahl von Quellen und Formaten vor. Nach Jahrzehnten von digitalem Datenaustausch kann die Datenbewegung bei einem traditionellen Austausch sehr aufwendig sein. Sicherheits- und Compliance-Fragen kommen erschwerend hinzu.
Deshalb haben wir uns entschieden, den nun verfügbaren Analytics Hub zu entwickeln – eine Data-Sharing-Plattform für Teams und Organisationen, die den Datenaustausch intern und extern sicher und zuverlässiger gestalten möchten.
Diese Innovation gewährleistet nicht nur, dass große Datensätze global analysebereit zusammengestellt und geteilt werden können, sondern erschließt auch Datensätze, die nur Google bereitstellen kann, z. B. die Google Search Trends oder den Data Commons Knowledge Graph.
Analytics Hub bietet ein erstklassiges Nutzungserlebnis innerhalb von BigQuery: Testen Sie den Hub jetzt im Rahmen der BigQuery-Nutzung kostenlos, ohne Angabe von Kreditkartendaten.
Daten schnell in Ihre Analyseumgebung zu bringen geht aber auch ohne Analytics Hub. Eine kürzlich neu eingeführte Option erlaubt es, Daten in Echtzeit für BigQuery zu extrahieren, zu laden und zu transformieren: das Pub/Sub-Abonnement „BigQuery Subscription“. Diese ELT-Innovation vereinfacht das Streamen von einzuspeisenden Workloads, sie lässt sich leichter implementieren und bietet auch wirtschaftliche Vorteile, denn Sie müssen keine neue Rechenleistung bereitstellen, um Daten zu bewegen, und für die Stream-Einspeisung in BigQuery auch nichts mehr zahlen.
Was aber, wenn Ihre Daten nun in verschiedenen Lakes, Warehouses, Clouds und Dateiformaten stecken? Mit der Zahl der Nutzer*innen vermehren sich auch die Anwendungsfälle und lassen eine herkömmlich aufgebaute Infrastruktur zur Datenbewegung schnell an die Grenzen ihrer Skalierbarkeit stoßen, wodurch hohe Kosten und Risiken entstehen können.
Wir haben deshalb die neue Speicher-Engine BigLake eingeführt, die den innovativen BigQuery-Speicher auf offene Dateiformate ausdehnt, die in öffentlichen Cloud-Objektspeichern residieren. Mit BigLake können Kunden sichere Data Lakes auf der Grundlage offener Dateiformate aufbauen. Und da die Lösung konsistente, granulare Sicherheitskontrollfunktionen für Google Cloud- und Open-Source-Query Engines bietet, muss das Sicherheitssystem nur an einer zentralen Stelle konfiguriert werden, um überall wirksam zu sein.
Kunden wie die Deutsche Bank, Synapse LLC und Wizard haben die Preview-Version von BigLake bereits im Einsatz. Die allgemeine Verfügbarkeit von BigLake gibt Ihnen Gelegenheit, zu erproben, wie Sie Ihr eigenes Daten-Ökosystem aufbauen können.
Freie Wege in der Datenverarbeitung
Wenn sich Ökosysteme auf Datenarten, -größen, -typen und -formate aller Art ausdehnen, werden Organisationen oft in der Innovation ausgebremst, denn die Mitarbeiter*innen müssen, je nach Workload, ständig zwischen unterschiedlichen Schnittstellen wechseln.
Das gilt insbesondere für den Bereich Machine Learning, wo die ML-Schnittstelle häufig eine andere als die für Geschäftsanalysen ist. Nach unseren Erfahrungen kommen BigQuery ML Kunden auf ihren Innovationspfaden jedoch sehr viel schneller voran – weil die Machine Learning-Fähigkeiten integraler Bestandteil von BigQuery sind, während sie bei anderen Lösungen lediglich aufgesetzt werden.
Dieselbe Philosophie wenden wir nun beim Data-Logging an, indem wir einen Loganalyse-Dienst in Cloud Logging anbieten. Dieses derzeit noch im Preview-Status befindliche neue Feature bietet seinen Anwender*innen profunde Einblicke in ihre BigQuery-Logging-Daten. Über die Cloud Logging-Gebühren hinaus fallen keine weiteren Kosten für die Loganalyse an, die zudem von den bald allgemein verfügbaren BigQuery-Features zur Loganalyse profitieren wird: Suchindizes, ein JSON-Dateityp und die Storage Write API.
Kunden, die ihre eigenen maschinengenerierten Daten von Servern, Sensoren und anderen Geräten speichern, untersuchen und analysieren, können damit auf dieselben BigQuery-Features zurückgreifen und haben es so bei der Abfrage der Logs leicht. Sie verwenden einfach die standardmäßige BigQuery-SQL, um operative Log-Daten zu analysieren, genauso wie bei ihren anderen Geschäftsdaten.
Doch das war noch längst nicht alles. Wir freuen uns darauf, Sie am 11. Oktober auf der Google Next ’22 zu begrüßen und Ihnen weitere Details zu den Daten-Cloud-Lösungen der nächsten Generation zu verraten. Suchen Sie die Ihrer Rolle und Ihren Interessen entsprechenden Beiträge unter den Top-Sessions der Next für Datenentwicklung, Datenwissenschaft und Datenanalyse aus – oder erstellen und teilen Sie Ihre eigenen Playlists.
Kommen Sie zur Next ’22 und hören Sie aus erster Hand, wie Boeing, Twitter, CNA Insurance, Telus, L’Oreal, Wayfair und andere Top-Unternehmen datengestützte Erkenntnisse in Erfolge umsetzen – mit der Daten-Cloud von Google.