Sehen Sie sich „Spark on Google Cloud“ auf der Google Cloud Next 2021 hier an.

Weiter zu

Spark in Google Cloud

Das branchenweit erste automatisch skalierende serverlose Spark, integriert mit den besten Google-nativen und Open-Source-Tools. Entwickeln Sie Spark und führen Sie es dort aus, wo Sie es brauchen, in allen Anwendungsfällen, einschließlich ETL, Data Science und Exploration.

Vorteile

Erhöhte Entwicklerproduktivität und schnellere Informationen über Daten

Betriebliche Einfachheit durch serverloses Spark

Schreiben von Spark-Anwendungen und -Pipelines mit automatischer Skalierung ohne manuelle Infrastrukturbereitstellung oder -abstimmung. 

Nahtlose Spark-Nutzung für alle Datennutzer

Spark ist in BigQuery, Vertex AI und Dataplex integriert, sodass Sie es über diese Schnittstellen mit zwei Klicks und ohne benutzerdefinierte Integrationen für ETL, explorative Datenanalyse, Analyse und ML schreiben und ausführen können. 

Flexibilität der Nutzung

One Size Does NOT Fit All. Sie können zwischen serverlosen, Kubernetes-Clustern und Compute-Clustern für Ihre Spark-Anwendungen wählen.

Wichtige Features

Führen Sie Spark-Jobs aus, die automatisch mit zwei Klicks von der Oberfläche Ihrer Wahl skaliert werden

Serverloser Spark (bald allgemein verfügbar)

Die Entwickler können ihre gesamte Zeit auf Code und Logik verwenden und über die von ihnen gewählte Schnittstelle Spark-Aufträge senden, die automatisch bereitgestellt und skaliert werden.

Spark über BigQuery nutzen (private Vorschau)

Einheitliche SQL- und Spark-Nutzung: Data-Warehousing-Nutzer können einfach Spark on BigQuery-Daten schreiben und ausführen, ohne sie zu exportieren. Es ist keine Infrastrukturverwaltung erforderlich. 

Spark über Vertex AI nutzen (private Vorschau)

Spark für Data Science mit nur einem Klick: Data Scientists können Spark für die Entwicklung von Vertex AI Workbench nahtlos und mit integrierter Sicherheit verwenden. Spark ist in die MLOps-Funktionen von Vertex AI eingebunden, wo Nutzer Spark-Code über Notebook Executors ausführen können, die in Vertex AI Pipelines integriert sind.

Spark durch Dataplex (private Vorschau)

Führen Sie Auto-Scaling für Spark auf Daten in der Google Cloud über eine einzige Schnittstelle aus, die mit einem Klick Zugriff auf SparkSQL, Notebooks oder PySpark bietet. Bietet außerdem eine einfache Zusammenarbeit mit der Möglichkeit, Notebooks und Skripte zusammen mit Daten zu speichern, freizugeben und zu durchsuchen, sowie integrierte Governance über Data Lakes hinweg.

Flexible Nutzungsoptionen

Zusätzlich zu serverlosem Spark für die managementfreie Bereitstellung können Kunden, die Kubernetes für das Infrastrukturmanagement standardisieren, Spark auf Google Kubernetes Engine (private Vorschau) ausführen, um die Ressourcenauslastung zu verbessern und das Infrastrukturmanagement zu vereinfachen. Kunden, die nach einer Infrastrukturverwaltung im Hadoop-Stil suchen, können Spark in Compute Engine (GA) ausführen.


Startbereit? Kontakt

Das ist neu

Aktuelle Neuigkeiten, Blogs und Veranstaltungen zu Spark in Google Cloud

Registrieren Sie sich hier, um Vorabzugriff auf die neuen Lösungen für Spark in Google Cloud anzufordern.