Bekannt gegeben im Mai 2025: Dataproc Serverless heißt jetzt Google Cloud Serverless für Apache Spark

Logo von Serverless for Apache Spark

Google Cloud Serverless für Apache Spark

Konzentrieren Sie sich auf Ihren Code, nicht auf Ihre Infrastruktur

Führen Sie Ihre Apache Spark-Jobs einfacher auf einer anpassbaren Zero-Ops-Plattform, intelligenter mit Gemini-Unterstützung und schneller mit der Leistung der Lightning Engine aus.

Apache Spark ist eine Marke der Apache Software Foundation.


Features

Branchenführende Leistung

Mit der Lightning Engine, unserer vektorisierten Engine der nächsten Generation, können Sie Ihre Aufträge beschleunigen. Sie profitieren von einer mehr als 4, 3‑mal schnelleren Leistung und niedrigeren Gesamtkosten für Ihre serverlosen Spark-Arbeitslasten – automatisch.

Zero-Ops mit intelligentem Autoscaling

Dank intelligentem Autoscaling entfällt die Clusterverwaltung. Ressourcen werden automatisch hoch- und herunterskaliert, um den Anforderungen Ihres Jobs perfekt zu entsprechen. So wird maximale Leistung und Kosteneffizienz gewährleistet, ohne dass Sie für Leerlaufzeiten bezahlen müssen.

KI-basierte Entwicklung

Beschleunigen Sie Ihren gesamten Workflow. Mit Gemini Code Assist in BigQuery Studio können Sie PySpark-, Scala- und Java-Code schreiben und debuggen und GPU-beschleunigte Umgebungen mit vorkonfigurierten ML-Laufzeiten starten.

Einheitliche Spark- und SQL-Nutzung

Kontextwechsel vermeiden Sie können Ihre Arbeitslasten in einer einzigen Umgebung wie BigQuery Studio entwickeln und ausführen und dabei leistungsstarkes SQL nahtlos mit der Flexibilität von PySpark in einem Notebook kombinieren.


Zwei Leistungsstufen

Zwei LeistungsstufenEs gibt verschiedene Stufen, die Ihren spezifischen Anforderungen entsprechen – von der Standard-Batchverarbeitung bis hin zu den anspruchsvollsten, leistungskritischen Jobs.
StufeOptimal für

Standard

Ideal für kosteneffiziente Batchverarbeitung, Datentransformationen und allgemeine Spark-Jobs.

  • Allgemeine Spark-ETL
  • Geplante Datenpipelines
  • Kostensensitive Batchjobs

Premium

Für die anspruchsvollsten Arbeitslasten mit maximaler Leistung durch die Lightning Engine, KI-/ML-Beschleunigung und interaktive Funktionen.

  • Leistungskritische Jobs mit der Lightning Engine für eine 4,3-fache Steigerung
  • Interaktive Data Science und Analysen
  • GPU-beschleunigte KI und ML
  • Komplexe, umfangreiche Datenverarbeitung

Zwei Leistungsstufen

Es gibt verschiedene Stufen, die Ihren spezifischen Anforderungen entsprechen – von der Standard-Batchverarbeitung bis hin zu den anspruchsvollsten, leistungskritischen Jobs.

Standard

Optimal für

Ideal für kosteneffiziente Batchverarbeitung, Datentransformationen und allgemeine Spark-Jobs.

  • Allgemeine Spark-ETL
  • Geplante Datenpipelines
  • Kostensensitive Batchjobs

Premium

Optimal für

Für die anspruchsvollsten Arbeitslasten mit maximaler Leistung durch die Lightning Engine, KI-/ML-Beschleunigung und interaktive Funktionen.

  • Leistungskritische Jobs mit der Lightning Engine für eine 4,3-fache Steigerung
  • Interaktive Data Science und Analysen
  • GPU-beschleunigte KI und ML
  • Komplexe, umfangreiche Datenverarbeitung

Funktionsweise

Entwickeln Sie Ihre Apache Spark-Anwendung in Ihren bevorzugten Tools, einschließlich BigQuery Studio-Notebooks. Sie senden Ihren serverlosen Spark-Job mit einem einzigen Befehl und Google erledigt den Rest – Sie müssen keine Cluster erstellen, konfigurieren oder verwalten.


Gängige Einsatzmöglichkeiten

Interaktive Data Science

Data Scientists können Daten untersuchen und Spark ML-Modelle schnell iterieren. Vereinheitlichen Sie SQL und Spark in einem einzigen BigQuery Studio-Notebook und wechseln Sie nahtlos von der Datenexploration mit SQL zur Modellentwicklung mit PySpark, ohne jemals die Infrastruktur verwalten zu müssen.

BQ Studio-Notebook

Interaktive Data Science

Data Scientists können Daten untersuchen und Spark ML-Modelle schnell iterieren. Vereinheitlichen Sie SQL und Spark in einem einzigen BigQuery Studio-Notebook und wechseln Sie nahtlos von der Datenexploration mit SQL zur Modellentwicklung mit PySpark, ohne jemals die Infrastruktur verwalten zu müssen.

BQ Studio-Notebook

Automatisierte ETL-Pipelines

 Erstellen Sie robuste, ereignisgesteuerte Spark-ETL-Pipelines, die bei Bedarf automatisch skaliert werden. Sie zahlen nur für das, was Sie tatsächlich nutzen. Das macht die Lösung ideal für unregelmäßige oder unvorhersehbare Arbeitslasten.

Schneller von Daten zur Spark-Produktion

    Automatisierte ETL-Pipelines

     Erstellen Sie robuste, ereignisgesteuerte Spark-ETL-Pipelines, die bei Bedarf automatisch skaliert werden. Sie zahlen nur für das, was Sie tatsächlich nutzen. Das macht die Lösung ideal für unregelmäßige oder unvorhersehbare Arbeitslasten.

    Schneller von Daten zur Spark-Produktion

      KI/ML in großem Umfang

      Mit serverlosem Spark können Sie das Training umfangreicher Modelle und Batch-Inferenz beschleunigen. Mit einem einzigen Befehl können Sie NVIDIA-GPUs mit vorkonfigurierten Bibliotheken anhängen.

      Folie

        KI/ML in großem Umfang

        Mit serverlosem Spark können Sie das Training umfangreicher Modelle und Batch-Inferenz beschleunigen. Mit einem einzigen Befehl können Sie NVIDIA-GPUs mit vorkonfigurierten Bibliotheken anhängen.

        Folie

          Preise

          Transparente, wertorientierte PreiseDie Preise für Serverless for Apache Spark basieren auf der sekundengenauen Nutzung von Rechenleistung (DCUs), GPUs und Shuffle-Speicher.
          Dienste und NutzungAbotyp Preis ($)

          Data Compute Unit (DCU)

          Standard

          Ab

          0,06 $

          pro Stunde

          Premium

          Ab

          0,089 $

          pro Stunde

          Shuffle-Speicher

          Standard

          Ab

          0,04 $

          pro GB/Monat

          Premium

          Ab

          0,1 $

          pro GB/Monat

          Preise für Beschleuniger

          a100 40 GB

          Ab

          3,52069 $

          pro Stunde

          a100 80 GB

          Ab

          4,713696 $

          pro Stunde

          L4

          Ab

          0,672048 $

          pro Stunde

          Transparente, wertorientierte Preise

          Die Preise für Serverless for Apache Spark basieren auf der sekundengenauen Nutzung von Rechenleistung (DCUs), GPUs und Shuffle-Speicher.

          Data Compute Unit (DCU)

          Abotyp

          Standard

          Preis ($)

          Starting at

          0,06 $

          pro Stunde

          Premium

          Abotyp

          Starting at

          0,089 $

          pro Stunde

          Shuffle-Speicher

          Abotyp

          Standard

          Preis ($)

          Starting at

          0,04 $

          pro GB/Monat

          Premium

          Abotyp

          Starting at

          0,1 $

          pro GB/Monat

          Preise für Beschleuniger

          Abotyp

          a100 40 GB

          Preis ($)

          Starting at

          3,52069 $

          pro Stunde

          a100 80 GB

          Abotyp

          Starting at

          4,713696 $

          pro Stunde

          L4

          Abotyp

          Starting at

          0,672048 $

          pro Stunde

          Preisrechner

          Berechnen Sie Ihre monatlichen Kosten nach Region.

          Individuelles Angebot

          Wenden Sie sich an unser Vertriebsteam, wenn Sie ein individuelles Angebot für Ihr Unternehmen erhalten möchten.

          Sofort loslegen

          Tutorial für den Einstieg

          Sie haben ein großes Projekt?

          Produktdokumentation

          BigQuery-Connector mit Serverless for Apache Spark verwenden

          GPUs mit Serverless for Apache Spark verwenden

          Anwendungsszenario

           Business Case für Google Cloud Serverless for Apache Spark erstellen


          Die wirtschaftlichen Vorteile von Google Cloud Dataproc und Serverless Spark im Vergleich zu alternativen Lösungen

          Hier erfahren Sie, wie Sie mit Serverless for Apache Spark im Vergleich zu lokalen und anderen Cloud-Lösungen die Gesamtbetriebskosten deutlich senken und den Geschäftswert steigern können.

          Im Bericht gilt Folgendes:

          Dataproc und Serverless for Apache Spark können im Vergleich zu anderen cloudbasierten Spark-Alternativen Kosteneinsparungen von 18% bis 60% erzielen.

          Google Cloud Serverless for Apache Spark bietet ein 21% bis 55% besseres Preis-Leistungs-Verhältnis als andere serverlose Spark-Angebote.

          Hier erfahren Sie, wie Dataproc und Google Cloud Serverless for Apache Spark die Spark-Bereitstellung vereinfachen und die betriebliche Komplexität reduzieren.

          FAQs

          Wann sollte ich Serverless for Apache Spark und wann Dataproc verwenden?

          Wählen Sie Serverless for Apache Spark, wenn Sie sich auf Ihren Code konzentrieren und die gesamte Infrastrukturverwaltung eliminieren möchten. Es eignet sich ideal für neue Spark-Pipelines, interaktive Analysen und Jobs mit unvorhersehbarer Nachfrage, bei denen Geschwindigkeit und Einfachheit im Vordergrund stehen.

          Entscheidungshilfe ansehen

          Der Premium-Tarif ist für KI/ML konzipiert und umfasst vorkonfigurierte ML-Laufzeiten mit gängigen Bibliotheken wie PyTorch, XGBoost und scikit-learn. So entfällt eine komplexe Einrichtung und Sie können in wenigen Minuten mit Ihren Data-Science-Workloads beginnen.

          Informationen zu GPU-Arbeitslasten und Laufzeiten

          Für maximale Leistung können Sie den Premium-Tarif auswählen, der auf der Lightning Engine basiert. Die Preise basieren auf einem nutzungsbasierten Modell, bei dem Sie pro Sekunde nur für die Dauer der Ausführung Ihres Jobs zahlen. Das ist sehr kosteneffizient, da die Kosten für inaktive Cluster entfallen.

          Detaillierte Preisübersicht ansehen

          Google Cloud