Annuncio nel maggio 2025: Dataproc Serverless è ora Google Cloud Serverless per Apache Spark

Logo di Serverless per Apache Spark

Google Cloud Serverless per Apache Spark

Concentrati sul codice, non sull'infrastruttura

Esegui i tuoi job Apache Spark in modo più semplice su una piattaforma con zero operazioni personalizzabile, in modo più intelligente con l'assistenza di Gemini e in modo più rapido con le prestazioni di Lightning Engine.

Apache Spark è un marchio di Apache Software Foundation.


Funzionalità

Prestazioni leader del settore

Potenzia i tuoi job con Lightning Engine, il nostro motore vettorizzato di nuova generazione. Ottieni prestazioni oltre 4,3 volte più veloci e un TCO inferiore per i tuoi workload Spark serverless, in modo automatico.

Zero operazioni con scalabilità automatica intelligente

Elimina la gestione dei cluster con la scalabilità automatica intelligente. Viene fatto lo scale up automatico delle risorse in base alle esigenze del tuo job, garantendo le massime prestazioni e l'efficienza in termini di costi senza pagare per il tempo di inattività.

Sviluppo basato sull'AI

Accelera l'intero workflow. Scrivi ed esegui il debug di codice PySpark, Scala e Java con Gemini Code Assist in BigQuery Studio e avvia ambienti con accelerazione GPU con runtime ML preconfigurati.

Esperienza Spark e SQL unificata

Elimina il cambio di contesto. Sviluppa ed esegui i tuoi workload in un unico ambiente come BigQuery Studio, combinando perfettamente la potenza di SQL con la flessibilità di PySpark nello stesso notebook.


Due livelli di prestazioni

Due livelli di prestazioniLivelli per soddisfare le tue esigenze specifiche, dall'elaborazione batch standard ai job più impegnativi e critici per le prestazioni.
LivelloIdeale per

Standard

Ideale per l'elaborazione batch conveniente, le trasformazioni dei dati e i job Spark per uso generico.

  • ETL Spark per uso generico
  • Data pipelines pianificate
  • Job batch sensibili ai costi

Premium

Per i workload più impegnativi, offre le massime prestazioni con Lightning Engine, accelerazione AI/ML e funzionalità interattive.

  • Job critici per le prestazioni basati su Lightning Engine per un aumento di 4,3 volte
  • Data science e analisi interattive
  • AI e ML accelerati da GPU
  • Elaborazione di dati complessi su larga scala

Due livelli di prestazioni

Livelli per soddisfare le tue esigenze specifiche, dall'elaborazione batch standard ai job più impegnativi e critici per le prestazioni.

Standard

Ideale per

Ideale per l'elaborazione batch conveniente, le trasformazioni dei dati e i job Spark per uso generico.

  • ETL Spark per uso generico
  • Data pipelines pianificate
  • Job batch sensibili ai costi

Premium

Ideale per

Per i workload più impegnativi, offre le massime prestazioni con Lightning Engine, accelerazione AI/ML e funzionalità interattive.

  • Job critici per le prestazioni basati su Lightning Engine per un aumento di 4,3 volte
  • Data science e analisi interattive
  • AI e ML accelerati da GPU
  • Elaborazione di dati complessi su larga scala

Come funziona

Sviluppa la tua applicazione Apache Spark con i tuoi strumenti preferiti, inclusi i blocchi note di BigQuery Studio. Invia il tuo job Spark serverless con un singolo comando e lascia che Google si occupi del resto: non devi creare, configurare o gestire cluster.


Utilizzi comuni

Data science interattiva

Consenti ai data scientist di esplorare i dati e di eseguire rapidamente l'iterazione sui modelli Spark ML. Unifica SQL e Spark in un singolo blocco note di BigQuery Studio, passando senza problemi dall'esplorazione dei dati con SQL alla creazione di modelli con PySpark senza mai dover gestire l'infrastruttura.

Notebook di BigQuery Studio

Data science interattiva

Consenti ai data scientist di esplorare i dati e di eseguire rapidamente l'iterazione sui modelli Spark ML. Unifica SQL e Spark in un singolo blocco note di BigQuery Studio, passando senza problemi dall'esplorazione dei dati con SQL alla creazione di modelli con PySpark senza mai dover gestire l'infrastruttura.

Notebook di BigQuery Studio

Pipeline ETL automatizzate

 Crea pipeline ETL Spark robuste e basate su eventi che si scalano automaticamente su richiesta. Paga solo per ciò che utilizzi, il che lo rende perfetto per carichi di lavoro irregolari o imprevedibili.

Dai dati alla produzione Spark, più velocemente.

    Pipeline ETL automatizzate

     Crea pipeline ETL Spark robuste e basate su eventi che si scalano automaticamente su richiesta. Paga solo per ciò che utilizzi, il che lo rende perfetto per carichi di lavoro irregolari o imprevedibili.

    Dai dati alla produzione Spark, più velocemente.

      AI/ML su larga scala

      Accelera l'addestramento di modelli su larga scala e l'inferenza batch con Spark serverless. Collega le GPU NVIDIA con librerie preconfigurate con un singolo comando.

      Diapositiva

        AI/ML su larga scala

        Accelera l'addestramento di modelli su larga scala e l'inferenza batch con Spark serverless. Collega le GPU NVIDIA con librerie preconfigurate con un singolo comando.

        Diapositiva

          Prezzi

          Prezzi trasparenti e basati sul valoreI prezzi di Serverless per Apache Spark si basano sull'utilizzo al secondo di calcolo (DCU), GPU e archiviazione shuffle.
          Servizi e utilizzoTipo di abbonamento Prezzo ($)

          Data Compute Unit (DCU)

          Standard

          A partire da

          0,06 $

          all'ora

          Premium

          A partire da

          0,089 $

          all'ora

          Spazio di archiviazione per shuffling

          Standard

          A partire da

          0,04 $

          per GB/mese

          Premium

          A partire da

          0,1 $

          per GB/mese

          Prezzi degli acceleratori

          a100 40 GB

          A partire da

          $3,52069

          all'ora

          a100 80 GB

          A partire da

          $4,713696

          all'ora

          L4

          A partire da

          $0,672048

          all'ora

          Visualizza i dettagli dei prezzi di Google Cloud Serverless per Apache Spark.

          Prezzi trasparenti e basati sul valore

          I prezzi di Serverless per Apache Spark si basano sull'utilizzo al secondo di calcolo (DCU), GPU e archiviazione shuffle.

          Data Compute Unit (DCU)

          Tipo di abbonamento

          Standard

          Prezzo ($)

          Starting at

          0,06 $

          all'ora

          Premium

          Tipo di abbonamento

          Starting at

          0,089 $

          all'ora

          Spazio di archiviazione per shuffling

          Tipo di abbonamento

          Standard

          Prezzo ($)

          Starting at

          0,04 $

          per GB/mese

          Premium

          Tipo di abbonamento

          Starting at

          0,1 $

          per GB/mese

          Prezzi degli acceleratori

          Tipo di abbonamento

          a100 40 GB

          Prezzo ($)

          Starting at

          $3,52069

          all'ora

          a100 80 GB

          Tipo di abbonamento

          Starting at

          $4,713696

          all'ora

          L4

          Tipo di abbonamento

          Starting at

          $0,672048

          all'ora

          Visualizza i dettagli dei prezzi di Google Cloud Serverless per Apache Spark.

          Calcolatore prezzi

          Calcola i costi mensili per regione.

          Preventivo personalizzato

          Contatta il nostro team di vendita per ricevere un preventivo personalizzato per la tua organizzazione.

          Inizia subito

          Tutorial per iniziare

          Hai un progetto di grandi dimensioni?

          Documentazione del prodotto

          Utilizza il connettore BigQuery con Serverless per Apache Spark

          Utilizza le GPU con Serverless per Apache Spark

          Business case

           Crea il tuo business case per Google Cloud Serverless per Apache Spark


          I vantaggi economici di Google Cloud Dataproc e Serverless Spark rispetto a soluzioni alternative

          Scopri come Serverless per Apache Spark offre risparmi significativi in termini di TCO e valore aziendale rispetto alle soluzioni on-prem e ad altre soluzioni cloud.

          Nel report:

          Scopri come Dataproc e Serverless per Apache Spark possono offrire un risparmio sui costi dal 18% al 60% rispetto ad altre alternative Spark basate su cloud.

          Scopri come Google Cloud Serverless per Apache Spark può offrire un rapporto prezzo-prestazioni migliore del 21-55% rispetto ad altre offerte Spark serverless.

          Scopri come Dataproc e Google Cloud Serverless per Apache Spark semplificano i deployment Spark e contribuiscono a ridurre la complessità operativa.

          Domande frequenti

          Quando devo scegliere Serverless per Apache Spark anziché Dataproc?

          Scegli Serverless per Apache Spark quando vuoi concentrarti sul codice ed eliminare tutta la gestione dell'infrastruttura. È ideale per nuove pipeline Spark, analisi interattive e job con domanda imprevedibile in cui la velocità e la semplicità sono la priorità.

          Consulta la nostra guida alle decisioni.

          Il livello Premium è progettato per l'AI/ML e viene fornito con runtime ML preconfigurati che hanno librerie comuni come PyTorch, XGBoost e scikit-learn integrate. In questo modo si elimina la necessità di una configurazione complessa e si può iniziare a lavorare con i carichi di lavoro di data science in pochi minuti.

          Scopri di più sui carichi di lavoro e sui runtime delle GPU.

          Per ottenere le massime prestazioni, puoi selezionare il livello Premium, basato su Lightning Engine. I prezzi si basano su un modello "paga per quello che usi", in cui ti viene addebitato un costo al secondo solo per la durata dell'esecuzione del tuo job. Questa soluzione è molto conveniente in quanto elimina il costo dei cluster inattivi.

          Visualizza i prezzi dettagliati.

          Google Cloud