Apache Spark su Google Cloud

Il nuovo modo di usare Spark in modo più semplice, intelligente e veloce.

Esegui i carichi di lavoro Apache Spark su Google Cloud con meno overhead operativo, più assistenza basata sull'AI e un miglior rapporto prezzo-prestazioni. Concentrati sul codice, non sul cluster.


Vantaggi

Un'esperienza migliore per Apache Spark su Google Cloud

Più semplice: elimina il carico operativo di Spark

Scegli tra Google Cloud Serverless per Apache Spark a zero operazioni o cluster Dataproc gestiti. Entrambi automatizzano la complessità dell'infrastruttura in modo da poter accelerare il ciclo di vita dello sviluppo.

Confronta entrambe le opzioni

Più intelligente: sviluppo Spark assistito dall'AI

Accelera l'intero flusso di lavoro con Gemini in Dataproc e Google Cloud Serverless per Apache Spark. Ricevi assistenza basata su Gemini per generare ed eseguire il debug del codice e risolvere i problemi relativi ai job non riusciti. 

Scopri di più su Assistente codice Gemini

Più veloce: accelera le prestazioni di Spark

Ottieni automaticamente un rapporto prezzo/prestazioni leader del settore. Per i tuoi job più impegnativi, sblocca prestazioni oltre 4,3 volte più veloci con Lightning Engine. Ciò riduce il TCO e accelera il time-to-insight.

Esplora Lightning Engine

Funzionalità principali

Scegli lo Spark giusto per il tuo carico di lavoro

Scegli tra Serverless per Apache Spark per la semplicità a zero operazioni o Dataproc per cluster gestiti con personalizzazioni approfondite.

Consulta la guida alle decisioni

Google Cloud Serverless per Apache Spark

Concentrati solo sul tuo codice e accelera lo sviluppo. Con livelli sia per l'elaborazione batch conveniente che per l'AI/ML ad alte prestazioni, è ideale per nuove pipeline Apache Spark, analisi interattive e workload con domanda imprevedibile in cui è preferibile un modello "NoOps".

Ideale per: data scientist e ML engineer, query ad hoc, nuove applicazioni, produttività degli sviluppatori.

Esplora Spark serverless

Dataproc

Ottieni il massimo controllo sul tuo ambiente cluster. Perfetto per la migrazione dei carichi di lavoro Apache Hadoop/Spark esistenti, l'esecuzione di cluster persistenti a lunga durata o l'utilizzo di un ecosistema open source diversificato.

Ideale per: operazioni e progettazione aziendale, migrazioni on-premise, job di lunga durata, personalizzazione approfondita.

Esplora Dataproc

Documentazione

Documentazione

Tutorial

Esegui il tuo primo job Spark serverless

Segui questa guida rapida per sperimentare la velocità e la semplicità di Spark serverless. Scopri come inviare un job batch PySpark utilizzando Google Cloud CLI.

Tutorial

Crea un cluster Dataproc gestito

Questo tutorial ti guida nella creazione di un cluster Dataproc utilizzando la console Google Cloud. Scopri come configurare e fornire un ambiente gestito per i tuoi workload Spark e Hadoop.

Best Practice

Unifica le tue analisi: SQL e Spark su una singola copia dei dati

Smetti di scegliere tra la potenza di SQL e la flessibilità di Spark. BigLake consente di utilizzare entrambi i motori sugli stessi dati regolamentati. È un'esperienza unificata che ti consente di utilizzare lo strumento migliore per ogni attività.

Best Practice

Accelera l'intero ciclo di vita dell'AI e dell'ML

Passa dalla preparazione dei dati all'addestramento e all'inferenza del modello, più velocemente. I nostri livelli Premium sono progettati per l'AI/ML e ti consentono di utilizzare runtime ML preconfigurati con supporto GPU integrato, come NVIDIA RAPIDS, per eliminare configurazioni complesse.

Non trovi ciò che stai cercando?


Apache Spark è un marchio di Apache Software Foundation.

**Le query derivano dallo standard TPC-DS e dallo standard TPC-H e, in quanto tali, non sono comparabili ai risultati pubblicati dello standard TPC-DS e dello standard TPC-H, poiché queste esecuzioni non sono conformi a tutti i requisiti delle specifiche dello standard TPC-DS e dello standard TPC-H.

Fai il prossimo passo

Parlaci delle sfide che stai affrontando. Un esperto Google Cloud ti aiuterà a trovare la soluzione migliore.

Google Cloud