Il nuovo modo di usare Spark in modo più semplice, intelligente e veloce.
Esegui i carichi di lavoro Apache Spark su Google Cloud con meno overhead operativo, più assistenza basata sull'AI e un miglior rapporto prezzo-prestazioni. Concentrati sul codice, non sul cluster.
Vantaggi
Più semplice: elimina il carico operativo di Spark
Scegli tra Google Cloud Serverless per Apache Spark a zero operazioni o cluster Dataproc gestiti. Entrambi automatizzano la complessità dell'infrastruttura in modo da poter accelerare il ciclo di vita dello sviluppo.
Più intelligente: sviluppo Spark assistito dall'AI
Accelera l'intero flusso di lavoro con Gemini in Dataproc e Google Cloud Serverless per Apache Spark. Ricevi assistenza basata su Gemini per generare ed eseguire il debug del codice e risolvere i problemi relativi ai job non riusciti.
Più veloce: accelera le prestazioni di Spark
Ottieni automaticamente un rapporto prezzo/prestazioni leader del settore. Per i tuoi job più impegnativi, sblocca prestazioni oltre 4,3 volte più veloci con Lightning Engine. Ciò riduce il TCO e accelera il time-to-insight.
Funzionalità principali
Scegli tra Serverless per Apache Spark per la semplicità a zero operazioni o Dataproc per cluster gestiti con personalizzazioni approfondite.
Concentrati solo sul tuo codice e accelera lo sviluppo. Con livelli sia per l'elaborazione batch conveniente che per l'AI/ML ad alte prestazioni, è ideale per nuove pipeline Apache Spark, analisi interattive e workload con domanda imprevedibile in cui è preferibile un modello "NoOps".
Ideale per: data scientist e ML engineer, query ad hoc, nuove applicazioni, produttività degli sviluppatori.
Ottieni il massimo controllo sul tuo ambiente cluster. Perfetto per la migrazione dei carichi di lavoro Apache Hadoop/Spark esistenti, l'esecuzione di cluster persistenti a lunga durata o l'utilizzo di un ecosistema open source diversificato.
Ideale per: operazioni e progettazione aziendale, migrazioni on-premise, job di lunga durata, personalizzazione approfondita.
Documentazione
Smetti di scegliere tra la potenza di SQL e la flessibilità di Spark. BigLake consente di utilizzare entrambi i motori sugli stessi dati regolamentati. È un'esperienza unificata che ti consente di utilizzare lo strumento migliore per ogni attività.
Passa dalla preparazione dei dati all'addestramento e all'inferenza del modello, più velocemente. I nostri livelli Premium sono progettati per l'AI/ML e ti consentono di utilizzare runtime ML preconfigurati con supporto GPU integrato, come NVIDIA RAPIDS, per eliminare configurazioni complesse.
Novità
Apache Spark è un marchio di Apache Software Foundation.
**Le query derivano dallo standard TPC-DS e dallo standard TPC-H e, in quanto tali, non sono comparabili ai risultati pubblicati dello standard TPC-DS e dello standard TPC-H, poiché queste esecuzioni non sono conformi a tutti i requisiti delle specifiche dello standard TPC-DS e dello standard TPC-H.
Parlaci delle sfide che stai affrontando. Un esperto Google Cloud ti aiuterà a trovare la soluzione migliore.