Supporto nativo di BigQuery per Apache Spark e SQL. Scopri di più.

Spark su Google Cloud

Il primo Spark serverless a scalabilità automatica del settore, integrato con i migliori strumenti Google nativi e open source. Sviluppa ed esegui Spark dove ti serve, per tutti casi d'uso, inclusi ETL, data science ed esplorazione.

Vantaggi

Aumenta la produttività degli sviluppatori e ottieni insight sui dati più rapidi

Semplicità operativa grazie a Spark serverless

Scrivi applicazioni e pipeline Spark che scalano automaticamente senza alcun provisioning o ottimizzazione manuale dell'infrastruttura.

Spark senza interruzioni per tutti gli utenti di dati

Spark è integrato con BigQuery, Vertex AI e Dataplex, quindi può scriverla ed eseguirla da queste interfacce in due clic, senza integrazioni personalizzate, per ETL, esplorazione dei dati, analisi e machine learning.

Flessibilità del consumo

Non tutte le soluzioni vanno bene per tutti. Puoi scegliere tra cluster serverless, cluster Kubernetes e cluster di calcolo per le tue applicazioni Spark.

Funzionalità principali

Esegui job Spark con scalabilità automatica dall'interfaccia di tua scelta, in due clic

Procedure esterne di BigQuery per Apache Spark

Esperienza SQL e Spark unificata: crea ed esegui il codice Apache Spark scritto in Python direttamente da BigQuery. Puoi quindi eseguire e pianificare queste stored procedure in BigQuery utilizzando una query SQL standard di Google, in modo simile all'esecuzione di stored procedure SQL.

Spark serverless

Gli sviluppatori possono dedicare tutto il tempo alla programmazione e alla logica e utilizzare l'interfaccia scelta per inviare job Spark con provisioning automatico e scalabilità automatica. Leggi la documentazione per Spark serverless

Spark tramite Vertex AI

Spark per data science con un solo clic: i data scientist possono utilizzare senza problemi Spark per lo sviluppo da Vertex AI Workbench con sicurezza integrata. Spark è integrato con le funzionalità MLOps di Vertex AI, dove gli utenti possono eseguire il codice Spark tramite esecutori di blocchi note integrati con Vertex AI Pipelines.

Spark tramite Dataplex

Esegui Spark a scalabilità automatica sui dati in Google Cloud da un'unica interfaccia con accesso con un solo clic a SparkSQL, Notebooks o PySpark. Offre inoltre la possibilità di collaborare facilmente per eseguire il salvataggio, la condivisione, la ricerca di blocchi note e script insieme ai dati e una governance integrata nei data lake. 

Opzioni di consumo flessibili

Oltre al deployment serverless Spark per il deployment autonomo, i clienti che standardizzano su Kubernetes per la gestione dell'infrastruttura possono eseguire Spark su Google Kubernetes Engine (anteprima privata) per migliorare l'utilizzo delle risorse e semplificare la gestione dell'infrastruttura. I clienti alla ricerca di una gestione dell'infrastruttura in stile Hadoop possono eseguire Spark su Compute Engine.

Iniziamo? Contattaci


Spark è un marchio di Apache Software Foundation.

Fai il prossimo passo

Parlaci delle sfide che stai affrontando. Un esperto Google Cloud ti aiuterà a trovare la soluzione migliore.

Google Cloud