Supporto nativo di BigQuery per Apache Spark e SQL. Scopri di più.
Il primo Spark serverless a scalabilità automatica del settore, integrato con i migliori strumenti Google nativi e open source. Sviluppa ed esegui Spark dove ti serve, per tutti casi d'uso, inclusi ETL, data science ed esplorazione.
Vantaggi
Semplicità operativa grazie a Spark serverless
Scrivi applicazioni e pipeline Spark che scalano automaticamente senza alcun provisioning o ottimizzazione manuale dell'infrastruttura.
Flessibilità del consumo
Non tutte le soluzioni vanno bene per tutti. Puoi scegliere tra cluster serverless, cluster Kubernetes e cluster di calcolo per le tue applicazioni Spark.
Funzionalità principali
Esperienza SQL e Spark unificata: crea ed esegui il codice Apache Spark scritto in Python direttamente da BigQuery. Puoi quindi eseguire e pianificare queste stored procedure in BigQuery utilizzando una query SQL standard di Google, in modo simile all'esecuzione di stored procedure SQL.
Gli sviluppatori possono dedicare tutto il tempo alla programmazione e alla logica e utilizzare l'interfaccia scelta per inviare job Spark con provisioning automatico e scalabilità automatica. Leggi la documentazione per Spark serverless.
Spark per data science con un solo clic: i data scientist possono utilizzare senza problemi Spark per lo sviluppo da Vertex AI Workbench con sicurezza integrata. Spark è integrato con le funzionalità MLOps di Vertex AI, dove gli utenti possono eseguire il codice Spark tramite esecutori di blocchi note integrati con Vertex AI Pipelines.
Esegui Spark a scalabilità automatica sui dati in Google Cloud da un'unica interfaccia con accesso con un solo clic a SparkSQL, Notebooks o PySpark. Offre inoltre la possibilità di collaborare facilmente per eseguire il salvataggio, la condivisione, la ricerca di blocchi note e script insieme ai dati e una governance integrata nei data lake.
Oltre al deployment serverless Spark per il deployment autonomo, i clienti che standardizzano su Kubernetes per la gestione dell'infrastruttura possono eseguire Spark su Google Kubernetes Engine (anteprima privata) per migliorare l'utilizzo delle risorse e semplificare la gestione dell'infrastruttura. I clienti alla ricerca di una gestione dell'infrastruttura in stile Hadoop possono eseguire Spark su Compute Engine.
Iniziamo? Contattaci
Novità
Mostra interesse qui per richiedere l'accesso in anteprima alle nuove soluzioni per Spark su Google Cloud.
Spark è un marchio di Apache Software Foundation.
Parlaci delle sfide che stai affrontando. Un esperto Google Cloud ti aiuterà a trovare la soluzione migliore.