Supporto nativo di BigQuery per Apache Spark e SQL. Scopri di più.
Il primo Spark serverless a scalabilità automatica del settore, integrato con i migliori strumenti Google nativi e open source. Sviluppa ed esegui Spark dove ti serve, per tutti casi d'uso, inclusi ETL, data science ed esplorazione.
Vantaggi
Semplicità operativa grazie a Spark serverless
Scrivi applicazioni e pipeline Spark che scalano automaticamente senza alcun provisioning o ottimizzazione manuale dell'infrastruttura.
Flessibilità del consumo
Non tutte le soluzioni vanno bene per tutti. Puoi scegliere tra cluster serverless, cluster Kubernetes e cluster di calcolo per le tue applicazioni Spark.
Funzionalità principali
Spark serverless di Google Cloud accelera la data science automatizzando l'infrastruttura. Concentrati sul codice, non sulla gestione dei cluster. La scalabilità automatica e l'integrazione perfetta con BigQuery e Vertex AI semplificano i workflow, consentendo un'iterazione e uno sviluppo dei modelli più rapidi. Dai un'occhiata alle ultime librerie per Spark serverless per abilitare più casi d'uso che richiedono meno configurazione utente. Dai un'occhiata agli ultimi esempi di codice per data scientist, tra cui la creazione di una pipeline per prevedere l'abbandono dei clienti utilizzando Apache Spark, XGBoost e la libreria Hugging Face Transformers.
Spark per data science con un solo clic: i data scientist possono utilizzare senza problemi Spark per lo sviluppo da Vertex AI Workbench con sicurezza integrata. Spark è integrato con le funzionalità MLOps di Vertex AI, dove gli utenti possono eseguire il codice Spark tramite esecutori di blocchi note integrati con Vertex AI Pipelines.
Esperienza SQL e Spark unificata: crea ed esegui il codice Apache Spark scritto in Python direttamente da BigQuery. Puoi quindi eseguire e pianificare queste stored procedure in BigQuery utilizzando una query SQL standard di Google, in modo simile all'esecuzione di stored procedure SQL.
Gli sviluppatori possono dedicare tutto il tempo alla programmazione e alla logica e utilizzare l'interfaccia scelta per inviare job Spark con provisioning automatico e scalabilità automatica. Leggi la documentazione per Spark serverless.
Esegui Spark a scalabilità automatica sui dati in Google Cloud da un'unica interfaccia con accesso con un solo clic a SparkSQL, Notebooks o PySpark. Offre inoltre la possibilità di collaborare facilmente per eseguire il salvataggio, la condivisione, la ricerca di blocchi note e script insieme ai dati e una governance integrata nei data lake.
Iniziamo? Contattaci
Spark è un marchio di Apache Software Foundation.
Parlaci delle sfide che stai affrontando. Un esperto Google Cloud ti aiuterà a trovare la soluzione migliore.