Compatibilidad nativa de BigQuery con Apache Spark junto con SQL. Más información

Spark en Google Cloud

Spark, primero del sector con autoescalado y sin servidor, que se integra con las mejores las herramientas nativas de Google y de código abierto. Desarrolla y ejecuta Spark donde lo necesites en todos los casos prácticos, incluidos los procesos de extracción, transformación y carga (ETL), la ciencia de datos y la exploración.

Ventajas

Aumenta la productividad de los desarrolladores y obtén datos valiosos más rápido

Sencillez operativa gracias a Spark sin servidor

Crea aplicaciones y flujos de procesamiento de Spark que se escalan automáticamente sin tener que aprovisionar ni ajustar manualmente las infraestructuras.

Spark, perfecto para todos los usuarios de datos

Spark está integrado con BigQuery, Vertex AI y Dataplex. Puedes escribir y ejecutar desde estas interfaces con dos clics, sin integraciones personalizadas, para el proceso de extracción, transformación y carga (ETL), exploración de datos, análisis y aprendizaje automático.

Flexibilidad de consumo

No existe un enfoque único que satisfaga las necesidades de todas las empresas. Puedes elegir entre clústeres sin servidor, de Kubernetes y de computación para tus aplicaciones de Spark.

Características principales

Ejecuta tareas de Spark que se autoescalan desde la interfaz que elijas con dos clics

Procedimientos externos de BigQuery para Apache Spark

Experiencia unificada de SQL y Spark: crea y ejecuta código de Apache Spark escrito en Python directamente desde BigQuery. Después, puedes ejecutar y programar estos procedimientos almacenados en BigQuery con una consulta de SQL estándar de Google, de forma similar a cuando se ejecutan los procedimientos almacenados en SQL.

Spark sin servidor

Los desarrolladores pueden dedicar todo su tiempo a tareas de código y lógica y, a través de la interfaz que elijan, enviar las tareas de Spark que se aprovisionan y escalan automáticamente. Lee la documentación de Spark sin servidor

Spark mediante Vertex AI

Spark para la ciencia de datos con un clic: los científicos de datos pueden usar Spark para el desarrollo con Vertex AI Workbench, sin problemas y con seguridad integrada. Spark se integra con las funciones de operaciones de aprendizaje automático de Vertex AI, donde los usuarios pueden ejecutar código de Spark a través de ejecutores de cuaderno integrados con Vertex AI Pipelines.

Spark mediante Dataplex

Ejecuta el autoescalado de Spark en los datos de Google Cloud desde una única interfaz que permite acceder con un solo clic a SparkSQL, Notebooks o PySpark. Además, permite colaborar fácilmente, guardar, compartir, buscar cuadernos y secuencias de comandos junto con datos, y gestionar los servicios de los lagos de datos de forma integrada. 

Opciones de consumo flexibles

Además de usar Spark sin servidor para despliegues sin operaciones, los clientes que estandarizan la gestión de la infraestructura en Kubernetes pueden ejecutar Spark en Google Kubernetes Engine (vista previa privada) para mejorar la utilización de recursos y simplificar la gestión de la infraestructura. Los clientes que busquen una gestión de infraestructuras de tipo Hadoop pueden ejecutar Spark en Compute Engine.

¿Empezamos? Contactar


Spark es una marca de The Apache Software Foundation.

Ve un paso más allá

Cuéntanos lo que buscas. Un experto de Google Cloud te ayudará a encontrar la mejor solución.

Google Cloud
  • ‪English‬
  • ‪Deutsch‬
  • ‪Español‬
  • ‪Español (Latinoamérica)‬
  • ‪Français‬
  • ‪Indonesia‬
  • ‪Italiano‬
  • ‪Português (Brasil)‬
  • ‪简体中文‬
  • ‪繁體中文‬
  • ‪日本語‬
  • ‪한국어‬
Consola
Google Cloud