Compatibilidad nativa de BigQuery con Apache Spark junto con SQL. Obtener más información.

Spark en Google Cloud

El primer Spark sin servidores de ajuste de escala automático de la industria, integrado con lo mejor de las herramientas de código abierto y nativas de Google. Desarrolla y ejecuta Spark donde lo necesites en todos los casos de uso, incluidos ETL, ciencia de datos y exploración.

Beneficios

Aumenta la productividad de los desarrolladores y obtén estadísticas de datos con mayor rapidez

Simplicidad operativa a través de Spark sin servidores

Escribe aplicaciones y canalizaciones de Spark que se escalan de forma automática sin aprovisionamiento ni ajuste manual de infraestructura.

Spark sin interrupciones para todos los usuarios de datos

Spark está integrado en BigQuery, Vertex AI y Dataplex para que puedas escribir y ejecutar desde estas interfaces con dos clics, sin integraciones personalizadas, para ETL, exploración de datos, análisis y AA. 

Flexibilidad del consumo

Un tamaño no se ajusta a todos. Puedes elegir entre clústeres de Kubernetes, sin servidores y de procesamiento para tus aplicaciones de Spark.

Características clave

Ejecuta trabajos de Spark que realizan ajuste de escala automático desde la interfaz que elijas con tan solo dos clics

Procedimientos externos de BigQuery para Apache Spark

Experiencia unificada de SQL y Spark: crea y ejecuta código de Apache Spark que se escribe en Python directamente desde BigQuery. Luego, puedes ejecutar y programar estos procedimientos almacenados en BigQuery mediante una consulta en SQL estándar de Google, similar a la ejecución de los procedimientos almacenados de SQL.

Spark sin servidores

Los desarrolladores pueden dedicar todo su tiempo al código y la lógica, y usar una interfaz de su elección para enviar trabajos de Spark con aprovisionamiento y ajuste de escala automáticos. Consulta la documentación de Spark sin servidores

Spark a través de Vertex AI

Spark para la ciencia de datos con un clic: los científicos de datos pueden usar Spark para el desarrollo desde Vertex AI Workbench sin problemas, con seguridad integrada. Spark está integrado en las funciones de MLOps de Vertex AI, en las que los usuarios pueden ejecutar el código de Spark mediante los ejecutores de notebooks integrados en las canalizaciones de Vertex AI.

Spark mediante Dataplex

Ejecuta Spark con ajuste de escala automático en los datos de Google Cloud desde una única interfaz que tiene acceso con un solo clic a SparkSQL, Notebooks o PySpark. También ofrece una colaboración sencilla con la capacidad de guardar, compartir y buscar notebooks y secuencias de comandos, junto con los datos, y administración integrada en los data lakes. 

Opciones flexibles de consumo

Además de la implementación de Spark sin servidores para no-ops, los clientes que estandarizan en Kubernetes para la administración de la infraestructura pueden ejecutar Spark en Google Kubernetes Engine (DG) a fin de mejorar el uso de recursos y simplificar la administración de la infraestructura. Los clientes que buscan administración de infraestructura de estilo Hadoop pueden ejecutar Spark en Compute Engine (DG).

¿Estás listo para comenzar? Comunicarse con nosotros


Spark es una marca de The Apache Software Foundation.

Da el siguiente paso

Dinos en qué estás trabajando. Un experto de Google Cloud te ayudará a encontrar la mejor solución.

Google Cloud
  • ‪English‬
  • ‪Deutsch‬
  • ‪Español‬
  • ‪Español (Latinoamérica)‬
  • ‪Français‬
  • ‪Indonesia‬
  • ‪Italiano‬
  • ‪Português (Brasil)‬
  • ‪简体中文‬
  • ‪繁體中文‬
  • ‪日本語‬
  • ‪한국어‬
Consola
Google Cloud