Dataproc es un servicio Apache Spark y Apache Hadoop administrado con el que puedes aprovechar las herramientas de código abierto para procesar, consultar y transmitir datos en lote, además de herramientas de aprendizaje automático. Con la automatización de Dataproc, podrá crear clústeres rápidamente, administrarlos con facilidad y ahorrar dinero desactivándolos cuando no los necesite. Al invertir menos tiempo y dinero en tareas de administración, podrá enfocarse en sus trabajos y datos. Más información
Guías
-
Guías de inicio rápido: Console, línea de comandos, bibliotecas cliente Explorador de API: crea un clúster o Explorador de API: envía un trabajo de Spark
-
Descripción general de las plantillas de flujo de trabajo de Dataproc
-
Guía de inicio rápido de Dataproc en GKE
-
Configurar Dataproc Hub
-
CreA una imagen personalizada de Dataproc
-
Escribe un trabajo de MapReduce con el conector de BigQuery
-
Usa el conector de Cloud Storage con Apache Spark
-
Instructivos y capacitación
Prueba los instructivos, los cursos y la capacitación de autoaprendizaje de Dataproc de Google Cloud Skills Boost.
Casos de uso
Explora casos de uso, arquitecturas de referencia, informes, prácticas recomendadas y soluciones del sector.
Muestras de código
Sumérgete en la programación con ejemplos que demuestran cómo usar y conectar los servicios de Google Cloud.
Videos
Java es una marca comercial de Oracle o sus afiliados.