Documentación de Dataproc
Dataproc es un servicio Apache Spark y Apache Hadoop administrado con el que puedes aprovechar las herramientas de código abierto para procesar, consultar y transmitir datos en lote, además de herramientas de aprendizaje automático. Con la automatización de Dataproc, podrá crear clústeres rápidamente, administrarlos con facilidad y ahorrar dinero desactivándolos cuando no los necesite. Al invertir menos tiempo y dinero en tareas de administración, podrá enfocarse en sus trabajos y datos. Más información
Recursos de documentación
Guías
-
Guías de inicio rápido: Consola, Línea de comandos Bibliotecas cliente Explorador de APIs: crea un clúster o Explorador de APIs: envía un trabajo de Spark
-
Descripción general de las plantillas de flujo de trabajo de Dataproc
-
Guía de inicio rápido de Dataproc en GKE
-
Configurar Dataproc Hub
-
CreA una imagen personalizada de Dataproc
-
Escribe un trabajo de MapReduce con el conector de BigQuery
-
Usar el conector de Cloud Storage con Apache Spark
-