Documentación de Dataproc
Dataproc es un servicio Apache Spark y Apache Hadoop administrado con el que puedes aprovechar las herramientas de código abierto para procesar, consultar y transmitir datos en lote, además de herramientas de aprendizaje automático. Con la automatización de Dataproc, podrá crear clústeres rápidamente, administrarlos con facilidad y ahorrar dinero desactivándolos cuando no los necesite. Al invertir menos tiempo y dinero en tareas de administración, podrá enfocarse en sus trabajos y datos. Más información
Comienza tu próximo proyecto con un crédito gratis de $300
Crea y prueba una prueba de concepto con los créditos de la prueba gratuita y el uso mensual gratuito de más de 20 productos.
Sigue explorando con más de 20 productos siempre gratuitos
Accede a más de 20 productos gratuitos para casos de uso comunes, incluidas APIs de IA, VMs, almacenes de datos y mucho más.
Recursos de documentación
Guías
-
Guías de inicio rápido: consola, línea de comandos, bibliotecas cliente, Explorador de API: crea un clúster o Explorador de API: envía un trabajo de Spark
-
Descripción general de las plantillas de flujo de trabajo de Dataproc
-
Guía de inicio rápido de Dataproc en GKE
-
Configurar Dataproc Hub
-
CreA una imagen personalizada de Dataproc
-
Escribe un trabajo de MapReduce con el conector de BigQuery
-
Usar el conector de Cloud Storage con Apache Spark
-