El siguiente código de muestra indica cómo usar las bibliotecas cliente de Cloud para crear un clúster de Dataproc, ejecutar un trabajo en el clúster y, luego, borrar el clúster.
También puedes realizar estas tareas con las siguientes herramientas:
- Solicitudes de la API de REST en la Guía de inicio rápido sobre el uso del Explorador de API
- Google Cloud Console en la Guía de inicio rápido sobre el uso de Console
- La herramienta de línea de comandos de
gcloud
en la Guía de inicio rápido sobre el uso de la herramienta de línea de comandos de gcloud
Antes de comenzar
- Accede a tu cuenta de Google Cloud. Si eres nuevo en Google Cloud, crea una cuenta para evaluar el rendimiento de nuestros productos en situaciones reales. Los clientes nuevos también obtienen $300 en créditos gratuitos para ejecutar, probar y, además, implementar cargas de trabajo.
-
En la página del selector de proyectos de Google Cloud Console, selecciona o crea un proyecto de Google Cloud.
-
Comprueba que la facturación esté habilitada en tu proyecto.
- Habilita la API Dataproc.
Ejecuta el código
Comienza a usarlo
- Instala la biblioteca cliente Para obtener más información, consulta la documentación sobre cómo configurar tu entorno de desarrollo.
- Configura la autenticación
- Clona y ejecuta el código de muestra de GitHub.
- Revisa el resultado. El código muestra el registro del controlador del trabajo en el bucket de staging predeterminado de Dataproc en Cloud Storage. Puedes ver el resultado del controlador del trabajo desde Cloud Console en la sección Trabajos de Dataproc de tu proyecto. Haz clic en el ID de tarea para ver el resultado del trabajo en la página Detalles del trabajo.
Java
- Instala la biblioteca cliente Para obtener más información, consulta la documentación sobre cómo configurar un entorno de desarrollo Java.
- Configura la autenticación
- Clona y ejecuta el código de muestra de GitHub.
- Revisa el resultado. El código muestra el registro del controlador del trabajo en el bucket de staging predeterminado de Dataproc en Cloud Storage. Puedes ver el resultado del controlador del trabajo desde Cloud Console en la sección Trabajos de Dataproc de tu proyecto. Haz clic en el ID de tarea para ver el resultado del trabajo en la página Detalles del trabajo.
Node.js
- Instala la biblioteca cliente Para obtener más información, consulta la documentación sobre cómo configurar un entorno de desarrollo de Node.js.
- Configura la autenticación
- Clona y ejecuta el código de muestra de GitHub.
- Revisa el resultado. El código muestra el registro del controlador del trabajo en el bucket de staging predeterminado de Dataproc en Cloud Storage. Puedes ver el resultado del controlador del trabajo desde Cloud Console en la sección Trabajos de Dataproc de tu proyecto. Haz clic en el ID de tarea para ver el resultado del trabajo en la página Detalles del trabajo.
Python
- Instala la biblioteca cliente Para obtener más información, consulta la documentación sobre cómo configurar un entorno de desarrollo de Python.
- Configura la autenticación
- Clona y ejecuta el código de muestra de GitHub.
- Revisa el resultado. El código muestra el registro del controlador del trabajo en el bucket de staging predeterminado de Dataproc en Cloud Storage. Puedes ver el resultado del controlador del trabajo desde Cloud Console en la sección Trabajos de Dataproc de tu proyecto. Haz clic en el ID de tarea para ver el resultado del trabajo en la página Detalles del trabajo.
¿Qué sigue?
- Consulta los Recursos adicionales de la biblioteca cliente de Cloud de Dataproc.