Este tutorial incluye un recorrido por Cloud Shell que usa las bibliotecas de cliente de Google Cloud para Python para llamar de forma programática a las APIs gRPC de Dataproc para crear un clúster y enviar un trabajo a ese clúster.
En las siguientes secciones se explica el funcionamiento del código de la guía que se encuentra en el repositorio GoogleCloudPlatform/python-dataproc de GitHub.
Ejecutar el tutorial de Cloud Shell
Haz clic en Abrir en Cloud Shell para ejecutar la guía.
Interpretar el código
credenciales de aplicación predeterminadas
La guía de Cloud Shell de este tutorial proporciona autenticación mediante las credenciales de tu proyecto Google Cloud . Cuando ejecutas código de forma local, lo más recomendable es usar credenciales de cuenta de servicio para autenticar tu código.
Crear una agrupación Dataproc
Se han definido los siguientes valores para crear el clúster:
- El proyecto en el que se creará el clúster
- Región en la que se creará el clúster
- Nombre del clúster
- La configuración del clúster, que especifica un maestro y dos trabajadores principales
Se usan los ajustes de configuración predeterminados para el resto de los ajustes del clúster. Puedes anular la configuración predeterminada del clúster. Por ejemplo, puedes añadir VMs secundarias (el valor predeterminado es 0) o especificar una red de VPC que no sea la predeterminada para el clúster. Para obtener más información, consulta CreateCluster.
Enviar una tarea
Se definen los siguientes valores para enviar el trabajo:
- El proyecto en el que se creará el clúster
- Región en la que se creará el clúster
- La configuración de la tarea, que especifica el nombre del clúster y la ruta de archivo (URI) de Cloud Storage de la tarea de PySpark
Consulta SubmitJob para obtener más información.
Elimina el clúster
Se han definido los siguientes valores para eliminar el clúster:
- El proyecto en el que se creará el clúster
- Región en la que se creará el clúster
- Nombre del clúster
Para obtener más información, consulta la documentación de DeleteCluster.