Crie um cluster do Dataproc através de bibliotecas de cliente
O código de exemplo indicado abaixo mostra como usar as bibliotecas cliente da Google Cloud para criar um cluster do Dataproc, executar uma tarefa no cluster e, em seguida, eliminar o cluster.
Também pode realizar estas tarefas através do seguinte:
- Pedidos da API REST em Inícios rápidos com o Explorador de APIs
- a Google Cloud consola em Crie um cluster do Dataproc através da Google Cloud consola
- a CLI do Google Cloud em Crie um cluster do Dataproc através da CLI do Google Cloud
Antes de começar
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator
(
roles/resourcemanager.projectCreator
), which contains theresourcemanager.projects.create
permission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the Dataproc API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin
), which contains theserviceusage.services.enable
permission. Learn how to grant roles. -
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator
(
roles/resourcemanager.projectCreator
), which contains theresourcemanager.projects.create
permission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the Dataproc API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin
), which contains theserviceusage.services.enable
permission. Learn how to grant roles. - Instale a biblioteca cliente Para mais informações, consulte o artigo Configurar o ambiente de desenvolvimento.
- Configure a autenticação
- Clone e execute o exemplo de código do GitHub.
- Veja o resultado. O código envia o registo do controlador da tarefa para o contentor de preparação
do Dataproc
predefinido
no Cloud Storage. Pode ver o resultado do controlador de tarefas a partir da Google Cloud consola
na secçãoTarefas
do Dataproc do seu projeto. Clique no ID da tarefa para ver o resultado da tarefa na página de detalhes da tarefa.
- Instale a biblioteca cliente Para mais informações, consulte o artigo Configurar um ambiente de desenvolvimento Java.
- Configure a autenticação
- Clone e execute o exemplo de código do GitHub.
- Veja o resultado. O código envia o registo do controlador da tarefa para o contentor de preparação
do Dataproc
predefinido
no Cloud Storage. Pode ver o resultado do controlador de tarefas a partir da Google Cloud consola
na secçãoTarefas
do Dataproc do seu projeto. Clique no ID da tarefa para ver o resultado da tarefa na página de detalhes da tarefa.
- Instale a biblioteca cliente Para mais informações, consulte o artigo Configurar um ambiente de desenvolvimento do Node.js.
- Configure a autenticação
- Clone e execute o exemplo de código do GitHub.
- Veja o resultado. O código envia o registo do controlador da tarefa para o contentor de preparação
do Dataproc
predefinido
no Cloud Storage. Pode ver o resultado do controlador de tarefas a partir da Google Cloud consola
na secçãoTarefas
do Dataproc do seu projeto. Clique no ID da tarefa para ver o resultado da tarefa na página de detalhes da tarefa.
- Instale a biblioteca cliente Para mais informações, consulte o artigo Configurar um ambiente de desenvolvimento Python.
- Configure a autenticação
- Clone e execute o exemplo de código do GitHub.
- Veja o resultado. O código envia o registo do controlador da tarefa para o contentor de preparação
do Dataproc
predefinido
no Cloud Storage. Pode ver o resultado do controlador de tarefas a partir da Google Cloud consola
na secçãoTarefas
do Dataproc do seu projeto. Clique no ID da tarefa para ver o resultado da tarefa na página de detalhes da tarefa.
- Consulte a biblioteca de cliente do Google Cloud Dataproc Recursos adicionais.
Execute o código
Experimente o passo a passo: clique em Abrir no Cloud Shell para executar um passo a passo das bibliotecas cliente do Google Cloud em Python que cria um cluster, executa uma tarefa do PySpark e, em seguida, elimina o cluster.