Criar um cluster e um serviço do metastore do Dataproc
Nesta página, mostramos como criar um serviço do metastore do Dataproc e um cluster do Dataproc que usa o serviço como o metastore Hive.
Antes de começar
- Faça login na sua conta do Google Cloud. Se você começou a usar o Google Cloud agora, crie uma conta para avaliar o desempenho de nossos produtos em situações reais. Clientes novos também recebem US$ 300 em créditos para executar, testar e implantar cargas de trabalho.
-
No console do Google Cloud, na página do seletor de projetos, selecione ou crie um projeto do Google Cloud.
-
Verifique se o faturamento está ativado para seu projeto na nuvem. Saiba como verificar se o faturamento está ativado em um projeto.
-
No console do Google Cloud, na página do seletor de projetos, selecione ou crie um projeto do Google Cloud.
-
Verifique se o faturamento está ativado para seu projeto na nuvem. Saiba como verificar se o faturamento está ativado em um projeto.
-
Ative a API Dataproc Metastore.
Controle de acesso
Para criar um serviço, é preciso solicitar um papel do IAM que contenha a permissão do IAM
metastore.services.create
. Os papéis específicosroles/metastore.admin
eroles/metastore.editor
do metastore do Dataproc incluem permissão de criação.É possível conceder permissão de criação a usuários ou grupos usando os papéis legados
roles/owner
eroles/editor
.
Para receber e definir políticas do IAM, use o seguinte:
- Console do Google Cloud: consulte Controle de acesso por meio do Console do Google Cloud.
- APIs REST: consulte Controle de acesso por meio da API.
- Linha de comando
gcloud
: consulte Controle de acesso por meio da CLI do Google Cloud.
Para mais informações, consulte IAM e Dataproc de controle de acesso.
Criar um serviço do metastore do Dataproc
Veja nas instruções a seguir como criar um serviço do metastore do Dataproc usando o Console do Google Cloud, a CLI gcloud ou a API Metastore do Dataproc.
Console
No Console do Cloud, abra a página Criar serviço:
Abra a página "Criar serviço" no Console do Cloud
No campo Nome da conta de serviço, insira
example-service
.Selecione o Local dos dados. Para informações sobre como selecionar uma região, consulte Locais do Cloud.
Para outras opções de configuração do ambiente, use os padrões fornecidos.
Para criar e iniciar o serviço, clique no botão Enviar.
Seu novo serviço aparecerá na lista Service.
gcloud
Execute o comandogcloud metastore services create
a seguir para criar uma identidade de serviço.
gcloud metastore services create example-service \ --location=LOCATION
Substitua LOCATION
pela região do Compute Engine em que o serviço será criado. Verifique se o Metastore do Dataproc está disponível no local.
REST
Siga as instruções da API para criar um serviço usando a API Explorer.
Criar um cluster do Dataproc que usa o serviço
Depois de criar um serviço, é possível criar e anexar um cluster do Dataproc que usa o serviço como o metastore do Hive.
A imagem do Dataproc e a versão do Hivestore do metastore precisam ser compatíveis. Verifique as seguintes páginas de controle de versão de imagem para garantir que a versão do Hive seja compatível:
- Versões de lançamento do Dataproc 2.0.x
- Versões de lançamento 1.5.x do Dataproc
- Versões de lançamento 1.4.x do Dataproc
Para mais informações, consulte a Lista de versões de imagem do Dataproc.
Console
No Console do Cloud, abra a página Criar um cluster do Dataproc.
No campo Nome do cluster, insira
example-cluster
.Nos menus Região e Zona, selecione uma região e uma zona para o cluster. É possível selecionar uma região distinta, para isolar recursos e locais de armazenamento de metadados na região especificada. Se você selecionar uma região distinta, poderá selecionar "Sem preferência" para a zona a fim de permitir que o Dataproc escolha uma zona dentro da região selecionada para o cluster (consulte Colocação em zona automática do Dataproc).
Use os padrões fornecidos para todas as demais opções.
Clique na guia Personalizar cluster.
Na seção Configuração de rede, selecione a mesma rede especificada durante a criação do serviço metastore.
Na seção Metastore do Dataproc, selecione
example-service
.Clique em Criar para criar o cluster.
O novo cluster aparecerá na lista de clusters. O status é listado como "Provisioning" até que o cluster esteja pronto para uso. Seu status muda para "Em execução".
gcloud
Execute o seguinte comando gcloud dataproc clusters create
para criar um cluster.
gcloud dataproc clusters create example-cluster \ --dataproc-metastore=projects/PROJECT_ID/locations/LOCATION/services/example-service \ --region=LOCATION
Substitua PROJECT_ID
pelo ID do projeto em que você criou o serviço Metastore do Dataproc.
Substitua LOCATION
pela região especificada para o serviço Metastore do Dataproc.
REST
Siga as instruções da API para criar um cluster usando a API Explorer.
Limpar
Para evitar cobranças na sua conta do Google Cloud pelos recursos usados nesta página, siga estas etapas:
- No console do Cloud, acesse a página Gerenciar recursos:
- Se o projeto que você planeja excluir estiver anexado a uma organização, expanda a lista Organização na coluna Nome.
- Na lista de projetos, selecione o projeto que você quer excluir e clique em Excluir .
- Na caixa de diálogo, digite o ID do projeto e clique em Encerrar para excluí-lo.
Como alternativa, é possível excluir os recursos usados neste tutorial:
Exclua o serviço Metastore do Dataproc.
Console
No Console do Cloud, abra a página do metastore do Dataproc:
À esquerda do nome do serviço, selecione
example-service
para marcar a caixa.Na parte superior da página Metastore do Dataproc, clique em Excluir para excluir o serviço.
Na caixa de diálogo, clique em Excluir para confirmar a remoção.
Seu serviço não aparece mais na lista de serviços.
gcloud
Execute o seguinte comando
gcloud metastore services delete
para excluir um serviço:gcloud metastore services delete example-service \ --location=LOCATION
Substitua
LOCATION
pela região do Compute Engine em que o serviço foi criado.REST
Siga as instruções da API para excluir um serviço usando a API Explorer.
Todas as exclusões foram feitas imediatamente.
Exclua o bucket do Cloud Storage para o serviço Metastore do Dataproc.
Exclua o cluster do Dataproc que usou o serviço Metastore do Dataproc.