Acessar endpoints do gRPC para o metastore do Dataproc

Esta página explica como conceder a uma conta de usuário do Google Cloud ou uma conta de serviço acesso a um serviço do metastore do Dataproc que usa o protocolo de endpoint gRPC.

Sobre a concessão de papéis de metadados gRPC

Ao conceder acesso aos metadados de uma conta, considere os seguintes conceitos:

  • O nível de acesso a ser fornecido. O nível de acesso concedido aos controles quantos metadados uma conta pode acessar. Por exemplo, é possível dão acesso a metadados armazenados em um banco de dados ou tabela específico, ou conceder acesso ao projeto inteiro.
  • O principal que requer acesso. Você usa os principais do IAM (identidades) para executar os jobs. Por exemplo, é possível executar trabalhos de cluster do Dataproc com contas de usuário ou de serviço (normalmente a conta de serviço da VM do Dataproc).

    Para mais informações sobre as contas que você pode usar com Metastore do Dataproc, consulte Serviço do Dataproc contas de serviço.

Dependendo do escopo de controle necessário, conceda ao principal um dos seguintes papéis predefinidos do IAM:

  • Conceder acesso total aos recursos de metadados. Papel de proprietário de metadados (roles/metastore.metadataOwner)
  • Para conceder acesso de leitura/gravação aos metadados: função de editor de metadados roles/metastore.metadataEditor
  • Para conceder acesso de leitura aos metadados: papel Leitor de metadados (roles/metastore.metadataViewer)

Antes de começar

  • Ativar Metastore do Dataproc em seu projeto.
  • Crie um serviço de metastore que usa o protocolo gRPC.
  • Entenda o uso de redes requisitos específicos para sua projeto.

    • Requisitos de gRPC e da nuvem privada virtual (VPC). Se você usa gRPC, você não precisa configurar uma VPC compartilhada ou definir personalizadas. Por padrão, os endpoints gRPC podem ser acessados de qualquer VPC.

    No entanto, há uma exceção. Se o projeto estiver usando um serviço VPC-SC os endpoints do gRPC só poderão ser acessados de uma VPC que pertença a projetos no perímetro. Para mais informações, consulte VPC Service Controls com metastore do Dataproc.

Papéis necessários

Para ter as permissões necessárias para conceder a um principal acesso aos metadados do Dataproc Metastore, peça ao administrador para conceder a você papéis do IAM a seguir no projeto, seguindo o princípio de privilégio mínimo:

Para mais informações sobre a concessão de papéis, consulte Gerenciar o acesso a projetos, pastas e organizações.

Esses papéis predefinidos contêm as permissões necessárias para conceder a um principal o acesso aos metadados do Dataproc Metastore. Para conferir as permissões exatas necessárias, expanda a seção Permissões necessárias:

Permissões necessárias

As permissões a seguir são necessárias para conceder acesso principal aos metadados do Metastore do Dataproc:

  • resourcemanager.projects.get
  • resourcemanager.projects.getIamPolicy
  • resourcemanager.projects.setIamPolicy

Essas permissões também podem ser concedidas com funções personalizadas ou outros papéis predefinidos.

Para mais informações sobre papéis e permissões específicos do Dataproc Metastore, consulte Visão geral do IAM do Dataproc Metastore.

Conceder a uma conta principal acesso aos metadados

É possível conceder a uma conta principal acesso aos metadados no nível do projeto. nível de serviço, nível de banco de dados ou nível de tabela.

Conceder acesso no nível do projeto

Para conceder acesso a todos os metadados do Dataproc Metastore no nível do projeto, você precisa conceder um papel de metadados à sua conta principal.

CLI da gcloud

Para conceder papéis de metadados a todos os serviços do metastore do Dataproc em um projeto especificado, execute o seguinte gcloud projects add-iam-policy-binding comando:

gcloud projects add-iam-policy-binding PROJECT_ID \
    --member=PRINCIPAL \
    --role=METASTORE_ROLE

Substitua:

  • PROJECT_ID: o ID do projeto do Google Cloud a que você quer conceder acesso aos metadados.
  • PRINCIPAL: o tipo e o ID de e-mail (endereço de e-mail) do principal.
    • Para contas de usuário: user:EMAIL_ID
    • Para contas de serviço: serviceAccount:EMAIL_ID
    • Para os Grupos do Google: group:EMAIL_ID
    • Para outros tipos de principais: Conceitos relacionados à identidade
  • METASTORE_ROLE: um dos seguintes papéis, dependendo do escopo de acesso que você quer conceder ao principal: roles/metastore.metadataViewer, roles/metastore.metadataEditor ou roles/metastore.metadataOwner.

Conceder acesso no nível de serviço

Para conceder acesso a todos os metadados do Dataproc Metastore no nível do serviço, você precisa conceder uma função de metadados à sua conta principal.

CLI da gcloud

Para conceder papéis de metadados na granularidade de uma única Serviço metastore do Dataproc Metastore, execute o seguinte gcloud metastore services add-iam-policy-binding comando:

gcloud metastore services add-iam-policy-binding SERVICE_ID \
  --location=LOCATION \
  --member=PRINCIPAL \
  --role=METASTORE_ROLE

Substitua:

  • SERVICE_ID: o ID ou identificador totalmente qualificado do serviço Metastore do Dataproc.
  • LOCATION: a região do metastore do Dataproc a que você está concedendo acesso.
  • PRINCIPAL: o tipo e o ID de e-mail (endereço de e-mail) da conta principal:
    • Para contas de usuário: user:EMAIL_ID
    • Para contas de serviço: serviceAccount:EMAIL_ID
    • Para Grupos do Google: group:EMAIL_ID
    • Para outros tipos principais: Conceitos relacionados à identidade
  • METASTORE_ROLE: um dos papéis a seguir, dependendo do escopo de acesso que você quer conceder ao principal: roles/metastore.metadataViewer, roles/metastore.metadataEditor ou roles/metastore.metadataOwner.

Conceder acesso no nível do banco de dados

Para conceder acesso a todos os metadados do metastore do Dataproc em um você precisa adicionar um papel de metadados à sua conta principal.

CLI da gcloud

Para conceder papéis de metadados na granularidade de um banco de dados específico, execute o seguindo gcloud metastore services databases add-iam-policy-binding comando:

gcloud metastore services databases add-iam-policy-binding DATABASE_ID \
  --project=PROJECT \
  --location=LOCATION \
  --service=SERVICE_ID \
  --member=PRINCIPAL \
  --role=METASTORE_ROLE

Substitua:

  • DATABASE_ID: o ID do banco de dados a que você está concedendo acesso aos metadados. Você consegue esse ID no esquema do seu banco de dados.
  • PROJECT: o ID do projeto do Google Cloud que contém o serviço do metastore do Dataproc a que você está concedendo acesso aos metadados.
  • LOCATION: a região do serviço do metastore do Dataproc a que você está concedendo acesso.
  • SERVICE_ID: o ID ou identificador totalmente qualificado do serviço do metastore do Dataproc.
  • PRINCIPAL: o tipo e o ID de e-mail (endereço de e-mail) da conta principal:
    • Para contas de usuário: user:EMAIL_ID
    • Para contas de serviço: serviceAccount:EMAIL_ID
    • Para os Grupos do Google: group:EMAIL_ID
    • Para outros tipos de principais: Conceitos relacionados à identidade
  • METASTORE_ROLE: um dos papéis a seguir, dependendo do escopo de acesso que você quer conceder ao principal: roles/metastore.metadataViewer, roles/metastore.metadataEditor ou roles/metastore.metadataOwner.

Conceder acesso no nível da tabela

Para conceder acesso a todos os metadados do Dataproc Metastore em uma tabela específica, conceda um papel de metadados à sua conta principal.

CLI da gcloud

Para conceder papéis de metadados na granularidade de uma tabela, execute o seguinte comando gcloud metastore services databases tables add-iam-policy-binding:

gcloud metastore services databases tables add-iam-policy-binding TABLE_ID \
  --database=DATABASE_ID \
  --project=PROJECT \
  --location=LOCATION \
  --service=SERVICE_ID \
  --member=PRINCIPAL \
  --role=METASTORE_ROLE

Substitua:

  • TABLE_ID: o ID da tabela a que você está concedendo acesso. Você consegue esse ID no esquema do seu banco de dados.
  • DATABASE_ID: o ID do banco de dados que contém a tabela a que você está concedendo acesso aos metadados. Você recebe esse ID do esquema do banco de dados.
  • PROJECT: o ID do projeto do Google Cloud que contém o serviço Metastore do Dataproc aos quais você concede acesso aos metadados.
  • LOCATION: a região do serviço Metastore do Dataproc a que você está concedendo acesso aos metadados.
  • SERVICE_ID: o ID ou identificador totalmente qualificado do serviço Metastore do Dataproc.
  • PRINCIPAL: o tipo e o ID de e-mail (endereço de e-mail) da conta principal:
    • Para contas de usuário: user:EMAIL_ID
    • Para contas de serviço: serviceAccount:EMAIL_ID
    • Para Grupos do Google: group:EMAIL_ID
  • METASTORE_ROLE: um dos seguintes papéis, dependendo do escopo de acesso que você quer conceder ao principal: roles/metastore.metadataViewer, roles/metastore.metadataEditor ou roles/metastore.metadataOwner.

Depois de conceder acesso aos seus metadados

Depois de conceder os papéis necessários às contas de serviço, você pode conectar o metastore do Dataproc a um cluster do Dataproc. Seu cluster usa o serviço Metastore do Dataproc como seu metastore Hive.

A seguir