Acessar endpoints gRPC do Dataproc Metastore

Esta página explica como conceder a uma conta de usuário ou conta de serviço do Google Cloud acesso a um serviço do metastore do Dataproc que usa o protocolo de endpoint gRPC.

Sobre a concessão de papéis de metadados do gRPC

Ao conceder acesso aos metadados de uma conta, considere os seguintes conceitos:

  • O nível de acesso a ser fornecido. O nível de acesso concedido controla quantos metadados uma conta pode acessar. Por exemplo, você pode escolher conceder acesso a metadados armazenados em um banco de dados ou uma tabela específicos, ou pode conceder acesso a todo o projeto.
  • O principal que requer acesso. Você usa os principais (identidades) do IAM para executar seus jobs. Por exemplo, é possível executar trabalhos de cluster do Dataproc com contas de usuário ou de serviço (normalmente a conta de serviço da VM do Dataproc).

    Para mais informações sobre as contas que podem ser usadas com o metastore do Dataproc, consulte Contas de serviço do Dataproc.

Dependendo do escopo de controle necessário, conceda ao principal um dos seguintes papéis predefinidos do IAM:

  • Para conceder acesso total aos recursos de metadados. Papel de proprietário de metadados (roles/metastore.metadataOwner)
  • Para conceder acesso de leitura/gravação aos metadados: função de editor de metadados roles/metastore.metadataEditor
  • Para conceder acesso de leitura aos metadados: função de leitor de metadados (roles/metastore.metadataViewer)

Antes de começar

  • Ative o Dataproc Metastore no seu projeto.
  • Crie um serviço de metastore que use o protocolo gRPC.
  • Entenda os requisitos de rede específicos do seu projeto.

    • Requisitos do gRPC e da nuvem privada virtual (VPC). Se você estiver usando o gRPC, não será necessário configurar uma VPC compartilhada ou definir configurações de rede extras. Por padrão, os endpoints gRPC podem ser acessados de qualquer VPC.

    No entanto, há uma exceção. Se o projeto estiver usando um perímetro de serviço do VPC-SC, os endpoints do gRPC só poderão ser acessados de uma VPC pertencente a projetos no perímetro. Para mais informações, consulte VPC Service Controls com metastore do Dataproc.

Papéis necessários

Para receber as permissões necessárias para conceder um acesso principal aos metadados da Metastore do Dataproc, peça ao administrador para conceder a você os seguintes papéis do IAM no projeto, seguindo o princípio de privilégio mínimo:

Para mais informações sobre a concessão de papéis, consulte Gerenciar o acesso a projetos, pastas e organizações.

Esses papéis predefinidos contêm as permissões necessárias para conceder a um principal acesso aos metadados do Dataproc Metastore. Para conferir as permissões exatas necessárias, expanda a seção Permissões necessárias:

Permissões necessárias

As seguintes permissões são necessárias para conceder um acesso principal aos metadados do Metastore do Dataproc:

  • resourcemanager.projects.get
  • resourcemanager.projects.getIamPolicy
  • resourcemanager.projects.setIamPolicy

Essas permissões também podem ser concedidas com funções personalizadas ou outros papéis predefinidos.

Para mais informações sobre papéis e permissões específicos do Dataproc Metastore, consulte Visão geral do IAM do Dataproc Metastore.

Conceder acesso a metadados a uma conta principal

É possível conceder a uma conta principal acesso a metadados no nível do projeto, do serviço, do banco de dados ou da tabela.

Conceder acesso no nível do projeto

Para conceder acesso a todos os metadados do metastore do Dataproc no nível do projeto, você precisa conceder um papel de metadados à sua conta principal.

CLI da gcloud

Para conceder papéis de metadados a todos os serviços do metastore do Dataproc em um projeto especificado, execute o seguinte comando gcloud projects add-iam-policy-binding:

gcloud projects add-iam-policy-binding PROJECT_ID \
    --member=PRINCIPAL \
    --role=METASTORE_ROLE

Substitua:

  • PROJECT_ID: o ID do projeto do Google Cloud a que você quer conceder acesso aos metadados.
  • PRINCIPAL: o tipo e o ID de e-mail (endereço de e-mail) do principal.
    • Para contas de usuário: user:EMAIL_ID
    • Para contas de serviço: serviceAccount:EMAIL_ID
    • Para os Grupos do Google: group:EMAIL_ID
    • Para outros tipos de principais: Conceitos relacionados à identidade
  • METASTORE_ROLE: um dos papéis a seguir, dependendo do escopo de acesso que você quer conceder ao principal: roles/metastore.metadataViewer, roles/metastore.metadataEditor ou roles/metastore.metadataOwner.

Conceder acesso no nível do serviço

Para conceder acesso a todos os metadados do Dataproc Metastore no nível do serviço, você precisa conceder um papel de metadados à sua conta principal.

CLI da gcloud

Para conceder papéis de metadados com a granularidade de um único serviço do metastore do Dataproc, execute o seguinte comando gcloud metastore services add-iam-policy-binding:

gcloud metastore services add-iam-policy-binding SERVICE_ID \
  --location=LOCATION \
  --member=PRINCIPAL \
  --role=METASTORE_ROLE

Substitua:

  • SERVICE_ID: o ID ou identificador totalmente qualificado do serviço do metastore do Dataproc.
  • LOCATION: a região do metastore do Dataproc a que você está concedendo acesso.
  • PRINCIPAL: o tipo e o ID de e-mail (endereço de e-mail) da conta principal:
    • Para contas de usuário: user:EMAIL_ID
    • Para contas de serviço: serviceAccount:EMAIL_ID
    • Para os Grupos do Google: group:EMAIL_ID
    • Para outros tipos de principais: Conceitos relacionados à identidade
  • METASTORE_ROLE: um dos papéis a seguir, dependendo do escopo de acesso que você quer conceder ao principal: roles/metastore.metadataViewer, roles/metastore.metadataEditor ou roles/metastore.metadataOwner.

Conceder acesso no nível do banco de dados

Para conceder acesso a todos os metadados do Dataproc Metastore em um banco de dados específico, adicione uma função de metadados à sua conta principal.

CLI da gcloud

Para conceder papéis de metadados com a granularidade de um banco de dados específico, execute o seguinte comando gcloud metastore services databases add-iam-policy-binding:

gcloud metastore services databases add-iam-policy-binding DATABASE_ID \
  --project=PROJECT \
  --location=LOCATION \
  --service=SERVICE_ID \
  --member=PRINCIPAL \
  --role=METASTORE_ROLE

Substitua:

  • DATABASE_ID: o ID do banco de dados a que você está concedendo acesso aos metadados. Você recebe esse ID do esquema do banco de dados.
  • PROJECT: o ID do projeto do Google Cloud que contém o serviço do metastore do Dataproc a que você está concedendo acesso aos metadados.
  • LOCATION: a região do serviço do metastore do Dataproc a que você está concedendo acesso.
  • SERVICE_ID: o ID ou identificador totalmente qualificado do serviço do metastore do Dataproc.
  • PRINCIPAL: o tipo e o ID de e-mail (endereço de e-mail) da conta principal:
    • Para contas de usuário: user:EMAIL_ID
    • Para contas de serviço: serviceAccount:EMAIL_ID
    • Para os Grupos do Google: group:EMAIL_ID
    • Para outros tipos de principais: Conceitos relacionados à identidade
  • METASTORE_ROLE: um dos papéis a seguir, dependendo do escopo de acesso que você quer conceder ao principal: roles/metastore.metadataViewer, roles/metastore.metadataEditor ou roles/metastore.metadataOwner.

Conceder acesso no nível da tabela

Para conceder acesso a todos os metadados do metastore do Dataproc em uma tabela específica, você precisa conceder um papel de metadados à sua conta principal.

CLI da gcloud

Para conceder papéis de metadados na granularidade de uma tabela, execute o seguinte comando gcloud metastore services databases tables add-iam-policy-binding:

gcloud metastore services databases tables add-iam-policy-binding TABLE_ID \
  --database=DATABASE_ID \
  --project=PROJECT \
  --location=LOCATION \
  --service=SERVICE_ID \
  --member=PRINCIPAL \
  --role=METASTORE_ROLE

Substitua:

  • TABLE_ID: o ID da tabela a que você está concedendo acesso. Você recebe esse ID do esquema do banco de dados.
  • DATABASE_ID: o ID do banco de dados que contém a tabela para a qual você está concedendo acesso aos metadados. Você recebe esse ID do esquema do banco de dados.
  • PROJECT: o ID do projeto do Google Cloud que contém o serviço do Dataproc Metastore a que você está concedendo acesso aos metadados.
  • LOCATION: a região do serviço do Metastore do Dataproc para a qual você está concedendo acesso aos metadados.
  • SERVICE_ID: o ID ou identificador totalmente qualificado do serviço do metastore do Dataproc.
  • PRINCIPAL: o tipo e o ID de e-mail (endereço de e-mail) da conta principal:
    • Para contas de usuário: user:EMAIL_ID
    • Para contas de serviço: serviceAccount:EMAIL_ID
    • Para os Grupos do Google: group:EMAIL_ID
  • METASTORE_ROLE: um dos papéis a seguir, dependendo do escopo de acesso que você quer conceder ao principal: roles/metastore.metadataViewer, roles/metastore.metadataEditor ou roles/metastore.metadataOwner.

Depois de conceder acesso aos seus metadados

Depois de conceder as funções necessárias às suas contas de serviço, você pode conectar o Metastore do Dataproc a um cluster do Dataproc. O cluster usa o serviço do metastore do Dataproc como o metastore Hive.

A seguir