Como funciona o Kerberos com o Dataproc Metastore

Esta página descreve como o Dataproc Metastore suporta o protocolo Kerberos.

O Kerberos é um protocolo de autenticação de rede concebido para fornecer uma autenticação forte para aplicações cliente e servidor através da utilização de criptografia de chave secreta. É frequentemente usado na pilha do Hadoop para autenticação em todo o ecossistema de software.

Pode configurar o Kerberos nos seguintes serviços do Dataproc Metastore:

O processo de configuração do Kerberos é diferente para cada tipo de serviço.

Recursos Kerberos necessários

A secção seguinte fornece informações gerais sobre os recursos do Kerberos que tem de configurar para um serviço do Dataproc Metastore.

KDC do Kerberos

É necessário um KDC do Kerberos. Pode usar o KDC local de um cluster do Dataproc ou criar e alojar o seu próprio.

Principal do Kerberos

Quando configura o Kerberos para um serviço do Dataproc Metastore, gera o ficheiro principal através de um cluster do Dataproc.

Ficheiro keytab

Um ficheiro keytab contém pares de principais do Kerberos e chaves encriptadas, que são usados para autenticar um principal do serviço com um KDC do Kerberos.

Quando configura o Kerberos para um serviço do Dataproc Metastore, gera o ficheiro keytab através de um cluster do Dataproc.

  • O ficheiro keytab gerado contém o nome e a localização do principal do serviço de metastore do Hive.

  • O ficheiro keytab gerado é armazenado automaticamente num Google Cloud Secret Manager.

    O Secret do Secret Manager fornecido tem de estar associado a uma versão específica do Secret. Tem de especificar a versão do segredo que quer usar. O Dataproc Metastore não escolhe a versão mais recente automaticamente.

Ficheiro krb5.conf

Um ficheiro krb5.conf válido contém informações de configuração do Kerberos, como o IP, a porta e o nome do domínio do KDC.

Quando configura o Kerberos para um serviço do Dataproc Metastore, gera o ficheiro keytab através de um cluster do Dataproc.

  • Ao configurar o ficheiro krb5.conf, especifique o IP do KDC acessível a partir da sua rede com peering. Não especifique o FQDN do KDC.
  • Se estiver a usar o ponto final Thrift, tem de armazenar o ficheiro num contentor do Cloud Storage. Pode usar um contentor existente ou criar um novo.

O que se segue?