Migrar um metastore MySQL autogerenciado para o metastore do Dataproc
Nesta página, você aprenderá como migrar seu metastore MySQL autogerenciado externo para o metastore do Dataproc. Para isso, crie um arquivo dump MySQL e importe os metadados para um serviço existente do metastore do Dataproc.
Antes de começar
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Dataproc Metastore API.
Papéis necessários
Para receber as permissões necessárias para criar uma metastore do Dataproc e importar uma metastore do MYSQL, peça ao administrador para conceder a você os seguintes papéis do IAM:
-
Para criar um serviço e importar metadados:
-
Editor do metastore do Dataproc (
roles/metastore.editor
) no projeto -
Administrador do metastore do Dataproc (
roles/metastore.admin
) no projeto.
-
Editor do metastore do Dataproc (
-
Para usar o objeto do Cloud Storage (arquivo dump SQL) para importação:
-
Leitor de objetos do Storage (
roles/storage.objectViewer
) no agente de serviço do metastore do Dataproc. Por exemplo,service-CUSTOMER_PROJECT_NUMBER@gcp-sa-metastore.iam.gserviceaccount.com
. -
Leitor de objetos do Storage (
roles/storage.objectViewer
) na conta de usuário.
-
Leitor de objetos do Storage (
Para mais informações sobre a concessão de papéis, consulte Gerenciar o acesso a projetos, pastas e organizações.
Esses papéis predefinidos contêm as permissões necessárias para criar uma metastore do Dataproc e importar uma metastore do MYSQL. Para conferir as permissões exatas necessárias, expanda a seção Permissões necessárias:
Permissões necessárias
As seguintes permissões são necessárias para criar um metastore do Dataproc e importar um metastore do MYSQL:
-
Para criar um serviço:
metastore.services.create
no projeto. -
Para importar metadados:
metastore.imports.create
no projeto. -
Para usar o objeto do Cloud Storage (arquivo dump SQL) para importação:
-
storage.objects.get
no agente de serviço do Metastore do Dataproc. Por exemplo,service-CUSTOMER_PROJECT_NUMBER@gcp-sa-metastore.iam.gserviceaccount.com
-
storage.objects.get
na conta do usuário.
-
Essas permissões também podem ser concedidas com funções personalizadas ou outros papéis predefinidos.
Para mais informações sobre papéis e permissões específicos do Dataproc Metastore, consulte Gerenciar o acesso ao Dataproc com o IAM.Criar um serviço Metastore do Dataproc
As instruções a seguir demonstram como criar um serviço do metastore do Dataproc para migrar seu arquivo dump SQL.
Console
No Console do Google Cloud, abra a página Criar serviço:
No campo Nome da conta de serviço, insira
example-service
.Selecione o Local dos dados. Para informações sobre como selecionar uma região, consulte Locais do Cloud.
Para outras opções de configuração do ambiente, use os padrões fornecidos.
Para criar e iniciar o serviço, clique no botão Enviar.
Seu novo serviço aparecerá na lista Service.
gcloud
Execute o comando gcloud metastore services create
a seguir para criar uma identidade de serviço:
gcloud metastore services create example-service \ --location=LOCATION
Substitua LOCATION
pela região do Compute Engine
em que você planeja criar o serviço. Verifique se o Metastore do Dataproc está disponível na região.
REST
Siga as instruções da API para criar um serviço usando a API Explorer.
Preparar para a migração
Prepare os metadados armazenados no banco de dados do metastore do Hive para importação. Para isso, crie um arquivo dump MySQL e coloque-o em um bucket do Cloud Storage.
Consulte Preparar os arquivos de importação antes da importação para conferir as etapas de preparação para a migração.
Importar os metadados
Agora que você preparou o arquivo dump, importe-o para o serviço Metastore do Dataproc.
Consulte Importar os arquivos para o Metastore do Dataproc
para conferir as etapas de importação de metadados para o serviço example-service
.
Criar e anexar um cluster do Dataproc
Depois de importar os metadados para o serviço example-service
do metastore do Dataproc, crie e anexe um cluster do Dataproc que use o serviço como o metastore Hive.
Limpar
Para evitar cobranças na conta do Google Cloud pelos recursos usados nesta página, siga estas etapas.
- In the Google Cloud console, go to the Manage resources page.
- If the project that you plan to delete is attached to an organization, expand the Organization list in the Name column.
- In the project list, select the project that you want to delete, and then click Delete.
- In the dialog, type the project ID, and then click Shut down to delete the project.
Como alternativa, é possível excluir os recursos usados neste tutorial:
Exclua o serviço Metastore do Dataproc.
Console
No console do Google Cloud, abra a página Metastore do Dataproc:
À esquerda do nome do serviço, selecione
example-service
para marcar a caixa.Na parte superior da página Metastore do Dataproc, clique em Excluir para excluir o serviço.
Na caixa de diálogo, clique em Excluir para confirmar a remoção.
Seu serviço não aparece mais na lista de serviços.
gcloud
Execute o seguinte comando
gcloud metastore services delete
para excluir um serviço:gcloud metastore services delete example-service \ --location=LOCATION
Substitua
LOCATION
pela região do Compute Engine em que você criou o serviço.REST
Siga as instruções da API para excluir um serviço usando a API Explorer.
Todas as exclusões foram feitas imediatamente.
Exclua o bucket do Cloud Storage para o serviço Metastore do Dataproc.