Esta página descreve como fazer upgrade da versão das suas instâncias ou pipelines em lote.
Faça upgrade das instâncias e dos pipelines em lote do Cloud Data Fusion para as versões mais recentes da plataforma e do plug-in e tenha acesso aos recursos, correções de bugs e melhorias de desempenho mais recentes.
Antes de começar
- Planeje um período de inatividade programado para o upgrade. O processo leva até uma hora.
-
In the Google Cloud console, activate Cloud Shell.
Limitações
Depois de criar uma instância do Cloud Data Fusion, não é possível mudar a edição, nem mesmo com uma operação de upgrade.
Não acione um upgrade com o Terraform, porque ele exclui e recria a instância, em vez de fazer um upgrade no local. Esse problema resulta na perda de todos os dados existentes na instância.
Não é possível fazer upgrade de pipelines em tempo real, exceto em pipelines criados na versão 6.8.0 com uma origem em tempo real do Kafka. Para uma solução alternativa, consulte Fazer upgrade de pipelines em tempo real.
O Cloud Data Fusion não reinicia pipelines que param como resultado da operação de upgrade.
Fazer upgrade das instâncias do Cloud Data Fusion
Para fazer upgrade de uma instância do Cloud Data Fusion para uma nova versão do Cloud Data Fusion, acesse a página Detalhes da instância:
No console do Google Cloud, acesse a página do Cloud Data Fusion.
Clique em Instâncias e, depois, no nome da instância para acessar a página Detalhes da instância.
Em seguida, realize o upgrade usando o console do Google Cloud ou a CLI gcloud:
Console
Clique em Fazer upgrade para ver uma lista das versões disponíveis.
Selecionar uma versão
Clique em Fazer upgrade.
Verifique se o upgrade foi concluído:
Atualize a página Detalhes da instância.
Clique em Visualizar instância para acessar a instância atualizada na interface da Web do Cloud Data Fusion.
Clique em Administrador do sistema na barra de menu.
O novo número da versão é exibido na parte superior da página.
Para evitar que os pipelines fiquem travados quando forem executados na nova versão, conceda os papéis necessários na instância que recebeu o upgrade.
gcloud
Para fazer upgrade para uma nova versão do Cloud Data Fusion, execute o seguinte comando da CLI do gcloud em uma sessão de terminal local do Cloud Shell:
gcloud beta data-fusion instances update INSTANCE_ID \ --project=PROJECT_ID \ --location=LOCATION_NAME \ --version=AVAILABLE_INSTANCE_VERSION
Opcional: se aplicável à sua instância, adicione as flags
--enable_stackdriver_logging
,--enable_stackdriver_monitoring
e--labels
.Opcional: é possível transmitir as propriedades do CDAP, como
enable.unrecoverable.reset
, como--options
.
Siga estas etapas para verificar se o upgrade foi concluído:
No console do Google Cloud, acesse a página Instâncias do Cloud Data Fusion.
Clique em Visualizar instância para acessar a instância atualizada na interface da Web do Cloud Data Fusion.
Clique em Administrador do sistema na barra de menu.
O novo número da versão é exibido na parte superior da página.
Para evitar que os pipelines fiquem travados quando forem executados na nova versão, conceda os papéis necessários na instância que recebeu o upgrade.
Atualizar pipelines em lote
Para fazer upgrade dos pipelines em lote do Cloud Data Fusion para usar as versões mais recentes do plug-in:
Recomendado:faça backup de todos os pipelines. É possível fazer backup de pipelines de duas maneiras:
Faça o download do arquivo ZIP seguindo estas etapas:
- Para acionar um download de arquivo ZIP, faça backup de todos os pipelines com o seguinte comando:
echo $CDAP_ENDPOINT/v3/export/apps
- Copie a saída do URL para o navegador.
- Extraia o arquivo transferido por download e confirme se todos os pipelines foram exportados. Os pipelines são organizados por namespace.
Faça backup de pipelines usando o gerenciamento de controle de origem (SCM, na sigla em inglês), disponível na versão 6.9 e mais recentes. O SCM oferece integração com o GitHub, que pode ser usado para fazer backup de pipelines.
Faça upgrade de pipelines seguindo estas etapas:
Crie uma variável que aponte para o arquivo
pipeline_upgrade.json
que você vai criar na próxima etapa para salvar uma lista de pipelines.export PIPELINE_LIST=PATH/pipeline_upgrade.json
Substitua PATH pelo caminho para o arquivo.
Crie uma lista de todos os pipelines de uma instância e um namespace usando o comando abaixo. O resultado é armazenado no arquivo
$PIPELINE_LIST
no formatoJSON
. É possível editar a lista para remover os pipelines que não precisam de upgrades.curl -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" ${CDAP_ENDPOINT}/v3/namespaces/NAMESPACE_ID/apps -o $PIPELINE_LIST
Substitua NAMESPACE_ID pelo namespace em que você quer que o upgrade aconteça.
Faça upgrade dos pipelines listados em
pipeline_upgrade.json
. Insira o NAMESPACE_ID de pipelines para upgrade. O comando exibe uma lista de pipelines atualizados com o status de upgrade.curl -N -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" ${CDAP_ENDPOINT}/v3/namespaces/NAMESPACE_ID/upgrade --data @$PIPELINE_LIST
Substitua NAMESPACE_ID pelo ID do namespace dos pipelines que estão sendo atualizados.
Para evitar que os pipelines fiquem travados quando forem executados na nova versão, conceda os papéis necessários na instância atualizada.
Fazer upgrade de pipelines em tempo real
Não é possível fazer upgrade de pipelines em tempo real, exceto em pipelines criados na versão 6.8.0 com uma origem do Kafka em tempo real.
Para todo o resto, faça o seguinte:
- Interrompa e exporte os pipelines.
- Faça upgrade da instância.
- Importe os pipelines em tempo real para a instância atualizada.
Fazer upgrade para ativar a replicação
A replicação pode ser ativada nos ambientes do Cloud Data Fusion na versão 6.3.0 ou mais recente. Se você tiver a versão 6.2.3, faça upgrade para a 6.3.0 e, em seguida, para a versão mais recente. Em seguida, ative a replicação.
Concede papéis a instâncias atualizadas
Após a conclusão do upgrade, conceda o
papel de executor do Cloud Data Fusion
(roles/datafusion.runner
) e o
papel de administrador do Cloud Storage
(roles/storage.admin
) à conta de serviço do Dataproc no seu
projeto.
A seguir
- Gerencie as revisões de patch para instâncias do Cloud Data Fusion.
- Saiba mais sobre controle de versão no Cloud Data Fusion.
- Consulte os upgrades de versão e revisão de patch disponíveis.
- Resolver problemas de upgrade.