Esta página mostra como investigar problemas na criação de um cluster de utilizadores do Google Distributed Cloud na Google Cloud consola.
A API GKE On-Prem é uma API alojada na Google Cloud que lhe permite gerir o ciclo de vida dos seus clusters no local através do Terraform e deGoogle Cloud ferramentas padrão. A API GKE On-Prem é executada na infraestrutura da Google. Google CloudO Terraform, a Google Cloud consola e a CLI Google Cloud são clientes da API e usam a API para criar, atualizar, fazer a atualização e eliminar clusters no seu centro de dados. Se criou o cluster através de um cliente padrão, o cluster está inscrito na API GKE On-Prem, o que significa que pode usar os clientes padrão para gerir o ciclo de vida do cluster (com algumas exceções).
Erros de criação de clusters
Esta secção descreve alguns erros que ocorrem durante a criação de clusters na Google Cloud consola.
Erro de recurso já existente
A criação de clusters de utilizadores falha com uma mensagem de erro semelhante à seguinte:
Resource 'projects/1234567890/[...]/user-cluster1'
already exists
Request ID: 129290123128705826
Esta mensagem de erro indica que o nome do cluster já está a ser usado.
Uma solução para corrigir este problema é eliminar e recriar o cluster:
- Elimine o cluster.
- Crie novamente o cluster com outro nome que não entre em conflito com um cluster existente.
Erro de endereços IP em conflito
A criação de clusters de utilizadores falha com uma mensagem de erro semelhante à seguinte:
- Validation Category: Network Configuration
- [FAILURE] CIDR, VIP and static IP (availability and overlapping): user: user
cluster control plane VIP "10.251.133.132" overlaps with
example-cluster1/control plane VIP "10.251.133.132"
Não pode editar campos como o VIP do plano de controlo e o VIP de entrada na secção Equilibrador de carga da página Detalhes do cluster na Google Cloud consola. Para corrigir endereços IP em conflito, elimine e recrie o cluster:
- Elimine o cluster.
- Crie novamente o cluster com endereços IP que não entrem em conflito com um cluster existente.
Remova clusters não saudáveis
Um cluster pode ficar num estado não saudável por vários motivos, como:
- Problemas de conetividade com o agente de ligação ou o ambiente nas instalações.
- O cluster de administração de um cluster de utilizadores foi eliminado ou existem problemas de conetividade entre os clusters de administração e de utilizadores.
Se a consola não conseguir eliminar um cluster, use os comandos da CLI gcloud para eliminar recursos de clusters não íntegros. Google Cloud Se não atualizou a CLI gcloud recentemente, execute o seguinte comando para atualizar os componentes:
gcloud components update
Em seguida, elimine os Google Cloud recursos.
Cluster de utilizadores
Elimine o grupo de utilizadores:
gcloud container bare-metal clusters delete USER_CLUSTER_NAME \ --project=PROJECT_ID \ --location=REGION \ --force \ --allow-missing \ --ignore-errors
Substitua o seguinte:
USER_CLUSTER_NAME
: o nome do cluster de utilizadores a eliminar.PROJECT_ID
: o ID do projeto no qual o cluster está registado.REGION
: a localização Google Cloud associada ao cluster de utilizadores. A localização é apresentada na consola.A flag
--force
elimina um cluster com node pools. Sem a flag--force
, tem de eliminar os node pools primeiro e, em seguida, eliminar o cluster.O sinalizador
--allow-missing
permite que o comando continue se o cluster não for encontrado.A flag
--ignore-errors
remove Google Cloud recursos quando os clusters de administrador e de utilizador estão inacessíveis.Este comando elimina o cluster, se existir, e remove os recursos da API GKE On-Prem e da associação à frota de Google Cloud.
Confirme que os recursos da API GKE On-Prem foram eliminados:
gcloud container bare-metal clusters list \ --project=PROJECT_ID \ --location=-
Quando define
--location=-
, significa que quer listar todos os clusters em todas as regiões. Se precisar de restringir a lista, defina--location
para uma região específica.Confirme que os recursos de membro da frota foram eliminados:
gcloud container fleet memberships list \ --project=PROJECT_ID
Cluster de administrador
Se inscreveu o cluster de administrador na API GKE On-Prem, anule a inscrição:
gcloud container bare-metal admin-clusters unenroll ADMIN_CLUSTER_NAME \ --project=PROJECT_ID \ --location=REGION \ --allow-missing --ignore-errors
Substitua o seguinte:
ADMIN_CLUSTER_NAME
: o nome do cluster de administrador.PROJECT_ID
: o ID do projeto anfitrião da frota.REGION
: a Google Cloud região.
O sinalizador
--allow-missing
anula a inscrição do cluster se não for encontrada a associação à frota.A flag
--ignore-errors
remove Google Cloud recursos quando os clusters de administrador e de utilizador estão inacessíveis.Este comando remove os recursos da API GKE On-Prem de Google Cloud.
Remova o cluster da frota:
gcloud container fleet memberships delete ADMIN_CLUSTER_NAME \ --project=PROJECT_ID \ --location=global
Este comando remove os recursos de associação a frotas de Google Cloud.
Confirme que os recursos da API GKE On-Prem foram eliminados:
gcloud container fleet memberships delete ADMIN_CLUSTER_NAME --project=FLEET_HOST_PROJECT_ID
Quando define
--location=-
, significa que quer listar todos os clusters em todas as regiões. Se precisar de restringir a lista, defina--location
para uma região específica.Confirme que os recursos de membro da frota foram eliminados:
gcloud container fleet memberships list \ --project=PROJECT_ID
O que se segue?
Se precisar de assistência adicional, contacte o apoio ao cliente do Google Cloud. Também pode consultar o artigo Receber apoio técnico para mais informações sobre recursos de apoio técnico, incluindo o seguinte:
- Requisitos para abrir um registo de apoio técnico.
- Ferramentas para ajudar a resolver problemas, como a configuração do ambiente, os registos e as métricas.
- Componentes suportados.