Esta página descreve como resolver problemas de inacessibilidade do dispositivo após a inicialização. Pode deparar-se com os seguintes problemas:
- Mensagens de erro, como
Unable to connect to the server: dial tcp 198.18.0.64:443: i/o timeout
, ao tentar consultar com o kubectl. - Erro
Webpage not available
ao tentar aceder à IU. - As aplicações implementadas no dispositivo não estão a funcionar ou não consegue implementar novas aplicações.
Resolução do problema de inacessibilidade da IU
- Siga o manual de procedimentos Interface do utilizador inacessível para resolver o problema.
- Verifique se o cluster está acessível seguindo a secção Acessibilidade do cluster.
- Se o cluster responder, verifique se a API de gestão está acessível seguindo a secção API de gestão acessível.
- Se o cluster não estiver acessível e devolver erros como
Connection timed out
oui/o timeout error
, consulte o guia de resolução de problemas para ver mais passos de resolução de problemas.
Passos de resolução de problemas básicos
Verifique a fonte de alimentação do chassis, verificando se as luzes indicadoras (verdes) em qualquer uma das duas fontes de alimentação estão acesas, conforme indicado pelas setas na imagem.
Estado do indicador (luminoso) de LED Descrição Verde sólido Sistema ligado e funcionamento normal Verde intermitente Alimentação em standby presente (fonte de alimentação desligada) Âmbar sólido Falha na fonte de alimentação (sobretensão/subtensão, temperatura excessiva, sobreintensidade, curto-circuito), falha na ventoinha ou proteção contra sobretensão de entrada Âmbar intermitente Erro de fonte de alimentação Desativado Não existe alimentação ou a alimentação em modo de espera falhou (sobretensão/ subtensão, temperatura excessiva, corrente excessiva, curto-circuito, bloqueio da ventoinha) Se as luzes indicadoras estiverem desligadas, certifique-se primeiro de que o cabo de alimentação está a receber energia. Se o cabo de alimentação estiver a funcionar corretamente, é provável que as fontes de alimentação estejam com defeito e tenham de ser substituídas. Para obter instruções de substituição, consulte o guia de substituição da fonte de alimentação.
Se as fontes de alimentação estiverem a funcionar, mas o dispositivo continuar a não funcionar, verifique se existem ligações soltas ou danificadas.
Verifique se os LEDs do comutador e dos servidores estão iluminados, conforme indicado pelas setas na imagem.
Se o LED de ligação do comutador estiver verde sólido, verifique se está operacional seguindo a secção Verifique se o comutador está operacional.
Se o estado e a configuração do comutador estiverem corretos, inicie sessão no iLO através dos passos mencionados em Passos para iniciar sessão no iLO para verificar o estado do dispositivo.
- Se algum dos ventiladores for crítico, contacte a equipa de apoio técnico da HPE para obter uma substituição do ventilador crítico e siga o guia de substituição do ventilador para o substituir.
- Se alguma lâmina estiver desligada, ligue-a navegando para a secção Lâminas, selecionando a lâmina e premindo o botão ligar/desligar.
- Se alguma das lâminas estiver num estado crítico, navegue para a secção Blades, selecione a lâmina crítica, aceda à secção Power e inicie uma reposição forçada do sistema.
- Se o estado de funcionamento do chassis for crítico, também pode tentar repor o chassis acedendo ao separador Alimentação e temperatura. Selecione a secção Gestão de energia e clique em Repor botão EL8000CM. Este processo repõe o firmware do gestor do chassis e pode demorar alguns minutos, durante os quais o chassis fica indisponível.
- Se o problema persistir, aceda ao separador Informações, selecione Registos, escolha Registos de saúde no menu pendente e transfira-os como um ficheiro CSV. Crie um pedido junto da Google e anexe os registos para pedir a substituição do hardware.
Se os LEDs de alimentação nas lâminas estiverem iluminados, faça um teste de ping aos seguintes endereços IP das lâminas a partir de uma máquina ligada ao dispositivo:
ping 198.18.0.7 //BM01 ping 198.18.0.8 //BM02 ping 198.18.0.9 //BM03
Se o teste de ping for bem-sucedido, indica que os nós estão operacionais.
Se todos os nós falharem no teste de ping, encaminhe o problema para o apoio técnico da Google.
Se o problema persistir depois de seguir todos os passos descritos nesta secção, encaminhe o problema para o Apoio técnico da Google para receber assistência adicional.
Ligações soltas ou danificadas
Verifique se todas as ligações estão seguras e devidamente encaixadas. Para orientações sobre como verificar e fixar as ligações por cabo no aparelho, consulte o artigo Verificar cabos.
Inspecione os cabos para verificar se existem danos visíveis. Se algum cabo estiver danificado, substitua-o.
Valide se o comutador está operacional
Inicie sessão na consola de série do comutador. Se o início de sessão for bem-sucedido, execute o seguinte comando para verificar o estado do comutador. Este comando apresenta o tempo de atividade e o consumo de recursos do comutador.
show version
Se a consola série responder, valide a configuração de BGP no comutador consultando o artigo Validar resumo de BGP.
Se o LED de ligação estiver desligado ou a consola série não responder, o comutador pode estar avariado. Encaminhe o problema para o Apoio técnico da Google para receber uma substituição.
Valide a acessibilidade do cluster
Inicie sessão na sessão gdcloud com credenciais de E/S:
gdcloud auth login
Se não conseguir iniciar sessão, localize a credencial de emergência da qual foi feita uma cópia de segurança durante a configuração do dispositivo para usar com o comando -: root-admin-kubeconfig.
Verifique se o cluster está acessível:
kubectl --kubeconfig root-admin-kubeconfig get servers -A
Valide a acessibilidade da API Management
Inicie sessão na sessão gdcloud com credenciais de E/S:
gdcloud auth login
Se o início de sessão falhar, inicie sessão com as credenciais do plano de gestão.
Por vezes, a base de dados do AIS pode funcionar incorretamente ou estar configurada incorretamente, o que provoca uma falha no início de sessão. Consulte o artigo IAM-R0009 – Base de dados AIS.
Se não conseguir resolver os problemas de início de sessão, localize a credencial de emergência da qual foi feita uma cópia de segurança durante a configuração do dispositivo para usar com o comando -: root-admin-kubeconfig.
Obtenha o kubeconfig do plano de gestão:
kubectl --kubeconfig root-admin-kubeconfig -n management-kube-system get secret kube-admin-remote-kubeconfig -ojsonpath='{.data.value}' | base64 -d > kube-admin-remote-kubeconfig
Obtenha o estado de funcionamento do cluster:
kubectl --kubeconfig kube-admin-remote-kubeconfig get --raw='/readyz?verbose'