Quando os clusters ou aplicativos do Google Kubernetes Engine (GKE) apresentam problemas, é crucial determinar rapidamente se a causa é interna ou relacionada a umaGoogle Cloud interrupção de serviço mais ampla. Gastar tempo na depuração local é ineficiente se a causa raiz for um incidente conhecido da plataforma.
Use esta página para determinar se um problema com o cluster do GKE é causado por uma interrupção mais ampla do serviço Google Cloud . Saiba onde encontrar atualizações de status oficiais, eventos de integridade personalizados e insights sobre incidentes de serviço nas seguintes fontes:
- Google Cloud Integridade do serviço: informações de status para serviços do Google Cloud, por região.
- Personalized Service Health: interrupções de serviço relevantes para seus projetos.
- Insights e recomendações de incidentes de serviço: clusters do GKE afetados por um incidente de serviço em andamento.
Essas informações são importantes para administradores e operadores da plataforma e desenvolvedores de aplicativos que estão resolvendo problemas e precisam entender se os problemas observados estão vinculados a um evento de integridade do serviço Google Cloud mais amplo. Para mais informações sobre as funções comuns e as tarefas de exemplo que mencionamos no conteúdo doGoogle Cloud , consulte Funções e tarefas comuns do usuário do GKE.
Revisar a Google Cloud integridade do serviço
A página Google Cloud Integridade do serviço fornece informações de status sobre os serviços que fazem parte do Google Cloud.
Para analisar incidentes relacionados ao GKE, acesse a página Google Cloud Service Health.
Acessar todos os incidentes informados para o Google Kubernetes Engine
Analisar o Personalized Service Health
Com o Personalized Service Health, é possível identificar Google Cloud interrupções de serviço relevantes para seus projetos. Essas interrupções são chamadas de eventos de integridade do serviço, e as informações sobre elas estão disponíveis no console Google Cloud e em uma variedade de pontos de integração.
Para analisar incidentes relacionados ao GKE que são relevantes para seus projetos, consulte os eventos de integridade do serviço no painel do Personalized Service Health no console do Google Cloud .
Acessar o Personalized Service Health
É possível filtrar incidentes por serviço, local, relevância e status. O painel também fornece detalhes do incidente, como escopo do impacto, sintomas, soluções alternativas e atualizações do progresso da resolução. Para começar, consulte o Guia de início rápido: visualizar eventos de integridade do serviço no Google Cloud console.
Analisar insights e recomendações de incidentes de serviço
Com os insights e recomendações de incidentes de serviço, é possível identificar clusters do GKE afetados por um incidente de serviço em andamento.
Para receber insights sobre incidentes de serviço, confira insights e recomendações para o subtipo GKE_RELIABILITY_INCIDENT
. É possível receber insights usando
o console Google Cloud , a CLI do Google Cloud ou a API Recommender. Para
mais informações, consulte Ver insights e
recomendações.
Os insights e recomendações incluem as seguintes informações:
- Cluster afetado: um cluster afetado pelo incidente.
- Nome do incidente: um identificador para referência quando você se comunica com o atendimento ao cliente do Cloud.
- Descrição do incidente: informações sobre o incidente da equipe de resposta a incidentes.
- Último horário efetivo: a última vez que as informações sobre o incidente foram atualizadas.
- Ação de mitigação: ação de mitigação recomendada pela equipe de resposta a incidentes, se disponível.
O insight de incidente de serviço permanece visível até que a equipe de resposta a incidentes Google Cloud mitigue o incidente e determine que o insight não é mais relevante. Haverá um atraso entre o momento em que o incidente é mitigado e não afeta mais seus recursos e o momento em que o insight é removido. Se você implementou uma solução alternativa e não quer mais ver o insight, dispense-o.
A seguir
Leia Avaliar a integridade do cluster e da carga de trabalho no console Google Cloud (próxima página desta série).
Para receber conselhos sobre como resolver problemas específicos, consulte os guias de solução de problemas do GKE.
Se você não encontrar uma solução para seu problema na documentação, consulte Receber suporte para mais ajuda, incluindo conselhos sobre os seguintes tópicos:
- Abrir um caso de suporte entrando em contato com o Cloud Customer Care.
- Receber suporte da comunidade fazendo perguntas no StackOverflow e usando a tag
google-kubernetes-engine
para pesquisar problemas semelhantes. Você também pode participar do canal do Slack#kubernetes-engine
para receber mais suporte da comunidade. - Abrir bugs ou solicitações de recursos usando o Issue Tracker público.