O principal objetivo do suporte do Google é resolver os incidentes de produção o mais rápido possível. Fazemos isso entendendo sua configuração, analisando registros e métricas e colaborando com parceiros para resolver incidentes rapidamente.
O Google Cloud oferece uma variedade de pacotes de suporte para atender às suas necessidades. Todos os pacotes de suporte do Google Cloud incluem suporte para Anthos e Anthos. Se você já tiver um pacote de suporte do Google Cloud, já terá suporte para Anthos e do Anthos.
Para mais informações, consulte a documentação do suporte do Google Cloud.
Requisitos para suporte do Anthos
Para resolver problemas de incidentes críticos para a empresa de maneira eficaz:
- Verifique se o ambiente está atualizado e dentro dos prazos de fim de suporte publicados. Consulte a seção Política de suporte da versão para mais informações.
- Capturar registros e configurações de componentes do sistema. Para detalhes, consulte a seguinte seção Ferramentas de suporte.
Ferramentas de suporte
Para solucionar um incidente do Anthos, o suporte do Google Cloud
depende da configuração do ambiente e dos registros dos clusters. É possível capturar o estado do cluster com o comando actl diagnose
e empacotar essas informações em um arquivo tar para interações com o suporte. Consulte
Como diagnosticar problemas de cluster.
Como resolvemos problemas do ambiente
Veja um exemplo de um incidente típico de suporte:
- Por exemplo, um administrador da plataforma abre um caso de suporte com operador de infraestrutura do Anthos em execução do modo desconectado.
- O operador da infraestrutura oferece suporte de nível 1, que envolve referência à documentação, guias de instruções e perguntas gerais sobre produtos.
- O administrador da plataforma captura o snapshot do sistema de diagnóstico de um período apropriado relativo aos componentes relevantes do sistema. O administrador da plataforma também limpa os dados do snapshot removendo informações confidenciais dele e compartilha o snapshot com o operador de infraestrutura. Ele também pode tirar um snapshot para recuperar informações adicionais de depuração.
- Se o problema não for resolvido, o operador de infraestrutura também fornecerá suporte de nível 2, que envolve a solução de problemas básicos usando telemetria e análise do snapshot do sistema usando e/ou manuais para resolver problemas comuns.
- Para problemas mais complexos, o operador da infraestrutura abre um tíquete com o suporte do Google Cloud e compartilha o snapshot do sistema limpo com o Suporte do Google.
- O histórico de consultas é encaminhado para um engenheiro de suporte técnico especializado no Anthos em execução no modo desconectado, que entende a implementação e a arquitetura do produto e pode analisar a causa raiz de problemas novos.
- O engenheiro de suporte técnico examina o conteúdo dos snapshots de diagnóstico para ganhar contexto do ambiente. O engenheiro de suporte técnico
examina os registros e as métricas e captura a análise e os dados contextuais
no tíquete. O engenheiro de suporte pode solicitar mais informações, como
a saída dos comandos
actl
relevantes, e anexá-los ao caso. - O engenheiro de suporte técnico também pode se envolver com a engenharia do Google conforme necessário para encontrar uma solução para problemas mais complexos, incluindo correções de bugs e alterações de implementação.
- O engenheiro de suporte responde ao caso com uma avaliação e recomendação. O engenheiro de suporte e a infraestrutura do Anthos em execução no operador no modo desconectado continuam a solucionar o problema até chegar a uma solução.
O que o Google aceita?
Geralmente, a equipe de suporte do Cloud é compatível com todos os componentes de software enviados como parte do Anthos, bem como com o Anthos, o Mesh Service e o Anthos Config Management. A tabela abaixo detalha isso:
Compatível com o Google Cloud | Incompatível |
---|---|
Kubernetes e ambiente de execução do contêiner | Escolha do balanceador de carga (balanceamento de carga manual) pelo cliente |
Anthos em clusters bare metal | Código do cliente (consulte o Suporte ao desenvolvedor abaixo) |
Como monitorar, gerar registros usando o Prometheus, o Loki e o Grafana | Escolha do sistema operacional pelo cliente |
Balanceador de carga em pacote (MetalLB) | Servidor físico ou virtual, armazenamento e rede |
Controlador de entrada | DNS externo, DHCP e sistemas de identidade |
Anthos Identity Service | |
Anthos Service Mesh | |
Anthos Config Management |
Política de suporte da versão
Para saber mais sobre a política geral de suporte à versão, consulte a página de suporte do Anthos.
Modelo de responsabilidade compartilhada
A execução de um aplicativo de produção essencial para os negócios nos clusters do Anthos exige que várias partes tenham responsabilidades diferentes. Ainda que não seja uma lista completa, as seções abaixo listam os papéis e as responsabilidades.
Responsabilidades do Google
- Manutenção e distribuição de pacotes de software do Anthos em execução no modo desconectado.
- Notificação aos usuários sobre upgrades disponíveis para o Anthos em execução no modo desconectado e criação de scripts de upgrade destinados à versão anterior. O Anthos em execução no modo desconectado é compatível apenas com upgrades sequenciais (exemplo: 1.2 → 1.3 → 1.4, e não 1.2 → 1.4).
- Solução de problemas, solução alternativa e correção da causa raiz dos problemas relacionados aos componentes fornecidos pelo Google.
Responsabilidades do operador de infraestrutura que usa o Anthos em execução no modo desconectado
- Cuidar da administração geral do sistema para clusters de administrador no local
- Executar, manter e aplicar patches na infraestrutura do data center, incluindo rede, servidores, sistema operacional e armazenamento
- Upgrade do Anthos em execução em versões de modo desconectado regularmente.
- Monitorar o cluster e responder a incidentes e fornecer suporte de nível L1 e L2 para os clientes
- Como limpar snapshots, configurações e registros do sistema de diagnóstico e garantir que nenhum dado confidencial seja compartilhado com o Google.
- Fornecer ao Google detalhes do ambiente para fins de solução de problemas
Responsabilidades do administrador de plataforma que usa o Anthos em execução no modo desconectado
- Cuidar da administração geral do sistema para clusters de usuário no local
- Executar, manter e corrigir as cargas de trabalho do aplicativo.
- Monitoramento de cargas de trabalho de aplicativos e integridade do cluster e atividades do sistema de geração de registros conforme necessário para cumprir as regulamentações de conformidade.
- Como limpar snapshots, configurações e registros do sistema de diagnóstico e garantir que os dados confidenciais não sejam compartilhados com o Google.
- Fornecer ao Google detalhes do ambiente para fins de solução de problemas
Suporte para desenvolvedores
O Google não fornece suporte para cargas de trabalho de aplicativos em execução no Anthos. No entanto, oferecemos suporte para desenvolvedores com base no melhor esforço para garantir que os desenvolvedores possam executar aplicativos com facilidade no Anthos. Acreditamos que o envolvimento prévio durante o desenvolvimento pode evitar incidentes críticos posteriores à implantação.
Esse suporte ao desenvolvedor está disponível para clientes com um pacote de suporte pago e é tratado como prioridade P3 para um problema que bloqueia um lançamento ou como prioridade P4 para consultoria geral.