Esta página foi traduzida pela API Cloud Translation.

Ajuste os serviços do GKE com a assistência do Gemini

Autopilot Padrão

Esta página descreve como pode otimizar as implementações do Google Kubernetes Engine (GKE) para otimizar o desempenho e a fiabilidade através do Gemini Cloud Assist, um colaborador com tecnologia de IA para o Google Cloud. A assistência do Gemini pode incluir recomendações, geração de código e resolução de problemas.

Entre muitas outras vantagens, o Gemini Cloud Assist pode ajudar a alcançar o seguinte:

Reduza os custos: identifique recursos inativos, ajuste as suas implementações e otimize as configurações da escala automática para minimizar os gastos desnecessários.
Melhore a fiabilidade e a estabilidade: identifique proativamente potenciais problemas, como a variação da versão ou orçamentos de interrupção de pods em falta, para evitar o tempo de inatividade e garantir a resiliência da aplicação.
Otimize cargas de trabalho de IA/ML: receba ajuda com a implementação, a gestão e a otimização de cargas de trabalho de IA/ML no GKE.
Simplifique a resolução de problemas: analise rapidamente os registos e identifique a causa principal dos erros, poupando tempo e esforço.

Esta página destina-se a utilizadores existentes do GKE e a operadores e programadores que aprovisionam e configuram recursos na nuvem, bem como implementam apps e serviços. Para saber mais sobre as funções comuns e as tarefas de exemplo referenciadas no Google Cloud conteúdo, consulte o artigo Funções e tarefas comuns do utilizador do GKE.

Saiba como e quando o Gemini para Google Cloud usa os seus dados.

Custos

Gemini: durante a pré-visualização, não existe qualquer custo para usar o Gemini Cloud Assist.
GKE: não existem custos adicionais para usar o Gemini Cloud Assist no GKE.

Antes de começar

Para começar a usar o Gemini com o GKE, conclua os seguintes pré-requisitos.

Verify that billing is enabled for your Google Cloud project.
Peça aos administradores de identidade e de contas para lhe concederem as autorizações necessárias para aceder e modificar os seus recursos do GKE.
Siga as instruções fornecidas no guia Configure o Gemini Cloud Assist para ativar o Gemini Cloud Assist no seu projeto ou pasta, com funções específicas de gestão de identidade e acesso (IAM) concedidas ao seu principal.

Este guia pressupõe que tem um cluster do GKE e, de preferência, algumas implementações em execução.

Peça ao Gemini Cloud Assist

Pode invocar o Gemini Cloud Assist a partir da Google Cloud consola. O Gemini Cloud Assist permite-lhe usar comandos em linguagem natural para receber ajuda com tarefas de forma rápida e eficiente.

Para abrir o Cloud Assist a partir de uma página do GKE, siga estes passos:

Na Google Cloud consola, na página do seletor de projetos, selecione um Google Cloud projeto onde ativou o Gemini Cloud Assist.

Aceder ao seletor de projetos
Na Google Cloud consola, aceda a uma página específica na consola do Kubernetes Engine.

Por exemplo, aceda à página Vista geral do Kubernetes Engine.

Aceda à vista geral do Kubernetes Engine

Se tiver uma pergunta sobre um recurso específico, navegue primeiro para a página relevante. Por exemplo, na página Clusters, o Gemini Cloud Assist pode dar-lhe conselhos sobre a gestão dos seus clusters, a monitorização do estado dos clusters e a resolução de problemas de clusters. A utilização do Gemini numa página da consola específica ajuda a fornecer contexto para as suas perguntas. Google Cloud Em seguida, o Gemini pode usar este contexto, juntamente com o projeto geral em que se encontra, para gerar assistência mais personalizada e precisa.
Para abrir o painel do Gemini Cloud Assist, clique no relâmpago Abrir ou fechar chat de IA do Gemini na barra de ferramentas.
Se lhe for pedido e concordar com os termos, clique em Aceitar.
Introduza um comando no painel do Gemini. Veja um exemplo de fluxo de trabalho de utilização do Gemini para resolver problemas na secção seguinte.

Para mais informações sobre a utilização do Gemini na Google Cloud consola, consulte o artigo Use o Gemini Cloud Assist.

Exemplo de utilização do Gemini para resolver problemas

O Gemini pode ajudar a resolver problemas nos seus serviços do GKE.

Aceda à página Workloads na Google Cloud consola.

Aceda a Cargas de trabalho
Selecione a carga de trabalho cujos problemas quer resolver.
Clique no separador Registos.
Clique no relâmpago Abrir ou fechar o chat de IA do Gemini na barra de ferramentas.
Introduza um comando para descrever o problema que está a ter. Por exemplo, "A minha aplicação de base de dados accounts-db está a sofrer de latência elevada". O Gemini pode pedir mais contexto, como o tipo de base de dados, o âmbito do impacto, como as operações e os utilizadores afetados pela latência.
Em seguida, o Gemini pode fornecer orientações para analisar os registos e sugestões de resolução de problemas.
Reveja e siga as sugestões para resolver o problema.

Exemplos de comandos para o Gemini Cloud Assist

Esta secção mostra alguns exemplos de utilização reais e sugere os comandos que pode experimentar pedir ao Gemini. As respostas reais que recebe podem ser genéricas ou personalizadas e acionáveis com base no estado único do seuGoogle Cloud ambiente. As respostas podem incluir Google Cloud links da consola para rever e gerir os seus recursos da nuvem, bem como links para a documentação relevante para mais informações.

Reduzir custos

A tabela seguinte descreve os comandos que pode usar para ajudar a reduzir os custos.

Comando	Tipo de resposta
"Como posso poupar custos nos meus clusters do GKE sem sacrificar o desempenho?"	Recomendações que identificam e sugerem a remoção de recursos pouco usados, como clusters inativos. Sugestões sobre a ativação ou o ajuste dos mecanismos de dimensionamento automático. Sugestões que realçam potenciais poupanças através de revisões da configuração, como políticas de retenção de registos.
"Quero atualizar o meu cluster do GKE `my-docker-cluster`. Tem recomendações?"	Sugestões para implementar configurações e práticas recomendadas específicas do Kubernetes, por exemplo: Definir pedidos e limites de recursos para pods para ajudar a garantir uma atribuição de recursos previsível. Usar espaços de nomes dedicados para isolar cargas de trabalho. Implementar orçamentos de interrupção de pods para ajudar a garantir que está disponível um número mínimo de réplicas de pods durante interrupções voluntárias, como a manutenção ou as atualizações de nós. Agendar janelas de manutenção para gerir interrupções planeadas e minimizar o tempo de inatividade inesperado. Inscrever clusters em canais de lançamento para gerir atualizações de versões do GKE.
"Vou ter um grande pico de tráfego dentro de algumas semanas no cluster `my-docker-cluster`. Tem recomendações?"	Estratégias para dimensionar o número de pods de aplicações através da escala automática horizontal de pods. Estratégias para aumentar os recursos (CPU, memória) por pod através do redimensionador automático vertical de pods.
"Quais das minhas cargas de trabalho do GKE não têm o HPA ativado?"	A lista de cargas de trabalho que não têm a escala automática horizontal de pods ativada.

Melhore a fiabilidade e a estabilidade

A tabela seguinte descreve os comandos que pode usar para ajudar a melhorar a fiabilidade e a estabilidade das suas cargas de trabalho do GKE.

Comando	Tipo de resposta
"Como posso tornar os meus clusters do GKE mais fiáveis e evitar o tempo de inatividade?"	Identifica a discrepância de versões nos clusters e sugere ações para manter a compatibilidade da versão do Kubernetes. Oferece recomendações para implementar o isolamento de recursos. Fornece recomendações para configurar orçamentos de interrupção de pods de modo a manter um número mínimo de réplicas de pods em execução durante a manutenção ou as atualizações planeadas.
"Show me how I can move my workloads from the `Default` namespace on `my-cluster`." (Mostra-me como posso mover as minhas cargas de trabalho do espaço de nomes `Default` no `my-cluster`.)	Passos para fazer o seguinte: Prepare um cluster de destino. Migre apps e dados para o cluster de destino. Alterne os serviços com um tempo de inatividade mínimo.
"Como posso garantir a elevada disponibilidade dos meus pods em execução?"	Um procedimento detalhado que especifica uma implementação que usa `podAntiAffinity` e várias réplicas para redundância. Sugestões para definir pedidos e limites de recursos, e usar a escala automática horizontal de pods.

Otimizar o GKE para cargas de trabalho de IA/ML

A tabela seguinte descreve os comandos que pode usar para receber ajuda com a implementação, a gestão e a otimização de cargas de trabalho de IA/ML no GKE.

Comando	Tipo de resposta
"Quais são as configurações recomendadas do conjunto de nós para executar a preparação distribuída do TensorFlow em grande escala no GKE com GPUs?"	As recomendações para otimizar a preparação de ML do TensorFlow distribuído no GKE podem incluir o seguinte: Selecionar os tipos de GPU e de máquinas certos. Ativar o dimensionamento automático. Otimizar a conetividade de rede. Tirar partido das estruturas de preparação distribuída. Implementar medidas de poupança de custos.
"Como posso usar GPUs no GKE para a preparação?"	Vista geral dos passos e considerações para configurar um cluster e cargas de trabalho para usar GPUs.
"Dá-me um exemplo de implementação de um contentor de publicação de modelos no GKE."	Um exemplo com código de exemplo para implementar um contentor de publicação de modelos no GKE. O exemplo pode incorporar práticas recomendadas e ajuda a garantir a escalabilidade.
"Que métricas devo acompanhar para avaliar a eficácia da minha configuração de equilíbrio de carga para inferência?"	A lista de métricas, como a distribuição de tráfego, a latência, as taxas de erro, a CPU e a utilização de memória, para obter estatísticas sobre o desempenho e o estado da configuração do equilíbrio de carga.

Simplifique a resolução de problemas

A tabela seguinte descreve os comandos que pode usar para ajudar a analisar rapidamente os registos e identificar a causa essencial dos erros, poupando tempo e esforço.

Comando	Tipo de resposta
"Qual é o problema deste erro? `Readiness probe failed: Get "https://10…./abcd": context deadline exceeded (Client.Timeout exceeded while awaiting headers)`"	Explica que o kubelet não conseguiu executar a sondagem de prontidão para o contentor dentro do período de tempo limite definido e sugere potenciais causas e ações de resolução de problemas.
"Por que motivo a minha implementação está a falhar com o erro `ping: socket: Operation not permitted`?"`nettools`	Explica que o comando `ping` requer a capacidade de contexto de segurança `CAP_NET_RAW` e que, por predefinição, os contentores no Kubernetes são executados com um conjunto restrito de capacidades por motivos de segurança.
"O que significa quando o meu pod não é agendável devido ao erro `Cannot schedule pods: No preemption victims found for incoming pod.`"	Explica como o agendamento e a preempção de pods funcionam no Kubernetes. Lista os passos para resolver problemas relacionados com o motivo pelo qual não foi encontrado nenhum elemento publicitário de substituição.

O que se segue?

Saiba como escrever melhores comandos.
Saiba como usar o painel do Gemini Cloud Assist.
Leia o artigo Use o Gemini para obter assistência e desenvolvimento de IA.
Saiba como o Gemini para Google Cloud usa os seus dados.