Esta página descreve como pode otimizar as implementações do Google Kubernetes Engine (GKE) para otimizar o desempenho e a fiabilidade através do Gemini Cloud Assist, um colaborador com tecnologia de IA para o Google Cloud. A assistência do Gemini pode incluir recomendações, geração de código e resolução de problemas.
Entre muitas outras vantagens, o Gemini Cloud Assist pode ajudar a alcançar o seguinte:
- Reduza os custos: identifique recursos inativos, ajuste as suas implementações e otimize as configurações da escala automática para minimizar os gastos desnecessários.
- Melhore a fiabilidade e a estabilidade: identifique proativamente potenciais problemas, como a variação da versão ou orçamentos de interrupção de pods em falta, para evitar o tempo de inatividade e garantir a resiliência da aplicação.
- Otimize cargas de trabalho de IA/ML: receba ajuda com a implementação, a gestão e a otimização de cargas de trabalho de IA/ML no GKE.
- Simplifique a resolução de problemas: analise rapidamente os registos e identifique a causa principal dos erros, poupando tempo e esforço.
Esta página destina-se a utilizadores existentes do GKE e a operadores e programadores que aprovisionam e configuram recursos na nuvem, bem como implementam apps e serviços. Para saber mais sobre as funções comuns e as tarefas de exemplo referenciadas no Google Cloud conteúdo, consulte o artigo Funções e tarefas comuns do utilizador do GKE.
Saiba como e quando o Gemini para Google Cloud usa os seus dados.
Custos
Gemini: durante a pré-visualização, não existe qualquer custo para usar o Gemini Cloud Assist.
GKE: não existem custos adicionais para usar o Gemini Cloud Assist no GKE.
Antes de começar
Para começar a usar o Gemini com o GKE, conclua os seguintes pré-requisitos.
-
Verify that billing is enabled for your Google Cloud project.
- Peça aos administradores de identidade e de contas para lhe concederem as autorizações necessárias para aceder e modificar os seus recursos do GKE.
- Siga as instruções fornecidas no guia Configure o Gemini Cloud Assist para ativar o Gemini Cloud Assist no seu projeto ou pasta, com funções específicas de gestão de identidade e acesso (IAM) concedidas ao seu principal.
Este guia pressupõe que tem um cluster do GKE e, de preferência, algumas implementações em execução.
Peça ao Gemini Cloud Assist
Pode invocar o Gemini Cloud Assist a partir da Google Cloud consola. O Gemini Cloud Assist permite-lhe usar comandos em linguagem natural para receber ajuda com tarefas de forma rápida e eficiente.
Para abrir o Cloud Assist a partir de uma página do GKE, siga estes passos:
Na Google Cloud consola, na página do seletor de projetos, selecione um Google Cloud projeto onde ativou o Gemini Cloud Assist.
Na Google Cloud consola, aceda a uma página específica na consola do Kubernetes Engine.
Por exemplo, aceda à página Vista geral do Kubernetes Engine.
Aceda à vista geral do Kubernetes Engine
Se tiver uma pergunta sobre um recurso específico, navegue primeiro para a página relevante. Por exemplo, na página Clusters, o Gemini Cloud Assist pode dar-lhe conselhos sobre a gestão dos seus clusters, a monitorização do estado dos clusters e a resolução de problemas de clusters. A utilização do Gemini numa página da consola específica ajuda a fornecer contexto para as suas perguntas. Google Cloud Em seguida, o Gemini pode usar este contexto, juntamente com o projeto geral em que se encontra, para gerar assistência mais personalizada e precisa.
Para abrir o painel do Gemini Cloud Assist, clique no relâmpago Abrir ou fechar chat de IA do Gemini na barra de ferramentas.
Se lhe for pedido e concordar com os termos, clique em Aceitar.
Introduza um comando no painel do Gemini. Veja um exemplo de fluxo de trabalho de utilização do Gemini para resolver problemas na secção seguinte.
Para mais informações sobre a utilização do Gemini na Google Cloud consola, consulte o artigo Use o Gemini Cloud Assist.
Exemplo de utilização do Gemini para resolver problemas
O Gemini pode ajudar a resolver problemas nos seus serviços do GKE.
Aceda à página Workloads na Google Cloud consola.
Selecione a carga de trabalho cujos problemas quer resolver.
Clique no separador Registos.
Clique no relâmpago Abrir ou fechar o chat de IA do Gemini na barra de ferramentas.
Introduza um comando para descrever o problema que está a ter. Por exemplo, "A minha aplicação de base de dados
accounts-db
está a sofrer de latência elevada". O Gemini pode pedir mais contexto, como o tipo de base de dados, o âmbito do impacto, como as operações e os utilizadores afetados pela latência.Em seguida, o Gemini pode fornecer orientações para analisar os registos e sugestões de resolução de problemas.
Reveja e siga as sugestões para resolver o problema.
Exemplos de comandos para o Gemini Cloud Assist
Esta secção mostra alguns exemplos de utilização reais e sugere os comandos que pode experimentar pedir ao Gemini. As respostas reais que recebe podem ser genéricas ou personalizadas e acionáveis com base no estado único do seuGoogle Cloud ambiente. As respostas podem incluir Google Cloud links da consola para rever e gerir os seus recursos da nuvem, bem como links para a documentação relevante para mais informações.
Reduzir custos
A tabela seguinte descreve os comandos que pode usar para ajudar a reduzir os custos.
Comando | Tipo de resposta |
---|---|
"Como posso poupar custos nos meus clusters do GKE sem sacrificar o desempenho?" |
|
"Quero atualizar o meu cluster do GKE my-docker-cluster . Tem recomendações?" |
Sugestões para implementar configurações e práticas recomendadas específicas do Kubernetes, por exemplo:
|
"Vou ter um grande pico de tráfego dentro de algumas semanas no cluster my-docker-cluster . Tem recomendações?" |
|
"Quais das minhas cargas de trabalho do GKE não têm o HPA ativado?" | A lista de cargas de trabalho que não têm a escala automática horizontal de pods ativada. |
Melhore a fiabilidade e a estabilidade
A tabela seguinte descreve os comandos que pode usar para ajudar a melhorar a fiabilidade e a estabilidade das suas cargas de trabalho do GKE.
Comando | Tipo de resposta |
---|---|
"Como posso tornar os meus clusters do GKE mais fiáveis e evitar o tempo de inatividade?" |
|
"Show me how I can move my workloads from the Default namespace on my-cluster ." (Mostra-me como posso mover as minhas cargas de trabalho do espaço de nomes Default no my-cluster .) |
Passos para fazer o seguinte:
|
"Como posso garantir a elevada disponibilidade dos meus pods em execução?" |
|
Otimizar o GKE para cargas de trabalho de IA/ML
A tabela seguinte descreve os comandos que pode usar para receber ajuda com a implementação, a gestão e a otimização de cargas de trabalho de IA/ML no GKE.
Comando | Tipo de resposta |
---|---|
"Quais são as configurações recomendadas do conjunto de nós para executar a preparação distribuída do TensorFlow em grande escala no GKE com GPUs?" | As recomendações para otimizar a preparação de ML do TensorFlow distribuído no GKE podem incluir o seguinte:
|
"Como posso usar GPUs no GKE para a preparação?" | Vista geral dos passos e considerações para configurar um cluster e cargas de trabalho para usar GPUs. |
"Dá-me um exemplo de implementação de um contentor de publicação de modelos no GKE." | Um exemplo com código de exemplo para implementar um contentor de publicação de modelos no GKE. O exemplo pode incorporar práticas recomendadas e ajuda a garantir a escalabilidade. |
"Que métricas devo acompanhar para avaliar a eficácia da minha configuração de equilíbrio de carga para inferência?" | A lista de métricas, como a distribuição de tráfego, a latência, as taxas de erro, a CPU e a utilização de memória, para obter estatísticas sobre o desempenho e o estado da configuração do equilíbrio de carga. |
Simplifique a resolução de problemas
A tabela seguinte descreve os comandos que pode usar para ajudar a analisar rapidamente os registos e identificar a causa essencial dos erros, poupando tempo e esforço.
Comando | Tipo de resposta |
---|---|
"Qual é o problema deste erro?Readiness probe failed: Get "https://10…./abcd": context deadline exceeded (Client.Timeout exceeded while awaiting headers) "
|
Explica que o kubelet não conseguiu executar a sondagem de prontidão para o contentor dentro do período de tempo limite definido e sugere potenciais causas e ações de resolução de problemas. |
"Por que motivo a minha implementação está a falhar com o erro ping: socket: Operation not permitted ?"nettools
|
Explica que o comando ping requer a capacidade de contexto de segurança CAP_NET_RAW e que, por predefinição, os contentores no Kubernetes são executados com um conjunto restrito de capacidades por motivos de segurança.
|
"O que significa quando o meu pod não é agendável devido ao erro Cannot schedule pods: No preemption victims found for incoming pod. "
|
Explica como o agendamento e a preempção de pods funcionam no Kubernetes. Lista os passos para resolver problemas relacionados com o motivo pelo qual não foi encontrado nenhum elemento publicitário de substituição. |
O que se segue?
- Saiba como escrever melhores comandos.
- Saiba como usar o painel do Gemini Cloud Assist.
- Leia o artigo Use o Gemini para obter assistência e desenvolvimento de IA.
- Saiba como o Gemini para Google Cloud usa os seus dados.