Introdução à solução de problemas do Cloud Run

Esta página descreve as estratégias comuns de solução de problemas para erros do Cloud Run. O Personalized Service Health publica todos os incidentes do Cloud Run que surgem da infraestrutura Google Cloud subjacente para identificar Google Cloud interrupções de serviço que afetam seus projetos. Também é recomendável configurar alertas sobre eventos do Personalized Service Health. Para informações sobre incidentes que afetam todos os Google Cloud serviços, consulte o painel Google Cloud Service Health.

Consulte as seções a seguir no guia de solução de problemas do Cloud Run para resolver problemas relacionados ao seu recurso do Cloud Run:

Estratégias de solução de problemas do Cloud Run

As seções a seguir explicam como aplicar estratégias gerais de solução de problemas para resolver seu erro. Se os erros persistirem mesmo depois de seguir as etapas no guia de solução de problemas, consulte Próximas etapas.

Gerar bons registros usando o Cloud Logging

É mais fácil resolver problemas com o recurso do Cloud Run se você tiver bons registros para depuração. Escreva os registros de forma que correlacionem os registros de contêiner com um registro de solicitação.

Com os registros correlacionados, é possível identificar a solicitação que precisa de mais análise, encontrar o rastreamento da solicitação e analisar a causa raiz do problema. Para mais informações sobre como gravar registros, consulte Gravar registros de contêiner.

Investigar instâncias usando a Análise de registros

Cada registro de solicitação no Cloud Run contém um campo instanceId que identifica uma instância que processa sua solicitação. Dependendo do valor de simultaneidade especificado, uma única instância pode processar várias solicitações ao mesmo tempo.

Quando você tem várias instâncias emitindo registros ao mesmo tempo, é necessário filtrar as instâncias para identificar as solicitações sequenciais que levam a uma falha.

Ao filtrar uma instância, é possível depurar problemas de desempenho específicos relacionados a inicializações a frio ou aumento da latência. Esses problemas também podem estar vinculados a variáveis declaradas em um escopo global, quando o valor é reutilizado em solicitações simultâneas subsequentes. Por exemplo, quando você cria um único objeto global de pool de conexões para a instância e o usa em várias solicitações.

Para filtrar uma instância específica no Explorador de registros, siga estas etapas:

  1. No console do Google Cloud , acesse a página do Explorador de registros:

    Acessar o Explorador de registros

  2. Selecione um projeto Google Cloud na parte de cima da página ou crie um novo.

  3. Selecione o recurso Revisão do Cloud Run para um serviço ou Job do Cloud Run para um job.

  4. Expanda uma entrada de registro para filtrar por uma instância específica.

  5. Clique no valor do ID da instância e selecione Mostrar entradas correspondentes.

Ao investigar instâncias, você pode usar as investigações do Gemini Cloud Assist para ter mais insights sobre seus registros. Para mais informações sobre diferentes maneiras de iniciar uma investigação usando o Explorador de registros, consulte Resolver problemas com o Gemini Cloud Assist Investigations na documentação do Gemini.

Resolver latências inesperadas de solicitações

Se você tiver problemas de latência, faça o seguinte:

  1. Verifique se a latência está afetando todas as solicitações ao recurso do Cloud Run ou apenas uma pequena porcentagem. O Cloud Run é integrado automaticamente ao Cloud Monitoring sem necessidade de configuração.

    Para conferir as métricas de latência de solicitações individuais, siga estas etapas:

    1. No console Google Cloud , acesse a página do Cloud Run:

      Acessar o Cloud Run

    2. Selecione o serviço ou os jobs na lista.

    3. Clique na guia MÉTRICAS para mostrar o painel Latências de solicitação.

    Para ver métricas de latência no Cloud Monitoring, selecione na lista Métricas, Revisão do Cloud Run > Latências de solicitação > Latência de solicitação.

    Para ver uma lista de todas as métricas do Cloud Run disponíveis e mais detalhes, consulte Google Cloud métricas no Cloud Monitoring.

  2. Identifique a solicitação com alta latência para entender a origem dela. Use o Cloud Trace ou o Cloud Logging para entender quanto tempo uma solicitação específica levou.

    Para identificar solicitações com alta latência usando o Cloud Logging, aplique o filtro traceSampled=true para correlacionar registros no Cloud Logging com rastreamentos no Cloud Trace. Para mais informações, consulte Integrar com o Cloud Logging.

    Às vezes, dependências como solicitações a outros serviços podem causar problemas de latência. Para identificar essas solicitações, você precisa ter um registro explícito direcionado a elas. Se você não gerar esses registros, isso poderá aparecer como um problema de latência originado de um serviço do Cloud Run.

    Além disso, considere avaliar picos de latência no contexto da janela de tempo escolhida. A importância de um pico é relativa. Um pico grande em uma janela pequena pode ser insignificante em uma janela maior, e vice-versa. Portanto, a janela de tempo afeta significativamente a interpretação dos dados de latência.

  3. Tente aumentar o número de instâncias mínimas para reduzir a latência das solicitações recebidas e evitar inicializações a frio. Também é recomendável modificar o código-fonte e ajustar as configurações de escalonamento para limitar o número de conexões a um serviço de back-end.

    Para mais informações, consulte Otimizar o desempenho.

Resolver problemas de conectividade

Se o serviço do Cloud Run estiver com problemas de conectividade, considere estas estratégias e ferramentas para diagnosticar o problema:

  • Arquivo secundário PCAP: para uma análise mais detalhada no nível da rede, implante um arquivo secundário PCAP ao lado do seu serviço do Cloud Run. Esse contêiner sidecar realiza uma captura de pacotes usando tcpdump no mesmo namespace de rede. O sidecar é desacoplado do contêiner de entrada principal e não requer modificações para realizar uma captura de pacote. Os sidecars também usam os próprios recursos, o que impede que o tcpdump concorra com os recursos alocados ao serviço principal.

  • Testes de conectividade e inteligência de rede para revisões do Cloud Run e funções do Cloud Run: realize verificações automatizadas no caminho de rede entre o recurso do Cloud Run e um endpoint. Isso ajuda a encontrar configurações incorretas que podem bloquear o tráfego de ou para o recurso do Cloud Run ao se conectar a uma instância de VM, um endereço IP ou um serviço gerenciado pelo Google.

  • Analise os registros do seu recurso do Cloud Run: os registros mostram mensagens de erro sobre problemas de conexão, como falhas, tempos limite ou conexões recusadas. Esses registros geralmente revelam se o problema de conexão é com seu aplicativo ou com a rede.

Resolver problemas com a ajuda do Gemini

Use o chat do Gemini Cloud Assist para analisar registros e resolver erros. Com a ajuda do Gemini, você pode identificar e resolver erros rapidamente usando os recursos de análise de registros da ferramenta, economizando tempo e esforço.

Para usar o Gemini Cloud Assist no Google Cloud console, faça o seguinte:

  1. Verifique se o Gemini Cloud Assist está configurado para sua conta de usuário e projeto do Google Cloud .

  2. Configure seu ambiente de desenvolvimento do Cloud Run no projeto do Google Cloud e verifique se você tem as permissões de implantação adequadas.

  3. Acesse a página do Cloud Run no Google Cloud console.

    Acessar o Cloud Run

  4. Na barra de ferramentas do console, selecione um projeto do Google Cloud . Use um projeto associado a um ID que você enviou depois de receber acesso ao Gemini Cloud Assist.

  5. Clique em brilho Abrir ou fechar o chat da Gemini AI.

    O painel do Gemini será aberto.

  6. Se necessário, clique em Aceitar se você concordar com os termos.

  7. Se você tiver uma dúvida sobre um aplicativo específico, forneça contexto acessando a página que mostra seu recurso antes de fazer a pergunta. Ao gerar uma resposta, o Gemini inclui informações sobre a página atual do console e o projeto.

  8. Insira um comando no painel do Gemini.

    A tabela a seguir mostra alguns exemplos de comandos para usar o Gemini Cloud Assist com o Cloud Run.

    Comando Tipo de resposta
    "Você pode explicar esta mensagem de erro que estou vendo nos registros de contêiner do Cloud Run?" Sem uma mensagem de erro específica no comando, a saída fornece orientações para solucionar problemas de mensagens de erro comuns nos registros de contêineres do Cloud Run.
    "Você pode explicar esta mensagem de erro que estou vendo nos registros do meu serviço do Cloud Run?

    HTTP 429 The request was aborted because there was no available instance. The Cloud Run service might have reached its maximum container instance limit or the service was otherwise not able to scale to incoming requests. This might be caused by a sudden increase in traffic, a long container startup time or a long request processing time."
    Explicação da mensagem de erro do Cloud Run e como resolver o problema.
    "Como corrigir a seguinte mensagem de erro ao implantar meu serviço do Cloud Run?

    HTTP 404: Not found
    Causas comuns do erro e como resolver o problema.
    "Meu serviço do Cloud Run não para de falhar. O que pode estar causando isso?" Abordagem para investigar a causa e resolver o problema.
    "Como saber se um erro 5XX que apareceu nos registros foi causado por uma interrupção no serviço de infraestrutura do Google?" Etapas para determinar a causa do erro 5XX.
    "Como identifico a causa deste erro: com.google.apps.framework.request.BadRequestException Project PROJECT has serving status SYSTEM_DISABLED and cannot be modified?" Sugere que o projeto Google Cloud foi administrativamente desativado no nível do sistema. Fornece etapas para investigar mais a fundo a causa.
    "Por que posso acessar meu serviço do Cloud Run em um navegador se defini ingress=internal?" Uma explicação do comportamento esperado ao configurar a opção ingress como internal. Inclui outros cenários em que o acesso pode parecer funcionar no seu navegador.

Para saber mais, acesse os recursos a seguir:

Usar as investigações do Gemini Cloud Assist

Além do chat interativo, o Gemini Cloud Assist pode realizar análises mais automatizadas e detalhadas com o Gemini Cloud Assist Investigations. Esse recurso é integrado diretamente a fluxos de trabalho, como a Análise de registros, e é uma ferramenta poderosa de análise de causa raiz.

Quando você inicia uma investigação de um erro ou um recurso específico, o Gemini Cloud Assist analisa registros, configurações e métricas. Ele usa esses dados para produzir observações e hipóteses classificadas sobre prováveis causas principais e, em seguida, fornece as próximas etapas recomendadas. Você também pode transferir esses resultados para um caso de suporte do Google Cloud para fornecer um contexto valioso que pode ajudar a resolver o problema mais rapidamente.

Para mais informações sobre diferentes maneiras de iniciar uma investigação, consulte Resolver problemas com o Gemini Cloud Assist Investigations na documentação do Gemini.

A seguir

Se você não encontrar uma solução para seu problema na documentação do Cloud Run, siga estas etapas: