Problemas e limitações

Esta página descreve alguns dos problemas e limitações que você pode encontrar ao usar o Cloud Tasks.

Ordem de execução

Com exceção das tarefas programadas para serem executadas no futuro, as filas de tarefas não seguem uma ordem de execução. Não há garantias ou melhores tentativas da execução das tarefas em qualquer ordem específica. Especificamente, não há garantias de que tarefas antigas serão executadas se a fila não estiver completamente vazia. Em alguns casos, as tarefas mais recentes são executadas antes das mais antigas, e os padrões relacionados podem mudar sem aviso prévio.

Execução duplicada

O Cloud Tasks visa uma semântica estrita de "executar exatamente uma vez". No entanto, em situações em que há um conflito entre a garantia de execução e a execução duplicada, o serviço favorece a primeira. Assim, o número de execuções duplicadas não é zero. Os desenvolvedores precisam tomar medidas para garantir que a execução duplicada não seja um evento catastrófico. Na produção, mais de 99,999% das tarefas são executadas apenas uma vez.

Limitações de recursos

A causa mais comum de atrasos em filas de processamento imediato é o esgotamento de recursos nas instâncias de destino. Se um usuário estiver tentando executar 100 tarefas por segundo em instâncias de front-end que só podem processar 10 solicitações por segundo, um backlog será gerado. Isso geralmente se manifesta em dois problemas, que normalmente podem ser resolvidos com o aumento do número de instâncias processando solicitações.

Erros de retirada e taxas impostas

Os servidores sobrecarregados podem começar a retornar erros de espera: HTTP 503 (para destinos do App Engine) ou HTTP 429 ou 5xx (para destinos externos). O Cloud Tasks reage a esses erros diminuindo a velocidade de execução até que os erros parem. Essa limitação do sistema impede a sobrecarga do worker. As configurações especificadas pelo usuário não são alteradas.

O estrangulamento do sistema ocorre nas seguintes circunstâncias:

  • O Cloud Tasks desiste de todos os erros. Normalmente, o backoff especificado em rate limits é usado. No entanto, se o worker retornar HTTP 429 Too Many Requests, 503 Service Unavailable ou a taxa de erros for alta, o Cloud Tasks usará uma taxa de espera mais alta. A nova tentativa especificada no cabeçalho de resposta HTTP Retry-After é considerada.

  • Para evitar picos de tráfego e suavizar aumentos repentinos, os envios são aumentados lentamente quando a fila é recém-criada ou está inativa e se um grande número de tarefas de repente fica disponível para envio (devido a picos nas taxas de criação de tarefas, à fila ser despausada ou a muitas tarefas que são programadas ao mesmo tempo).

Picos de latência e número máximo de tarefas concorrentes

Servidores sobrecarregados também podem responder com grandes aumentos de latência. Nessa situação, as solicitações permanecem abertas por mais tempo. As tarefas podem não ser executadas na taxa esperada porque as filas têm um número máximo de tarefas simultâneas. Aumentar o max_concurrent_tasks para as filas afetadas pode ajudar em situações em que o valor foi definido como muito baixo, introduzindo um limite de taxa artificial. No entanto, aumentar o max_concurrent_tasks provavelmente não vai aliviar a pressão de recursos subjacentes.

Aumento de problemas com tarefas de longa duração

As filas do Cloud Tasks aumentam a saída em parte com base no número de tarefas enviadas anteriormente. Se o gerenciador de tarefas demorar um período considerável (em minutos) para concluir uma tarefa e retornar uma resposta de sucesso, poderá haver um atraso na taxa de ampliação da fila.

Visualizar mais de 5.000 tarefas

Se você tiver mais de 5.000 tarefas, algumas delas não vão aparecer no console do Google Cloud . Use a CLI gcloud para conferir todas as tarefas.