Como ativar a diminuição da conexão

A diminuição da conexão é um processo para garantir que as solicitações atuais em andamento tenham tempo para serem concluídas quando uma VM é removida de um grupo de instâncias ou quando um endpoint for removido de um NEG zonal.

Para ativar a diminuição da conexão, defina um tempo limite de diminuição da conexão no serviço de back-end. A duração do tempo limite precisa ser de 0 a 3.600 segundos.

Para a duração especificada do tempo limite, as solicitações atuais da VM removida precisam de tempo para serem concluídas. O balanceador de carga não envia novas solicitações para a VM removida. Depois que a duração do tempo limite for atingida, todas as conexões restantes com a VM serão fechadas.

A diminuição da conexão começa sempre que você faz o seguinte:

Pode levar até 60 segundos após decorrer o tempo limite especificado para a instância ser encerrada.

Quando você ativa a diminuição de conexão em vários serviços de back-end que compartilham os mesmos grupos de instâncias ou NEGs, o maior tempo limite é usado. Por exemplo, suponha que o mesmo grupo de instâncias ou NEG zonal seja um back-end para dois serviços de back-end, em que um serviço de back-end tem um tempo limite de diminuição de conexão de 100 segundos e o outro tem um tempo limite de diminuição de 200 segundos. O Google Cloud usa 200 segundos como tempo limite de diminuição da conexão efetiva para que as conexões existentes possam existir por 200 segundos antes de serem encerradas pelo Google Cloud. Se o back-end for um grupo de instâncias gerenciadas, as operações que excluírem a instância terão um atraso de pelo menos 200 segundos.

Especificações

  • A diminuição da conexão está disponível para serviços de back-end que fazem parte dos seguintes balanceadores de carga:

  • Quando um tempo limite de diminuição da conexão é definido e uma instância é removida do grupo ou um endpoint é removido de um NEG zonal, os balanceadores de carga do Google Cloud se comportam da seguinte maneira:

    • Nenhuma nova conexão é enviada para a instância ou o endpoint removido.

    • As sessões TCP ativas compatíveis com conexões existentes com a instância ou endpoint removido podem persistir até que o tempo limite de diminuição da conexão tenha expirado.

    • Se você não definir um tempo limite de diminuição de conexão, o Google Cloud encerrará as conexões existentes na instância ou endpoint removido o mais rápido possível. Definir o tempo limite de diminuição da conexão como zero (0) tem o mesmo efeito.

Como ativar a diminuição da conexão

Console

  1. Acesse a página "Balanceamento de carga" no Console do Google Cloud.
    Acessar a página "Balanceamento de carga"
  2. Clique em Editar para o balanceador de carga ou crie um novo balanceador de carga.
  3. Clique em Configuração de back-end.
  4. Clique em Configurações avançadas, no final do seu serviço de back-end.
  5. No campo Tempo limite de diminuição da conexão, insira um valor de 0 a 3600. A configuração 0 desativa a diminuição da conexão.

gcloud

Ative a diminuição da conexão em um serviço de back-end novo ou existente usando a sinalização --connection-draining-timeout. Os exemplos a seguir demonstram como alterar o tempo limite de diminuição da conexão:

  • Para um balanceador de carga HTTP(S) externo, balanceador de carga de proxy SSL ou balanceador de carga de proxy TCP:

    gcloud compute backend-services update BACKEND_SERVICE \
        --global \
        --connection-draining-timeout=CONNECTION_TIMEOUT_SECS
    
  • Para um balanceador de carga TCP/UDP interno existente ou balanceador de carga HTTP(S) interno:

    gcloud compute backend-services update BACKEND_SERVICE \
        --region=REGION \
        --connection-draining-timeout=CONNECTION_TIMEOUT_SECS
    

Substitua os marcadores por valores válidos:

  • BACKEND_SERVICE: o serviço de back-end do balanceador de carga.
  • CONNECTION_TIMEOUT_SECS: o número de segundos a serem aguardados antes que as conexões existentes com instâncias ou endpoints sejam encerradas, de 0 a 3600 segundos, inclusive. A configuração 0 desativa a diminuição da conexão. O tempo limite de diminuição da conexão se aplica a todos os back-ends do serviço de back-end.

    Também é possível usar o comando gcloud compute backend-services edit para atualizar um serviço de back-end existente.

API

Para ativar a diminuição da conexão na API ao criar ou atualizar uma instância ou endpoint, faça uma solicitação ao respectivo URI da API para incluir o campo connectionDraining no corpo da solicitação. Os exemplos a seguir demonstram como definir esse atributo editando um serviço de back-end existente. Para informações sobre outros atributos obrigatórios, consulte a documentação de cada balanceador de carga.

Para balanceadores de carga de HTTP(S) externos, de proxy SSL e de proxy TCP:

PATCH https://www.googleapis.com/compute/v1/projects/PROJECT_ID/global/backendServices

Para balanceadores de carga TCP/UDP internos e HTTP(S) internos:

PATCH https://www.googleapis.com/compute/v1/projects/PROJECT_ID/region/REGION/backendServices

{
   "name": "BACKEND_SERVICE",
   "connectionDraining": {
     "drainingTimeoutSec": CONNECTION_TIMEOUT_SECS
   }
}

em que:

  • PROJECT_ID é o ID do projeto que contém o balanceador de carga.
  • BACKEND_SERVICE é o serviço de back-end usado pelo balanceador de carga.
  • CONNECTION_TIMEOUT_SECS é o tempo em segundos que será aguardado antes de as instâncias ou os endpoints serem removidos do grupo de instâncias ou NEG, de 0 a 3.600 segundos, inclusive. Essa duração de tempo limite se aplica a todos os grupos de instâncias ou NEGs que fazem parte do serviço de back-end.

A seguir

Para informações gerais sobre serviços de back-end, consulte Visão geral dos serviços de back-end.