El vaciado de conexiones es un proceso que garantiza que las solicitudes existentes en curso tengan tiempo para completarse cuando se quita una instancia de máquina virtual (VM) de un grupo de instancias o cuando se quita un extremo de los grupos de extremos de red (NEG) que es zonal dentro del alcance.
La información de esta página solo se aplica a los grupos de instancias y a los siguientes tipos de NEG que tienen un alcance zonal:
Para habilitar el vaciado de conexiones, debes establecer un tiempo de espera de vaciado de conexiones en el servicio de backend. La duración del tiempo de espera debe ser entre 0 y 3,600 segundos.
Durante la duración especificada del tiempo de espera, las solicitudes existentes de la VM o wl extremo que se quitó tienen tiempo para completarse. El balanceador de cargas no envía conexiones nuevas a la VM o al extremo que se quitó. Una vez que transcurre el tiempo de espera, el balanceador de cargas deja de enviar todo el tráfico a la VM o al extremo que se quitó.
El vaciado de conexiones se inicia en los siguientes casos:
- Cuando de forma manual, quitas una VM del grupo de instancias.
- Cuando quitas una instancia de un grupo de instancias administrado mediante una llamada
resize()
,deleteInstances()
,recreateInstances()
oabandonInstances()
. - Cuando se quita un grupo de instancias de un servicio de backend. Esta función no es compatible con los balanceadores de cargas de red de transferencia internos.
- Cuando Google Cloud borra una instancia como parte del ajuste de escala automático.
- Cuando aplicas una actualización al grupo de instancias administrado mediante el Actualizador de grupos de instancias administrados.
- Cuando quitas un extremo de un NEG por zonas de forma manual.
Pueden pasar hasta 60 segundos a partir de que transcurrió el tiempo de espera especificado para que se cierre la instancia.
Si habilitas el vaciado de conexiones en varios servicios de backend que comparten los mismos grupos de instancias o NEG, se usará el valor mayor de tiempo de espera. Por ejemplo, supongamos que el mismo grupo de instancias o NEG zonal es un backend para dos servicios de backend, y que un servicio de backend tiene un tiempo de espera de vaciado de conexiones de 100 segundos, mientras que el otro tiene un tiempo de espera de vaciado de conexiones de 200 segundos. Google Cloud usa 200 segundos como el tiempo de espera de vaciado de conexiones en la práctica para que las conexiones existentes puedan existir durante 200 segundos antes de que Google Cloud las interrumpa. Si el backend es un grupo de instancias administrado, las operaciones que borran la instancia se retrasan al menos 200 segundos.
A continuación, se muestra una lista de especificaciones sobre el vaciado de conexiones:
El vaciado de conexiones está disponible para los servicios de backend que forman parte de los siguientes balanceadores de cargas:
- Balanceador de cargas de aplicaciones externo
- Balanceador de cargas de aplicaciones interno
- Balanceador de cargas de red del proxy externo
- Balanceador de cargas de red del proxy interno
- Balanceador de cargas de red de transferencia interno
- Balanceador de cargas de red de transferencia externo basado en servicios de backend
Tanto los balanceadores de cargas de red de transferencia interna como los externos admiten el vaciado de conexiones para TCP, UDP (versión preliminar) y otros protocolos que no son TCP.
El vaciado de conexiones también está disponible para los servicios de backend que forman parte de las implementaciones de Cloud Service Mesh.
Cuando se configura un tiempo de espera para el vaciado de conexiones y se quita una instancia del grupo de instancias o de un extremo de un NEG zonal, los balanceadores de cargas de Google Cloud y Cloud Service Mesh se comportan de la siguiente manera:
No se envían conexiones nuevas a la instancia o al extremo que se quitó.
Las sesiones de actividad que admiten conexiones existentes a la instancia o al extremo que se quitó pueden persistir hasta que haya transcurrido el tiempo de espera de vaciado de conexiones. Una vez que finaliza el tiempo de espera, Google Cloud finaliza las conexiones existentes en la instancia o el extremo que se quitó.
Si no estableces un tiempo de espera para el vaciado de conexiones o si el tiempo de espera para el vaciado de conexiones se establece en cero (0), Google Cloud finaliza las conexiones existentes en la instancia o el extremo que se quitó lo antes posible.
Si usas la agrupación de conexiones, es posible que veas que las solicitudes nuevas, que usan una conexión establecida anteriormente, aún se reciben en las VMs que se están desviando, lo que causa errores de conexión cuando esas VMs se borran a la larga.
Para habilitar el vaciado de conexiones, completa los siguientes pasos.
Console
Actualizar un balanceador de cargas
- Ve a la página Balanceo de cargas en la consola de Google Cloud.
Ir a Balanceo de cargas - Haz clic en Editar para tu balanceador de cargas o crea uno nuevo.
- Haga clic en Configuración de backend.
- Haz clic en Configuración avanzada en la parte inferior de tu servicio de backend.
- En el campo Tiempo de espera para el vaciado de conexiones, ingresa un valor entre
0
y3600
. Si ingresas0
, se inhabilita el vaciado de conexiones.
Actualiza Cloud Service Mesh
- Ve a la página Cloud Service Mesh en la consola de Google Cloud.
Ir a Cloud Service Mesh - Haz clic en el Nombre del servicio.
- Haz clic en Configuración avanzada en la parte inferior de tu servicio de backend.
- En el campo Tiempo de espera para el vaciado de conexiones, ingresa un valor entre
0
y3600
. Si ingresas0
, se inhabilita el vaciado de conexiones. - Haz clic en Guardar.
gcloud
Habilita el vaciado de conexiones en un servicio de backend nuevo o existente mediante la marca --connection-draining-timeout
. En los siguientes ejemplos, se muestra cómo cambiar el tiempo de espera de vaciado de conexiones:
Para un balanceador de cargas global o entre regiones existente:
gcloud compute backend-services update BACKEND_SERVICE \ --global \ --connection-draining-timeout=CONNECTION_TIMEOUT_SECS
Para un balanceador de cargas regional existente:
gcloud compute backend-services update BACKEND_SERVICE \ --region=REGION \ --connection-draining-timeout=CONNECTION_TIMEOUT_SECS
Reemplaza los marcadores de posición por valores válidos:
- BACKEND_SERVICE: El servicio de backend que estás actualizando.
- REGION: si corresponde, es la región del servicio de backend que estás actualizando
CONNECTION_TIMEOUT_SECS: La cantidad de segundos que se espera antes de que finalicen las conexiones a las instancias o a los extremos existentes, entre
0
y3600
segundos. Si ingresas0
, se inhabilita el vaciado de conexiones. El tiempo de espera de vaciado de conexiones se aplica a todos los backends del servicio de backend.También puedes usar el comando
gcloud compute backend-services edit
para actualizar un servicio de backend existente.
API
Para habilitar el vaciado de conexiones en la API cuando creas o actualizas una instancia o un extremo, realiza una solicitud al URI de la API correspondiente y, luego, incluye el campo connectionDraining
en el cuerpo de tu solicitud. En los siguientes ejemplos, se muestra cómo configurar ese atributo mediante la edición de un servicio de backend existente. Para obtener información sobre otros atributos obligatorios, consulta la documentación de cada balanceador de cargas.
Para un balanceador de cargas global o entre regiones existente:
PATCH https://www.googleapis.com/compute/v1/projects/PROJECT_ID/global/backendServices
Para un balanceador de cargas regional existente:
PATCH https://www.googleapis.com/compute/v1/projects/PROJECT_ID/region/REGION/backendServices
{ "name": "BACKEND_SERVICE", "connectionDraining": { "drainingTimeoutSec": CONNECTION_TIMEOUT_SECS } }
Donde:
PROJECT_ID
es el ID del proyecto que contiene tu balanceador de cargas o la implementación de Cloud Service Mesh.BACKEND_SERVICE
es el servicio de backend que usa tu balanceador de cargas o la implementación de Cloud Service Mesh.CONNECTION_TIMEOUT_SECS
es la cantidad de segundos que debes esperar antes de que las instancias o los extremos se quiten del grupo de instancias o NEG, entre 0 y 3,600 segundos, inclusive. Esta duración de tiempo de espera se aplica a todos los grupos de instancias o NEG a los que hace referencia el servicio de backend.
¿Qué sigue?
Para obtener información general sobre los servicios de backend, consulta Descripción general de los servicios de backend.