Descripción general de la administración avanzada del tráfico para las APIs de balanceo de cargas

Este documento está dirigido a los administradores de plataformas o mallas y a los desarrolladores de servicios que tengan un nivel intermedio o avanzado de conocimiento de Cloud Service Mesh y de conceptos de la malla de servicios, y que determinen y configuren cómo se administra el tráfico en una implementación de Cloud Service Mesh. Este documento solo se aplica a las APIs de balanceo de cargas, no a las APIs de enrutamiento de servicios. Si tu implementación de Cloud Service Mesh usa las APIs de enrutamiento de servicios, consulta Descripción general de la administración avanzada del tráfico.

Cloud Service Mesh proporciona funciones avanzadas de administración de tráfico que te brindan un control detallado sobre cómo se maneja el tráfico. Cloud Service Mesh admite los siguientes casos de uso:

  • Enrutamiento detallado de las solicitudes a uno o más servicios
  • División del tráfico basada en el peso para distribuir el tráfico entre varios servicios
  • Políticas de duplicación del tráfico que envían solicitudes a un servicio de depuración y copias a otro
  • Distribución de tráfico más precisa en los backends de un servicio para mejorar el balanceo de cargas

Estas funciones de administración avanzada del tráfico te permiten cumplir tus objetivos de disponibilidad y rendimiento. Uno de los beneficios de usar Cloud Service Mesh para estos casos de uso es que puedes actualizar la forma en que se administra el tráfico sin tener que modificar el código de la aplicación.

  • Cuando usas el proxy HTTP de destino a fin de configurar los proxies Envoy para enviar solicitudes HTTP, todas las capacidades de este documento están disponibles.

  • Cuando usas servicios o aplicaciones de gRPC sin proxy con Cloud Service Mesh, algunas de las funciones no están disponibles.

  • Cuando usas el proxy TCP de destino para configurar los proxies de Envoy a fin de enviar solicitudes de TCP, ninguna de las funciones está disponible porque no hay un mapa de URL en las configuraciones con un proxy TCP de destino.

Para obtener más detalles, consulta la página de funciones.

Para configurar la administración avanzada del tráfico, usa el mismo mapa de reglas de enrutamiento y los recursos de los servicios de backend que usas cuando configuras Cloud Service Mesh. En cambio, Cloud Service Mesh configura los proxies de Envoy y las aplicaciones de gRPC sin proxy para aplicar las políticas de administración avanzada del tráfico que configuraste.

En un alto nivel, puedes seguir los siguientes pasos:

  1. Configura el mapa de reglas de enrutamiento para que realice las siguientes acciones, según las características de la solicitud saliente:

    1. Selecciona el servicio de backend al que se enrutan las solicitudes.

    2. Realiza acciones adicionales (opcional)

  2. Configura el servicio de backend a fin de controlar cómo se distribuye el tráfico en los backends y extremos después de seleccionar un servicio de destino.

Configuración de filtros

Una de las responsabilidades principales de Cloud Service Mesh es generar información de configuración a partir de la regla de reenvío, el proxy de destino y el mapa de URL, y, luego, enviar esa información a los clientes de Cloud Service Mesh, por ejemplo, proxies de Envoy y aplicaciones de gRPC. Cloud Service Mesh controla tu malla de servicios mediante el envío de información de configuración a sus clientes, que les indica cómo comportarse y cómo enrutar el tráfico. Cloud Service Mesh es el plano de control.

Cuando creas o actualizas información de configuración en Cloud Service Mesh, esta plataforma traduce esta configuración a un lenguaje que sus clientes puedan comprender. De forma predeterminada, Cloud Service Mesh comparte esta configuración con todos sus clientes. En algunos casos, es posible que desees personalizar qué clientes de Cloud Service Mesh reciben información de configuración específica, en otras palabras, filtrar la configuración para clientes específicos.

Si bien esta es una función avanzada, en los siguientes ejemplos, se muestra cuándo puede ayudarte la configuración de filtros:

  • Tu organización usa el modelo de herramientas de redes de VPC compartida, y varios equipos usan Service Mesh de Cloud en diferentes proyectos de servicio. Si deseas aislar la configuración de otros proyectos de servicio, puedes filtrar la configuración para que los clientes específicos de Cloud Service Mesh reciban solo un subconjunto de la configuración.
  • Tienes una gran cantidad de reglas de enrutamiento y servicios configurados en Cloud Service Mesh y deseas evitar el envío de una cantidad inusualmente grande de configuración a cada cliente de Cloud Service Mesh. Ten en cuenta que un cliente que necesita evaluar una solicitud saliente mediante una configuración grande y compleja puede tener un menor rendimiento que un cliente que solo necesita evaluar una solicitud con una configuración optimizada.

El filtrado de configuración se basa en el concepto de filtros de metadatos:

  1. Cuando se conecta un cliente de Cloud Service Mesh, presenta información de su archivo de arranque a Cloud Service Mesh.
  2. Esta información incluye el contenido de los campos de metadatos, en forma de pares clave-valor, que especificas en el archivo de arranque cuando implementas los proxies de Envoy y las aplicaciones de gRPC.
  3. Puedes agregar filtros de metadatos en la regla de reenvío. Se filtra toda la configuración vinculada a la regla de reenvío.
  4. Puedes agregar filtros de metadatos en el mapa de URLs. El filtro de metadatos se aplica en función del enrutamiento por ruta de acceso.
  5. Cloud Service Mesh comparte la configuración solo con clientes que presentan metadatos que coinciden con las condiciones del filtro de metadatos.

Para obtener información sobre cómo configurar filtros de metadatos para Envoy, consulta Establece el filtrado de configuración según la coincidencia de MetadataFilter.

Acciones y enrutamiento del tráfico

En Cloud Service Mesh, el mapa de reglas de enrutamiento hace referencia a la combinación de la regla de reenvío, el proxy de destino y los recursos del mapa de URL. Todas las funciones de administración avanzada del tráfico relacionadas con el enrutamiento y las acciones se configuran mediante el mapa de URL.

En las siguientes secciones, se describen las funciones avanzadas de administración del tráfico que puedes configurar en el mapa de reglas de enrutamiento.

Cómo administrar solicitudes

Cuando un cliente envía una solicitud, esta se controla como se describe en los siguientes pasos:

  1. La solicitud coincide con un mapa de reglas de enrutamiento específico de la siguiente manera:

    • Si usas Envoy:

      • El puerto y la dirección IP de destino de la solicitud se comparan con el puerto y la dirección IP de las reglas de reenvío en todos los mapas de reglas de enrutamiento. Solo se consideran los mapas de reglas de enrutamiento con reglas de reenvío que tengan el esquema de balanceo de cargas INTERNAL_SELF_MANAGED.
      • La regla de reenvío que coincide con la solicitud hace referencia a un proxy HTTP o gRPC de destino, que hace referencia a un mapa de URL. Este mapa de URL contiene información que se usa para el enrutamiento y las acciones.
    • Si usas gRPC sin proxy:

      • Un cliente de gRPC que usa el esquema de resolución de nombres de xds no realiza la búsqueda de DNS para resolver el nombre de host en el URI del canal. En su lugar, este cliente resuelve el hostname[:port] en el URI de destino mediante el envío de una solicitud LDS a Cloud Service Mesh.
      • Solo se compara el puerto de una regla de reenvío con el esquema de balanceo de cargas INTERNAL_SELF_MANAGED con el puerto en el URI de destino (por ejemplo, xds:///example.hostname:8080). La dirección IP de la regla de reenvío no se usa. El valor predeterminado del puerto es 80 si no se especifica ningún puerto en el URI de destino.
      • La regla de reenvío que coincide con la solicitud hace referencia a un proxy de gRPC de destino, que hace referencia a un mapa de URL. Este mapa de URL contiene información que se usa para el enrutamiento y las acciones.
      • Si más de una regla de reenvío coincide con la solicitud, se usa para el enrutamiento y las acciones el mapa de URL que contiene la regla de host que coincide con hostname[:port] en el URI de destino.
  2. Cuando se determina el mapa de URL adecuado, se evalúa el mapa de URL para determinar el servicio de backend de destino y, de forma opcional, aplicar acciones.

  3. Una vez que se selecciona el servicio de backend de destino, el tráfico se distribuye entre los backends o extremos de ese servicio, según la configuración del recurso del servicio de backend.

El segundo paso se describe en la siguiente sección, Enrutamiento simple basado en el host y la ruta de acceso. El tercer paso se analiza en Enrutamiento y acciones avanzados.

Enrutamiento simple basado en el host y la ruta de acceso

Cloud Service Mesh admite un esquema de enrutamiento simplificado y un esquema más avanzado. En el esquema simple, debes especificar un host y, de forma opcional, una ruta de acceso. El host y la ruta de acceso de la solicitud se evalúan para determinar el servicio al que se debe enrutar una solicitud.

  • El host de la solicitud es la parte del nombre de dominio de una URL, por ejemplo, la parte del host de la URL http://example.com/video/ es example.com.
  • La ruta de acceso de la solicitud es la parte de la URL que sigue al nombre de host, por ejemplo, la parte de la ruta de acceso de la URL http://example.com/video/ es /video.

Configura el enrutamiento simple basado en el host y la ruta de acceso en el mapa de reglas de enrutamiento, que consta de los siguientes elementos:

  • Una regla de reenvío global
  • Un proxy HTTP de destino, un proxy HTTPS de destino o un proxy de gRPC de destino
  • Un mapa de URL

La mayor parte de la configuración se realiza en el mapa de URL. Después de crear el mapa de reglas de enrutamiento inicial, solo debes modificar la parte del mapa de URL del mapa de reglas de enrutamiento. Las reglas de ruta de acceso tienen acciones similares a las del siguiente diagrama.

Enrutamiento basado en recursos de host y ruta de acceso
Enrutamiento basado en recursos de host y ruta de acceso (haz clic para ampliar)

La regla más simple es una regla predeterminada, en la que solo especificas una regla de host comodín (*) y un comparador de rutas de acceso con un servicio predeterminado. Después de crear la regla predeterminada, puedes agregar reglas adicionales que especifiquen diferentes hosts y rutas de acceso. Las solicitudes salientes se evalúan según estas reglas de la siguiente manera:

  • Si el host de una solicitud (como example.com) coincide con una regla de host, sucede lo siguiente:

    1. Se evalúa el comparador de rutas de acceso.
    2. Cada comparador de rutas de acceso contiene una o más reglas de ruta de acceso que se evalúan en función de la ruta de acceso de la solicitud.
    3. Si se encuentra una coincidencia, la solicitud se enruta al servicio especificado en la regla de ruta de acceso.
    4. Si la regla de host coincide, pero no hay reglas de ruta de acceso, las solicitudes se enrutan a un servicio predeterminado que contiene cada comparador de rutas de acceso.
  • Si la solicitud no coincide con ninguna de las reglas de host que especificaste, se enruta al servicio especificado en la regla predeterminada.

Para obtener más información sobre los campos de recursos del mapa de URL y cómo funcionan, consulta la página de la API de REST de urlMaps.

Enrutamiento y acciones avanzados

Puedes configurar reglas avanzadas para enrutar solicitudes y realizar acciones si deseas hacer más que enrutar una solicitud basada en el host y la regla de acceso de una solicitud.

Enrutamiento avanzado.
Enrutamiento avanzado (haz clic para ampliar)

En un nivel alto, el enrutamiento y las acciones avanzados funcionan de la siguiente manera:

  1. Al igual que con el enrutamiento simple, el host de la solicitud se compara con las reglas de host que configuras en el mapa de URL. Si el host de una solicitud coincide con una regla de host, se evalúa el comparador de rutas de acceso de la regla de host.
  2. El comparador de rutas de acceso contiene una o más reglas de enrutamiento que se evalúan según la solicitud. Estas reglas de enrutamiento se evalúan en orden de prioridad. Para ello, se hacen coincidir los atributos de la solicitud (host, ruta de acceso, encabezado y parámetros de consulta) de acuerdo con condiciones de coincidencia específicas, por ejemplo, coincidencia de prefijo.
  3. Después de seleccionar una regla de enrutamiento, puedes aplicar acciones. La acción predeterminada es enrutar la solicitud a un solo servicio de destino, pero también puedes configurar otras acciones.

Enrutamiento avanzado

El enrutamiento avanzado es similar al enrutamiento simple descrito antes, con la excepción de que puedes especificar la prioridad de las reglas y las condiciones de coincidencia adicionales.

Con el enrutamiento avanzado, debes especificar una sola prioridad para cada regla. Esta prioridad determina el orden en el que se evalúan las reglas de enrutamiento; los valores con una prioridad más baja prevalecen sobre los de mayor prioridad. Cuando una solicitud coincide con una regla, esta se aplica y otras se ignoran.

El enrutamiento avanzado también admite condiciones de coincidencia adicionales. Por ejemplo, puedes especificar que una regla coincida con el encabezado de una solicitud si el nombre de ese encabezado coincide de manera exacta o parcial, por ejemplo, según el prefijo o sufijo. Puede coincidir según la evaluación del nombre del encabezado en función de una expresión regular o de acuerdo con otros criterios, como verificar la presencia de un encabezado.

Para ver las condiciones de coincidencia adicionales y los detalles de headerMatches y queryParameterMatches, consulta la página API de REST de urlMaps.

Si combinas el host, la ruta de acceso, el encabezado, los parámetros de consulta con prioridades y las condiciones de coincidencia, puedes crear reglas muy expresivas que se adapten a tus requisitos exactos de administración del tráfico. Para obtener más información, consulta la siguiente tabla:

Aplicación basada en HTTP Aplicación basada en gRPC
Hosts HTTP en comparación con hosts de gRPC

El host es la parte del nombre de dominio de la URL a la que llama la aplicación.

Por ejemplo, la parte del host de la URL http://example.com/video/ es example.com.

El host es el nombre que un cliente usa en el URI del canal para conectarse a un servicio específico.

Por ejemplo, la parte del host del URI del canal xds:///example.com es example.com.

Rutas de acceso de HTTP en comparación con rutas de acceso de gRPC

La ruta de acceso es la parte de la URL que sigue al nombre de host.

Por ejemplo, la parte de la ruta de acceso de la URL http://example.com/video es /video.

La ruta de acceso se encuentra en el encabezado :path de la solicitud HTTP/2 y se parece a /SERVICE_NAME/METHOD_NAME.

Por ejemplo, si llamas al método Download en el servicio de gRPC de Example, el contenido del encabezado :path se verá como /Example/Download.

Otros encabezados de gRPC (metadatos) gRPC admite el envío de metadatos entre el cliente de gRPC y el servidor de gRPC para proporcionar información adicional sobre una llamada RPC. Estos metadatos tienen un formato de pares clave-valor que se transfieren como encabezados en la solicitud HTTP/2.

Acciones

Cloud Service Mesh te permite especificar acciones que realizan los proxies de Envoy o las aplicaciones de gRPC sin proxy cuando controlan una solicitud. Las siguientes acciones se pueden configurar mediante Cloud Service Mesh.

Acción Nombre del campo de la API Descripción
Redireccionamientos urlRedirect Muestra un código de respuesta 3xx configurable. También establece el encabezado de respuesta Location con el URI apropiado, lo que reemplaza el host y la ruta de acceso como se especifica en la acción de redireccionamiento.
Reescritura de URL urlRewrite Vuelve a escribir la parte del nombre de host de la URL, la parte de la ruta de la URL o ambas, antes de enviar una solicitud al servicio de backend seleccionado.
Transformaciones del encabezado headerAction Agrega o quita encabezados de la solicitud antes de enviar una solicitud al servicio de backend. También puede agregar o quitar los encabezados de respuesta después de recibir una respuesta del servicio de backend.
Duplicación de tráfico requestMirrorPolicy

Además de reenviar la solicitud al servicio de backend seleccionado, envía una solicitud idéntica al servicio de backend duplicado y configurado en una base de enviar y olvidar. El balanceador de cargas no espera una respuesta del backend al que envía la solicitud duplicada.

La duplicación es útil para probar una versión nueva de un servicio de backend. También puedes usarla para depurar errores de producción en una versión de depuración de tu servicio de backend, en lugar de hacerlo en la versión de producción.

División de tráfico basada en el peso weightedBackendServices

Permite que el tráfico de una regla coincidente se distribuya a varios servicios de backend, proporcional a un peso definido por el usuario asignado al servicio de backend individual.

Esta función es útil para configurar implementaciones publicadas en etapa de pruebas o pruebas A/B. Por ejemplo, la acción de enrutamiento se podría configurar, de manera que el 99% del tráfico se envíe a un servicio que ejecuta una versión estable de una aplicación, mientras que el 1% del tráfico se envíe a un servicio independiente que ejecuta una versión más reciente de esa aplicación.

Reintentos retryPolicy Configuran las condiciones en las que el balanceador de cargas reintenta enviar solicitudes fallidas, cuánto espera el balanceador de cargas antes de volver a intentarlo y la cantidad máxima de reintentos permitidos.
Tiempo de espera timeout Especifica el tiempo de espera para la ruta seleccionada. El tiempo de espera se calcula desde el momento en que la solicitud se procesa por completo hasta el momento en que la respuesta se procesa por completo. El tiempo de espera incluye todos los reintentos.
Inyección de fallas faultInjectionPolicy Presenta errores cuando se entregan solicitudes para simular fallas, incluida la latencia alta, la sobrecarga del servicio, las fallas del servicio y la partición de la red. Esta característica es útil para probar la resiliencia de un servicio ante fallas simuladas.
Políticas de seguridad corsPolicy Las políticas de uso compartido de recursos entre dominios (CORS) controlan la configuración para aplicar las solicitudes de CORS.

Para obtener más información sobre las acciones y cómo funcionan, consulta la página de la API de REST de urlMaps.

En cada regla de enrutamiento, puedes especificar una de las siguientes acciones de enrutamiento (denominadas Acciones principales en la consola de Google Cloud):

  • Enrutar el tráfico a un solo servicio (service)
  • Dividir el tráfico entre varios servicios (weightedBackendServices)
  • Redireccionar las URL (urlRedirect)

Además, puedes combinar cualquiera de las acciones de ruta mencionadas antes con una o más de las siguientes acciones de ruta (llamadas Acciones de complementos en la consola de Cloud):

  • Manipular los encabezados de respuesta/solicitud (headerAction)
  • Tráfico de duplicación (requestMirrorPolicy)
  • Reescribe la ruta de acceso, el host o ambos de la URL (urlRewrite)
  • Reintentar con las solicitudes que fallaron (retryPolicy)
  • Configurar el tiempo de espera (timeout)
  • Ingresar errores en un porcentaje del tráfico (faultInjectionPolicy)
  • Agregar política de CORS (corsPolicy)

Debido a que las acciones están asociadas con reglas de enrutamiento específicas, el proxy de Envoy o la aplicación de gRPC sin proxy puede aplicar diferentes acciones en función de la solicitud que controla.

Distribuye el tráfico entre los backends de un servicio

Como se explica en Control de solicitudes, cuando un cliente controla una solicitud saliente, primero selecciona un servicio de destino. Una vez que selecciona un servicio de destino, necesita determinar qué backend o extremo debe recibir la solicitud.

Distribución del tráfico entre backends
Distribución del tráfico entre backends (haz clic para ampliar)

En el diagrama anterior, se simplificó la Regla. La Regla suele ser una regla de host, un comparador de rutas de acceso y una o más reglas de enrutamiento o ruta de acceso. El servicio de destino es el servicio (de backend) En realidad, Backend 1 y Backend n reciben y controlan la solicitud. Estos backends pueden ser, por ejemplo, instancias de máquina virtual (VM) de Compute Engine que alojan el código de la aplicación del servidor.

De forma predeterminada, el cliente que controla la solicitud envía solicitudes al backend en buen estado más cercano y que tenga capacidad. Para evitar la sobrecarga de un backend específico, usa el algoritmo de balanceo de cargas round robin a fin de balancear las solicitudes posteriores en otros backends del servicio de destino. Sin embargo, en algunos casos, recomendamos un control más detallado sobre este comportamiento.

Balanceo de cargas, afinidad de sesión y protección de backends

Puedes establecer las siguientes políticas de distribución de tráfico en cada servicio.

Política Nombre del campo de la API Descripción
Modo de balanceo de cargas balancingMode Controla cómo se selecciona un grupo de extremos de red (NEG) o un grupo de instancias administrado (MIG) después de seleccionar un servicio de destino. Puedes configurar el modo de balanceo para distribuir la carga en función de las conexiones simultáneas y el porcentaje de solicitudes.
Política de balanceo de cargas localityLbPolicy Establece el algoritmo de balanceo de cargas que se usa para distribuir el tráfico entre backends dentro de un NEG o MIG. Para optimizar el rendimiento, puedes elegir entre varios algoritmos (como round robin o solicitud mínima).
Afinidad de sesión sessionAffinity

Hace su mejor esfuerzo para enviar solicitudes de un cliente en particular al mismo backend, siempre que el backend esté en buen estado y tenga capacidad.

Cloud Service Mesh admite cuatro opciones de afinidad de sesión: dirección IP de cliente, basada en cookies HTTP, basada en encabezado HTTP y afinidad de cookie generada (que genera Cloud Service Mesh).

Hash coherente consistentHash Proporciona afinidad de sesión reducida basada en encabezados HTTP, cookies u otras propiedades.
Disyuntores circuitBreakers Establece los límites superiores en el volumen de conexiones y solicitudes por conexión a un servicio de backend.
Detección de valores atípicos outlierDetection Especifica los criterios para (1) quitar extremos o backends en mal estado de los MIG o NEG y (2) agregar un backend o un extremo cuando se considere que está en buen estado para volver a recibir tráfico. La verificación de estado asociada al servicio determina si un backend o extremo se considera en buen estado.

Para obtener más información sobre las diferentes opciones de distribución de tráfico y cómo funcionan, consulta la página de la API de REST de backendServices.

Ejemplos de casos de uso

La administración avanzada del tráfico abarca muchos casos de uso. En esta sección se proporcionan algunos ejemplos de alto nivel.

Puedes encontrar más ejemplos, incluido el código de muestra, en las guías Configura la administración avanzada del tráfico y Configura servicios de gRPC sin proxy con la administración avanzada del tráfico.

Enrutamiento detallado del tráfico para la personalización

Puedes enrutar el tráfico a un servicio según los parámetros de la solicitud. Por ejemplo, puedes usar esto para proporcionar una experiencia más personalizada a los usuarios de Android. En el siguiente diagrama, Cloud Service Mesh configura la malla de servicios para enviar solicitudes con el encabezado user-agent:Android al servicio de Android y no al servicio genérico.

Enrutamiento basado en el encabezado de usuario-agente establecido en Android.
Enrutamiento basado en el encabezado user-agent establecido en Android (haz clic para ampliar)

División del tráfico basada en el peso para implementaciones más seguras

Implementar una versión nueva de un servicio de producción existente puede ser arriesgado. Incluso después de que se pasen las pruebas en un entorno de pruebas, no recomendamos enrutar todos los usuarios a la versión nueva de inmediato.

Cloud Service Mesh te permite definir divisiones de tráfico basadas en el peso para distribuir el tráfico entre varios servicios. Por ejemplo, puedes enviar el 1% del tráfico a la versión nueva del servicio, supervisar que todo funcione y, luego, aumentar de forma gradual la proporción del tráfico que se dirige al servicio nuevo.

División del tráfico basada en el peso de Cloud Service Mesh
División del tráfico basada en el peso de Cloud Service Mesh (haz clic para ampliar)

Duplicación del tráfico para la depuración

Cuando depuras un problema, puede ser útil enviar copias del tráfico de producción a un servicio de depuración. Cloud Service Mesh te permite configurar políticas de duplicación de solicitudes para que estas se envíen a un servicio, y las copias de esas solicitudes se envíen a otro servicio.

Duplicación de tráfico de Cloud Service Mesh.
Duplicación del tráfico de Cloud Service Mesh (haz clic para ampliar)

Balanceo de cargas más preciso para el rendimiento

Según las características de la aplicación, es posible que puedas mejorar el rendimiento y la disponibilidad si ajustas con precisión la forma en que se distribuye el tráfico entre los backends de un servicio. Con Cloud Service Mesh, puedes aplicar algoritmos de balanceo de cargas avanzados para que el tráfico se distribuya según tus necesidades.

En el siguiente diagrama, a diferencia de los diagramas anteriores, se muestra un servicio de backend de destino (Production Service) y los backends para ese servicio de backend (Virtual Machine 1, Virtual Machine 2, Virtual Machine 3). Con la administración avanzada del tráfico, puedes configurar cómo se selecciona un servicio de backend de destino y cómo se distribuye el tráfico entre los backends para ese servicio de destino.

Balanceo de cargas de Cloud Service Mesh
Balanceo de cargas de Cloud Service Mesh(haz clic para ampliar)

¿Qué sigue?