Descripción general de la administración avanzada del tráfico para las APIs de balanceo de cargas
Este documento está dirigido a los administradores de plataformas o mallas y a los desarrolladores de servicios que tengan un nivel intermedio o avanzado de conocimiento de Cloud Service Mesh y de conceptos de la malla de servicios, y que determinen y configuren cómo se administra el tráfico en una implementación de Cloud Service Mesh. Este documento solo es válido a las APIs de balanceo de cargas, no a las APIs de enrutamiento de servicios. Si tu implementación de Cloud Service Mesh usa las APIs de enrutamiento de servicios, consulta Descripción general de la administración avanzada del tráfico.
Cloud Service Mesh proporciona funciones avanzadas de administración del tráfico que te brindan control detallado sobre cómo se maneja el tráfico. Cloud Service Mesh admite los siguientes casos de uso:
- Enrutamiento detallado de las solicitudes a uno o más servicios
- División del tráfico basada en el peso para distribuir el tráfico entre varios servicios
- Políticas de duplicación del tráfico que envían solicitudes a un servicio de depuración y copias a otro
- Distribución de tráfico más precisa en los backends de un servicio para mejorar el balanceo de cargas
Estas funciones de administración avanzada del tráfico te permiten cumplir tus objetivos de disponibilidad y rendimiento. Uno de los beneficios de usar Cloud Service Mesh para estos casos de uso es que puedes actualizar la forma en que se administra el tráfico sin tener que modificar el código de la aplicación.
Cuando usas el proxy HTTP de destino a fin de configurar los proxies Envoy para enviar solicitudes HTTP, todas las capacidades de este documento están disponibles.
Cuando usas servicios o aplicaciones de gRPC sin proxy con Cloud Service Mesh, algunas de las funciones no están disponibles.
Cuando usas el proxy TCP de destino para configurar los proxies de Envoy a fin de enviar solicitudes de TCP, ninguna de las funciones está disponible porque no hay un mapa de URL en las configuraciones con un proxy TCP de destino.
Para obtener más detalles, consulta la página de funciones.
Para configurar la administración avanzada del tráfico, usa el mismo mapa de reglas de enrutamiento y los recursos de los servicios de backend que usas cuando configuras Cloud Service Mesh. Cloud Service Mesh, a su vez, configura tus proxies de Envoy y gRPC sin proxy aplicaciones para aplicar las políticas de administración avanzada de tráfico que establezcas arriba.
En un alto nivel, puedes seguir los siguientes pasos:
Configura el mapa de reglas de enrutamiento para que realice las siguientes acciones, según las características de la solicitud saliente:
Selecciona el servicio de backend al que se enrutan las solicitudes.
Realiza acciones adicionales (opcional)
Configura el servicio de backend a fin de controlar cómo se distribuye el tráfico en los backends y extremos después de seleccionar un servicio de destino.
Configuración de filtros
Una de las responsabilidades principales de Cloud Service Mesh es generar información de configuración a partir de la regla de reenvío, el proxy de destino y el mapa de URL, y, luego, enviar esa información a los clientes de Cloud Service Mesh, por ejemplo, proxies de Envoy y aplicaciones de gRPC. Cloud Service Mesh controla tu malla de servicios enviando información de configuración a sus clientes que les indica cómo comportarse para enrutar el tráfico: Cloud Service Mesh es el plano de control.
Cuando creas o actualizas la información de configuración en Cloud Service Mesh, Cloud Service Mesh traduce esta configuración a un lenguaje que que sus clientes puedan comprender. De forma predeterminada, Cloud Service Mesh comparte la configuración con todos los clientes. En algunos casos, es posible que desees personalizar en la que los clientes de la malla de servicios de Cloud reciben información de configuración específica, en otras palabras, filtrar la configuración para clientes específicos.
Si bien se trata de una función avanzada, los siguientes ejemplos ilustran cuándo configuración de filtros puede ayudarte a hacer lo siguiente:
- Tu organización usa el modelo de red de VPC compartida y varias equipos usan Cloud Service Mesh en diferentes proyectos de servicio. Si deseas aislar la configuración de otros proyectos de servicio, puedes filtrar la configuración para que los clientes específicos de Cloud Service Mesh reciban solo un subconjunto de la configuración.
- Tienes una gran cantidad de reglas de enrutamiento y servicios configurados en Cloud Service Mesh y deseas evitar el envío de una cantidad inusualmente grande de configuración a cada cliente de Cloud Service Mesh. Ten en cuenta que un cliente que debe evaluar una solicitud saliente mediante un enfoque grande puede funcionar menos bien que un cliente que solo necesita evaluar una solicitud con una configuración optimizada.
El filtrado de configuración se basa en el concepto de filtros de metadatos:
- Cuando un cliente de la malla de servicios de Cloud se conecta, presenta información del su archivo de arranque a Cloud Service Mesh.
- Esta información incluye el contenido de los campos de metadatos con el siguiente formato: de pares clave-valor, que especificas en el archivo de arranque cuando implementas con los proxies de Envoy y las aplicaciones de gRPC.
- Puedes agregar filtros de metadatos en la regla de reenvío. Se filtra toda la configuración vinculada a la regla de reenvío.
- Puedes agregar filtros de metadatos en el mapa de URLs. Se aplica el filtro de metadatos según el enrutamiento de ruta.
- Cloud Service Mesh comparte la configuración solo con clientes que presentan metadatos que coinciden con las condiciones del filtro de metadatos.
Si deseas obtener información sobre cómo configurar los filtros de metadatos para Envoy, consulta
Establece el filtrado de configuración según la coincidencia de MetadataFilter
.
Acciones y enrutamiento del tráfico
En Cloud Service Mesh, el mapa de reglas de enrutamiento hace referencia a la combinación de la regla de reenvío, el proxy de destino y el mapa de URL de Google Cloud. Todas las funciones de administración avanzada del tráfico relacionadas con el enrutamiento y las acciones se configuran mediante el mapa de URL.
En las siguientes secciones, se describen las funciones avanzadas de administración del tráfico que puedes configurar en el mapa de reglas de enrutamiento.
Cómo administrar solicitudes
Cuando un cliente envía una solicitud, esta se controla como se describe en los siguientes pasos:
La solicitud coincide con un mapa de reglas de enrutamiento específico de la siguiente manera:
Si usas Envoy:
- El puerto y la dirección IP de destino de la solicitud se comparan con el puerto y la dirección IP de las reglas de reenvío en todos los mapas de reglas de enrutamiento.
Solo se consideran los mapas de reglas de enrutamiento con reglas de reenvío que tengan el esquema de balanceo de cargas
INTERNAL_SELF_MANAGED
. - La regla de reenvío que coincide con la solicitud hace referencia a un proxy HTTP o gRPC de destino, que hace referencia a un mapa de URL. Este mapa de URL contiene información que se usa para el enrutamiento y las acciones.
- El puerto y la dirección IP de destino de la solicitud se comparan con el puerto y la dirección IP de las reglas de reenvío en todos los mapas de reglas de enrutamiento.
Solo se consideran los mapas de reglas de enrutamiento con reglas de reenvío que tengan el esquema de balanceo de cargas
Si usas gRPC sin proxy:
- Un cliente de gRPC que usa el esquema de resolución de nombres de
xds
no realiza la búsqueda de DNS para resolver el nombre de host en el URI del canal. En cambio, ese cliente resuelve elhostname[:port]
en el destino. URI mediante el envío de un LDS a Cloud Service Mesh. - Solo se compara el puerto de una regla de reenvío con el esquema de balanceo de cargas
INTERNAL_SELF_MANAGED
con el puerto en el URI de destino (por ejemplo,xds:///example.hostname:8080
). La dirección IP de la regla de reenvío no se usa. El valor predeterminado del puerto es80
si no se especifica ningún puerto en el URI de destino. - La regla de reenvío que coincide con la solicitud hace referencia a un proxy de gRPC de destino, que hace referencia a un mapa de URL. Este mapa de URL contiene información que se usa para el enrutamiento y las acciones.
- Si más de una regla de reenvío coincide con la solicitud, se usa para el enrutamiento y las acciones el mapa de URL que contiene la regla de host que coincide con
hostname[:port]
en el URI de destino.
- Un cliente de gRPC que usa el esquema de resolución de nombres de
Cuando se determina el mapa de URL adecuado, se evalúa el mapa de URL para determinar el servicio de backend de destino y, de forma opcional, aplicar acciones.
Una vez que se selecciona el servicio de backend de destino, el tráfico se distribuye entre los backends o extremos de ese servicio, según la configuración del recurso del servicio de backend.
El segundo paso se describe en la siguiente sección, Enrutamiento simple basado en el host y la ruta de acceso. El tercer paso se analiza en Enrutamiento y acciones avanzados.
Enrutamiento simple basado en el host y la ruta de acceso
Cloud Service Mesh admite un esquema de enrutamiento simplificado y un esquema más avanzado. En el esquema simple, debes especificar un host y, de forma opcional, una ruta de acceso. El host y la ruta de acceso de la solicitud se evalúan para determinar el servicio al que se debe enrutar una solicitud.
- El host de la solicitud es la parte del nombre de dominio de una URL, por ejemplo, la parte del host de la URL
http://example.com/video/
esexample.com
. - La ruta de acceso de la solicitud es la parte de la URL que sigue al nombre de host, por ejemplo, la parte de la ruta de acceso de la URL
http://example.com/video/
es/video
.
Configura el enrutamiento simple basado en el host y la ruta de acceso en el mapa de reglas de enrutamiento, que consta de los siguientes elementos:
- Una regla de reenvío global
- Un proxy HTTP de destino, un proxy HTTPS de destino o un proxy de gRPC de destino
- Un mapa de URL
La mayor parte de la configuración se realiza en el mapa de URL. Después de crear el mapa de reglas de enrutamiento inicial, solo debes modificar la parte del mapa de URL del mapa de reglas de enrutamiento. Las reglas de ruta de acceso tienen acciones similares a las del siguiente diagrama.
La regla más simple es una regla predeterminada, en la que solo especificas una regla de host comodín (*
) y un comparador de rutas de acceso con un servicio predeterminado. Después de crear la regla predeterminada, puedes agregar reglas adicionales que especifiquen diferentes hosts y rutas de acceso. Las solicitudes salientes se evalúan según estas reglas de la siguiente manera:
Si el host de una solicitud (como
example.com
) coincide con una regla de host, sucede lo siguiente:- Se evalúa el comparador de rutas de acceso.
- Cada comparador de rutas de acceso contiene una o más reglas de ruta de acceso que se evalúan en función de la ruta de acceso de la solicitud.
- Si se encuentra una coincidencia, la solicitud se enruta al servicio especificado en la regla de ruta de acceso.
- Si la regla de host coincide, pero no hay reglas de ruta de acceso, las solicitudes se enrutan a un servicio predeterminado que contiene cada comparador de rutas de acceso.
Si la solicitud no coincide con ninguna de las reglas de host que especificaste, se enruta al servicio especificado en la regla predeterminada.
Para obtener más información sobre los campos de recursos del mapa de URL y cómo funcionan, consulta la página de la API de REST de urlMaps
.
Enrutamiento y acciones avanzados
Puedes configurar reglas avanzadas para enrutar solicitudes y realizar acciones si deseas hacer más que enrutar una solicitud basada en el host y la regla de acceso de una solicitud.
En un nivel alto, el enrutamiento y las acciones avanzados funcionan de la siguiente manera:
- Al igual que con el enrutamiento simple, el host de la solicitud se compara con las reglas de host que configuras en el mapa de URL. Si el host de una solicitud coincide con una regla de host, se evalúa el comparador de rutas de acceso de la regla de host.
- El comparador de rutas de acceso contiene una o más reglas de enrutamiento que se evalúan según la solicitud. Estas reglas de enrutamiento se evalúan en orden de prioridad. Para ello, se hacen coincidir los atributos de la solicitud (host, ruta de acceso, encabezado y parámetros de consulta) de acuerdo con condiciones de coincidencia específicas, por ejemplo, coincidencia de prefijo.
- Después de seleccionar una regla de enrutamiento, puedes aplicar acciones. La acción predeterminada es enrutar la solicitud a un solo servicio de destino, pero también puedes configurar otras acciones.
Enrutamiento avanzado
El enrutamiento avanzado es similar al enrutamiento simple descrito antes, con la excepción de que puedes especificar la prioridad de las reglas y las condiciones de coincidencia adicionales.
Con el enrutamiento avanzado, debes especificar una sola prioridad para cada regla. Esta prioridad determina el orden en el que se evalúan las reglas de enrutamiento; los valores con una prioridad más baja prevalecen sobre los de mayor prioridad. Cuando una solicitud coincide con una regla, esta se aplica y otras se ignoran.
El enrutamiento avanzado también admite condiciones de coincidencia adicionales. Por ejemplo, puedes especificar que una regla coincida con el encabezado de una solicitud si el nombre de ese encabezado coincide de manera exacta o parcial, por ejemplo, según el prefijo o sufijo. Puede coincidir según la evaluación del nombre del encabezado en función de una expresión regular o de acuerdo con otros criterios, como verificar la presencia de un encabezado.
Para ver las condiciones de coincidencia adicionales y los detalles de headerMatches
y queryParameterMatches
, consulta la página API de REST de urlMaps
.
Si combinas el host, la ruta de acceso, el encabezado, los parámetros de consulta con prioridades y las condiciones de coincidencia, puedes crear reglas muy expresivas que se adapten a tus requisitos exactos de administración del tráfico. Para obtener más información, consulta la siguiente tabla:
Aplicación basada en HTTP | Aplicación basada en gRPC | |
---|---|---|
Hosts HTTP en comparación con hosts de gRPC | El host es la parte del nombre de dominio de la URL a la que llama la aplicación. Por ejemplo, la parte del host de la URL |
El host es el nombre que un cliente usa en el URI del canal para conectarse a un servicio específico. Por ejemplo, la parte del host del URI del canal |
Rutas de acceso de HTTP en comparación con rutas de acceso de gRPC | La ruta de acceso es la parte de la URL que sigue al nombre de host. Por ejemplo, la parte de la ruta de acceso de la URL |
La ruta de acceso se encuentra en el encabezado Por ejemplo, si llamas al método |
Otros encabezados de gRPC (metadatos) | gRPC admite el envío de metadatos entre el cliente de gRPC y el servidor de gRPC para proporcionar información adicional sobre una llamada RPC. Estos metadatos tienen un formato de pares clave-valor que se transfieren como encabezados en la solicitud HTTP/2. |
Acciones
Cloud Service Mesh te permite especificar acciones que realizan los proxies de Envoy o las aplicaciones de gRPC sin proxy cuando controlan una solicitud. Las siguientes acciones se pueden configurar mediante Cloud Service Mesh.
Acción | Nombre del campo de la API | Descripción |
---|---|---|
Redireccionamientos | urlRedirect |
Muestra un código de respuesta 3xx configurable. También establece el encabezado de respuesta Location con el URI apropiado, lo que reemplaza el host y la ruta de acceso como se especifica en la acción de redireccionamiento.
|
Reescritura de URL | urlRewrite |
Vuelve a escribir la parte del nombre de host de la URL, la parte de la ruta de la URL o ambas, antes de enviar una solicitud al servicio de backend seleccionado. |
Transformaciones del encabezado | headerAction |
Agrega o quita encabezados de la solicitud antes de enviar una solicitud al servicio de backend. También puede agregar o quitar los encabezados de respuesta después de recibir una respuesta del servicio de backend. |
Duplicación de tráfico | requestMirrorPolicy |
Además de reenviar la solicitud al servicio de backend seleccionado, envía una solicitud idéntica al servicio de backend duplicado y configurado en una base de enviar y olvidar. El balanceador de cargas no espera una respuesta del backend al que envía la solicitud duplicada. La duplicación es útil para probar una versión nueva de un servicio de backend. También puedes usarla para depurar errores de producción en una versión de depuración de tu servicio de backend, en lugar de hacerlo en la versión de producción. |
División de tráfico basada en el peso | weightedBackendServices |
Permite que el tráfico de una regla coincidente se distribuya a varios servicios de backend, proporcional a un peso definido por el usuario asignado al servicio de backend individual. Esta función es útil para configurar implementaciones publicadas en etapa de pruebas o pruebas A/B. Por ejemplo, la acción de enrutamiento se podría configurar, de manera que el 99% del tráfico se envíe a un servicio que ejecuta una versión estable de una aplicación, mientras que el 1% del tráfico se envíe a un servicio independiente que ejecuta una versión más reciente de esa aplicación. |
Reintentos | retryPolicy |
Configuran las condiciones en las que el balanceador de cargas reintenta enviar solicitudes fallidas, cuánto espera el balanceador de cargas antes de volver a intentarlo y la cantidad máxima de reintentos permitidos. |
Tiempo de espera | timeout |
Especifica el tiempo de espera para la ruta seleccionada. El tiempo de espera se calcula desde el momento en que la solicitud se procesa por completo hasta el momento en que la respuesta se procesa por completo. El tiempo de espera incluye todos los reintentos. |
Inyección de fallas | faultInjectionPolicy |
Presenta errores cuando se entregan solicitudes para simular fallas, incluida la latencia alta, la sobrecarga del servicio, las fallas del servicio y la partición de la red. Esta característica es útil para probar la resiliencia de un servicio ante fallas simuladas. |
Políticas de seguridad | corsPolicy |
Las políticas de uso compartido de recursos entre dominios (CORS) controlan la configuración para aplicar las solicitudes de CORS. |
Para obtener más información sobre las acciones y cómo funcionan, consulta la página de la API de REST de urlMaps
.
En cada regla de enrutamiento, puedes especificar una de las siguientes acciones de enrutamiento (denominadas Acciones principales en la consola de Google Cloud):
- Enrutar el tráfico a un solo servicio (
service
) - Dividir el tráfico entre varios servicios (
weightedBackendServices
) - Redireccionar las URL (
urlRedirect
)
Además, puedes combinar cualquiera de las acciones de ruta mencionadas antes con una o más de las siguientes acciones de ruta (llamadas Acciones de complementos en la consola de Cloud):
- Manipular los encabezados de respuesta/solicitud (
headerAction
) - Tráfico de duplicación (
requestMirrorPolicy
) - Reescribe el host de URL, la ruta de acceso o ambos (
urlRewrite
) - Reintentar con las solicitudes que fallaron (
retryPolicy
) - Configurar el tiempo de espera (
timeout
) - Ingresar errores en un porcentaje del tráfico (
faultInjectionPolicy
) - Agregar política de CORS (
corsPolicy
)
Debido a que las acciones están asociadas con reglas de enrutamiento específicas, el proxy de Envoy o la aplicación de gRPC sin proxy puede aplicar diferentes acciones en función de la solicitud que controla.
Distribuye el tráfico entre los backends de un servicio
Como se explica en Control de solicitudes, cuando un cliente controla una solicitud saliente, primero selecciona un servicio de destino. Una vez que selecciona un servicio de destino, necesita determinar qué backend o extremo debe recibir la solicitud.
En el diagrama anterior, se simplificó la Regla. La Regla suele ser una regla de host, un comparador de rutas de acceso y una o más reglas de enrutamiento o ruta de acceso. El servicio de destino es el servicio (de backend) En realidad, Backend 1, … y Backend n reciben y controlan la solicitud. Estos backends pueden ser, por ejemplo, instancias de máquina virtual (VM) de Compute Engine que alojan el código de la aplicación del servidor.
De forma predeterminada, el cliente que controla la solicitud envía solicitudes al backend en buen estado más cercano y que tenga capacidad. Para evitar la sobrecarga de un backend específico, usa el algoritmo de balanceo de cargas round robin a fin de balancear las solicitudes posteriores en otros backends del servicio de destino. Sin embargo, en algunos casos, recomendamos un control más detallado sobre este comportamiento.
Balanceo de cargas, afinidad de sesión y protección de backends
Puedes establecer las siguientes políticas de distribución de tráfico en cada servicio.
Política | Nombre del campo de la API | Descripción |
---|---|---|
Modo de balanceo de cargas | balancingMode |
Controla cómo se selecciona un grupo de extremos de red (NEG) o un grupo de instancias administrado (MIG) después de seleccionar un servicio de destino. Puedes configurar el modo de balanceo para distribuir la carga en función de las conexiones simultáneas y el porcentaje de solicitudes. |
Política de balanceo de cargas | localityLbPolicy |
Establece el algoritmo de balanceo de cargas que se usa para distribuir el tráfico entre backends dentro de un NEG o MIG. Para optimizar el rendimiento, puedes elegir entre varios algoritmos (como round robin o solicitud mínima). |
Afinidad de sesión | sessionAffinity |
Hace su mejor esfuerzo para enviar solicitudes de un cliente en particular al mismo backend, siempre que el backend esté en buen estado y tenga capacidad. Cloud Service Mesh admite cuatro opciones de afinidad de sesión: dirección IP de cliente, basada en cookies HTTP, basada en encabezados HTTP afinidad de cookie generada (que Cloud Service Mesh genera por su cuenta). |
Hash coherente | consistentHash |
Proporciona afinidad de sesión reducida basada en encabezados HTTP, cookies u otras propiedades. |
Disyuntores | circuitBreakers |
Establece los límites superiores en el volumen de conexiones y solicitudes por conexión a un servicio de backend. |
Detección de valores atípicos | outlierDetection |
Especifica los criterios para (1) quitar extremos o backends en mal estado de los MIG o NEG y (2) agregar un backend o un extremo cuando se considere que está en buen estado para volver a recibir tráfico. La verificación de estado asociada al servicio determina si un backend o extremo se considera en buen estado. |
Para obtener más información sobre las diferentes opciones de distribución de tráfico y cómo funcionan, consulta la página de la API de REST de backendServices
.
Ejemplos de casos de uso
La administración avanzada del tráfico abarca muchos casos de uso. En esta sección se proporcionan algunos ejemplos de alto nivel.
Puedes encontrar más ejemplos, incluido el código de muestra, en las guías Configura la administración avanzada del tráfico y Configura servicios de gRPC sin proxy con la administración avanzada del tráfico.
Enrutamiento detallado del tráfico para la personalización
Puedes enrutar el tráfico a un servicio según los parámetros de la solicitud. Por ejemplo, puedes usar esto para proporcionar una experiencia más personalizada a los usuarios de Android. En el siguiente diagrama, Cloud Service Mesh configura la malla de servicios para enviar solicitudes con el encabezado user-agent:Android
al servicio de Android y no al servicio genérico.
División del tráfico basada en el peso para implementaciones más seguras
Implementar una versión nueva de un servicio de producción existente puede ser arriesgado. Incluso después de que se pasen las pruebas en un entorno de pruebas, no recomendamos enrutar todos los usuarios a la versión nueva de inmediato.
Cloud Service Mesh te permite definir divisiones de tráfico basadas en el peso para distribuir el tráfico entre varios servicios. Por ejemplo, puedes enviar el 1% del tráfico a la versión nueva del servicio, supervisar que todo funcione y, luego, aumentar de forma gradual la proporción del tráfico que se dirige al servicio nuevo.
Duplicación del tráfico para la depuración
Cuando depuras un problema, puede ser útil enviar copias del tráfico de producción a un servicio de depuración. Cloud Service Mesh te permite configurar políticas de duplicación de solicitudes para que estas se envíen a un servicio, y las copias de esas solicitudes se envíen a otro servicio.
Balanceo de cargas más preciso para el rendimiento
Según las características de la aplicación, es posible que puedas mejorar el rendimiento y la disponibilidad si ajustas con precisión la forma en que se distribuye el tráfico entre los backends de un servicio. Con Cloud Service Mesh, puedes aplicar algoritmos de balanceo de cargas avanzados para que el tráfico se distribuya según tus necesidades.
En el siguiente diagrama, a diferencia de los diagramas anteriores, se muestra un servicio de backend de destino (Production Service) y los backends para ese servicio de backend (Virtual Machine 1, Virtual Machine 2, Virtual Machine 3). Con la administración avanzada del tráfico, puedes configurar cómo se selecciona un servicio de backend de destino y cómo se distribuye el tráfico entre los backends para ese servicio de destino.
¿Qué sigue?
- Para obtener más información sobre los mapas de URL, consulta la Descripción general de los mapas de URL y Usa mapas de URL.
- Si deseas dirigir el tráfico desde el exterior de la malla hacia esta, consulta Tráfico de entrada para la malla.
- Para configurar funciones con implementaciones de proxy de sidecar, consulta Configura la administración avanzada del tráfico con Envoy.
- Para configurar funciones con implementaciones de gRPC sin proxy, consulta Configura la administración de tráfico avanzada con servicios de gRPC sin proxy.