Se usó la API de Cloud Translation para traducir esta página.

Patrón de aumentos de actividad de nube.

Last reviewed 2025-01-23 UTC

Las aplicaciones de Internet pueden experimentar fluctuaciones extremas en relación con el uso. Si bien la mayoría de las aplicaciones empresariales no enfrentan este desafío, muchas empresas deben lidiar con un tipo diferente de carga de trabajo inestable: los trabajos por lotes o de CI/CD.

Este patrón de arquitectura se basa en una implementación redundante de aplicaciones en múltiples entornos de computación. El objetivo es aumentar la capacidad, la resiliencia o ambas.

Si bien puedes acomodar las cargas de trabajo inestables en un entorno de computación basado en centros de datos mediante el aprovisionamiento excesivo de recursos, este enfoque podría no ser rentable. En los trabajos por lotes, puedes optimizar el uso con una ejecución extendida durante períodos más largos. Sin embargo, retrasar los trabajos no es práctico si son urgentes.

La idea del patrón de aumentos de actividad de nube es usar de forma temporal un entorno de computación privado para la carga y el aumento de actividad del modelo de referencia en la nube cuando necesites capacidad adicional.

Datos que fluyen de un entorno local a Google Cloud en modo de ráfaga.

En el diagrama anterior, cuando la capacidad de datos está al límite en un entorno privado local, el sistema puede obtener capacidad adicional de un entorno deGoogle Cloud cuando sea necesario.

Los factores clave de este patrón son ahorrar dinero y reducir el tiempo y el esfuerzo necesarios para responder a los cambios de los requisitos de escalamiento. Con este enfoque, solo pagas por los recursos que se usan cuando se controlan cargas adicionales. Esto significa que no necesitas aprovisionar en exceso tu infraestructura. En cambio, puedes aprovechar los recursos de la nube a pedido y escalarlos para que se ajusten a la demanda y a cualquier métrica predefinida. Como resultado, tu empresa podría evitar interrupciones del servicio durante los períodos de mayor demanda.

Un requisito potencial para las situaciones de aumentos de actividad en la nube es la portabilidad de la carga de trabajo. Cuando permitas que las cargas de trabajo se implementen en múltiples entornos, debes abstraer las diferencias entre los entornos. Por ejemplo, Kubernetes te permite lograr coherencia a nivel de la carga de trabajo en diversos entornos que usan diferentes infraestructuras. Para obtener más información, consulta Arquitectura de referencia del entorno híbrido de GKE Enterprise.

Consideraciones del diseño

El patrón de picos de actividad de nube se aplica a cargas de trabajo interactivas y por lotes. Sin embargo, cuando se trata de cargas de trabajo interactivas, debes determinar cómo distribuir las solicitudes entre los entornos:

Puedes enrutar las solicitudes entrantes de los usuarios a un balanceador de cargas que se ejecuta en el centro de datos existente y, luego, hacer que este distribuya las solicitudes a través de los recursos locales y de nube.

Este enfoque requiere que el balanceador de cargas o un sistema diferente que se ejecute en el centro de datos existente también realice un seguimiento de los recursos asignados en la nube. El balanceador de cargas o algún otro sistema también debe iniciar el ajuste ascendente o descendente automático de los recursos. Con este enfoque, puedes retirar todos los recursos de nube en momentos de baja actividad. Sin embargo, la implementación de mecanismos para realizar un seguimiento de los recursos podría superar las capacidades de tus soluciones de balanceador de cargas y, por lo tanto, aumentar la complejidad general.
En lugar de implementar mecanismos para realizar seguimientos de los recursos, puedes usar Cloud Load Balancing con un backend de grupo de extremos de red (NEG) de conectividad híbrida. Usas este balanceador de cargas para enrutar solicitudes de clientes internos o solicitudes de clientes externos a backends que se encuentran tanto en las instalaciones como enGoogle Cloud y que se basan en diferentes métricas, como la división del tráfico basada en el peso. También puedes reducir la escala de los backends según la capacidad de entrega del balanceo de cargas para las cargas de trabajo en Google Cloud. Para obtener más información, consulta Descripción general de la administración del tráfico en el balanceador de cargas de aplicaciones externo global.

Este enfoque tiene varios beneficios adicionales, como el uso de las capacidades de protección contra DSD de Google Cloud Armor, WAF y el contenido del almacenamiento en caché en el perímetro de la nube mediante Cloud CDN. Sin embargo, debes dimensionar la conectividad de red híbrida para controlar el tráfico adicional.
Como se destaca en Portabilidad de la carga de trabajo, una aplicación puede ser portátil a un entorno diferente con cambios mínimos para lograr la coherencia de la carga de trabajo, pero eso no significa que la aplicación funciona de la misma manera en ambos entornos. Las diferencias en la infraestructura de computación subyacente, las capacidades de seguridad de la infraestructura o la infraestructura de redes, junto con la proximidad a los servicios dependientes, suelen determinar el rendimiento. Con las pruebas, puedes tener una visibilidad más precisa y comprender las expectativas de rendimiento.
Puedes usar los servicios de infraestructura de nube para crear un entorno para alojar tus aplicaciones sin portabilidad. Usa los siguientes enfoques para controlar las solicitudes de clientes cuando el tráfico se redirecciona durante los períodos de mayor demanda:
- Usa herramientas coherentes para supervisar y administrar estos dos entornos.
- Garantiza que el control de versiones de las cargas de trabajo sea coherente y que tus fuentes de datos estén actualizadas.
- Es posible que debas agregar automatización para aprovisionar el entorno de nube y redirigir el tráfico cuando la demanda aumente y se espera que la carga de trabajo en la nube acepte solicitudes de clientes para tu aplicación.
Si pretendes desactivar todos los Google Cloud recursos en períodos de baja demanda, usar políticas de enrutamiento de DNS principalmente para el balanceo de cargas de tráfico podría no ser siempre óptimo. Esto se debe principalmente a lo siguiente:
- Los recursos pueden tardar un tiempo en inicializarse antes de poder atender a los usuarios.
- Las actualizaciones de DNS suelen propagarse lentamente en Internet.
Estos fueron algunos de los resultados:
- Es posible que los usuarios se enruten al entorno de Cloud incluso cuando no haya recursos disponibles para procesar sus solicitudes.
- Es posible que los usuarios se sigan enrutando al entorno local de forma temporal mientras se propagan las actualizaciones de DNS en Internet.

Con Cloud DNS, puedes elegir la política de DNS y de enrutamiento que se alinee con la arquitectura y el comportamiento de tu solución, como las políticas de enrutamiento de DNS de ubicación geográfica. Cloud DNS también admite verificaciones de estado para el balanceador de cargas de red de transferencia interno y el balanceador de cargas de aplicaciones interno. En ese caso, podrías incorporarlo a tu configuración general de DNS híbrido basada en este patrón.

En algunos casos, puedes usar Cloud DNS para distribuir solicitudes de clientes con verificaciones de estado activadas Google Cloud, como cuando usas balanceadores de cargas de aplicaciones internos o balanceadores de cargas de aplicaciones internos entre regiones. En este caso, Cloud DNS verifica el estado general del balanceador de cargas de aplicaciones interno, que a su vez verifica el estado de las instancias de backend. Para obtener más información, consulta Administra las políticas de enrutamiento de DNS y las verificaciones de estado.

También puedes usar el horizonte dividido de Cloud DNS. El horizonte dividido de Cloud DNS es un enfoque para configurar respuestas o registros de DNS en la ubicación o red específicas del originador de la consulta de DNS para el mismo nombre de dominio. Por lo general, este enfoque se usa para abordar los requisitos en los que una aplicación está diseñada para ofrecer una experiencia privada y pública, cada una con características únicas. Este enfoque también ayuda a distribuir la carga de tráfico en los diferentes entornos.

Dadas estas configuraciones, el patrón de aumentos de actividad en la nube se suele prestar mejor para cargas de trabajo por lotes que cargas de trabajo interactivas.

Ventajas

Estas son algunas de las ventajas clave del patrón de arquitectura de aumentos de actividad en la nube:

El patrón de aumentos de actividad en la nube te permite volver a usar las inversiones existentes en centros de datos y entornos de computación privados. Esta acción puede ser permanente o durar hasta que se deba reemplazar el equipo existente. En ese momento, podrías considerar una migración total.
Debido a que ya no tienes que mantener un exceso de capacidad para satisfacer las demandas máximas, es posible que puedas aumentar el uso y la rentabilidad de tus entornos de computación privados.
El patrón de aumentos de actividad de nube te permite ejecutar trabajos por lotes de manera oportuna sin la necesidad de aprovisionar recursos de procesamiento en exceso.

Prácticas recomendadas

Cuando implementes el patrón de picos de actividad de nube, ten en cuenta las siguientes recomendaciones:

Para garantizar que las cargas de trabajo que se ejecutan en la nube puedan acceder a los recursos de la misma manera que las cargas de trabajo que se ejecutan en un entorno local, usa el patrón de malla con el principio de acceso de seguridad con menos privilegios. Si el diseño de la carga de trabajo lo permite, puedes otorgar acceso solo desde la nube al entorno de computación local, no al revés.
Para minimizar la latencia de comunicación entre entornos, elige una región deGoogle Cloud que esté cerca de la ubicación geográfica de tu entorno de computación privado. Si deseas obtener más información, consulta Prácticas recomendadas para la selección de regiones de Compute Engine.
Cuando uses los aumentos de actividad en la nube solo para cargas de trabajo por lotes, mantén todos los recursos de Google Cloud en privado para reducir la superficie de ataque de seguridad. No permitas el acceso directo desde Internet a estos recursos, incluso si usas Google Cloud balanceo de cargas externo para proporcionar el punto de entrada a la carga de trabajo.
Selecciona la política de DNS y de enrutamiento que se alinee con tu patrón de arquitectura y el comportamiento de la solución objetivo.
- Como parte de este patrón, puedes aplicar el diseño de tus políticas de DNS de forma permanente o cuando necesites capacidad adicional con otro entorno durante los períodos de mayor demanda.
- Puedes usar políticas de enrutamiento de DNS de ubicación geográfica para tener un extremo de DNS global para tus balanceadores de cargas regionales. Esta táctica tiene muchos casos de uso para las políticas de enrutamiento de DNS de ubicación geográfica, incluidas las aplicaciones híbridas que usan Google Cloud junto con una implementación local en la que existe la región de Google Cloud .
- Si necesitas proporcionar registros diferentes para las mismas consultas de DNS, puedes usar el DNS de horizonte dividido, por ejemplo, consultas de clientes internos y externos.
  
  Para obtener más información, consulta las arquitecturas de referencia para DNS híbrido.
Para garantizar que los cambios de DNS se propaguen con rapidez, configura tu DNS con un valor de tiempo de actividad razonablemente corto para poder redirigir a los usuarios a sistemas en modo de espera cuando necesites capacidad adicional con entornos de nube.
Para trabajos que no son fundamentales para el tiempo y no almacenan datos de forma local, considera usar instancias de VM Spot, que son mucho más económicas que las instancias de VM normales. Sin embargo, un requisito es que si el trabajo de VM se interrumpe, el sistema debe poder reiniciar el trabajo de forma automática.
Usa contenedores para lograr la portabilidad de la carga de trabajo cuando corresponda. Además, GKE Enterprise puede ser una tecnología clave que habilita ese diseño. Para obtener más información, consulta Arquitectura de referencia del entorno híbrido de GKE Enterprise.
Supervisa el tráfico enviado desde Google Cloud a un entorno de computación diferente. Este tráfico está sujeto a cargos por transferencia de datos salientes.
Si planeas usar esta arquitectura a largo plazo con un alto volumen de transferencia de datos salientes, considera usar Cloud Interconnect. Cloud Interconnect puede ayudar a optimizar el rendimiento de la conectividad y puede reducir los cargos por transferencia de datos salientes para el tráfico que cumple con ciertas condiciones. Para obtener más información, consulta los precios de Cloud Interconnect.
Cuando se use Cloud Load Balancing, debes usar sus capacidades de optimización de la capacidad de la aplicación cuando corresponda. Esto puede ayudarte a abordar algunos de los desafíos de capacidad que pueden ocurrir en las aplicaciones distribuidas a nivel global.
Autentica a las personas que usan tus sistemas estableciendo una identidad común entre los entornos para que los sistemas puedan autenticarse de manera segura a través de los límites del entorno.
Para proteger la información sensible, se recomienda encriptar todas las comunicaciones en tránsito. Si se requiere encriptación en la capa de conectividad, hay varias opciones disponibles según la solución de conectividad híbrida seleccionada. Estas opciones incluyen túneles VPN, VPN con alta disponibilidad en Cloud Interconnect y MACsec para Cloud Interconnect.

Patrones de nube híbrida y de múltiples nubes de continuidad empresarial

Próximos pasos