El aumento de actividad en la nube es una configuración de la computación en la nube en la que una aplicación se ejecuta en una nube privada o en un centro de datos local y "aumenta" su actividad en una nube pública cuando la demanda de capacidad de procesamiento aumenta de forma repentina. Esto actúa como una válvula de desbordamiento, de modo que cuando la infraestructura privada alcanza su límite, el tráfico se dirige automáticamente a los servicios de nube pública para garantizar que no haya interrupciones en el servicio. Puedes imaginarlo como una tienda minorista que abre cajas adicionales solo cuando las filas son demasiado largas. La configuración de aumentos de actividad en la nube es un tipo específico de implementación de nube híbrida.
En un modelo de escalamiento en la nube estándar, una empresa podría intentar manejar todo en un solo entorno. Sin embargo, tener suficientes servidores físicos para manejar el día más ajetreado del año significa que esos servidores permanecen vacíos y sin usar durante los otros 364 días. El aumento de actividad en la nube puede ayudar a resolver este problema, ya que permite que una organización pague por la capacidad básica en su propio centro de datos y solo pague por los recursos adicionales de la nube pública cuando realmente los necesita. Este enfoque puede ayudar a las empresas a manejar aumentos repentinos de tráfico sin comprar hardware costoso que no necesitan todo el tiempo.
Para entender la mecánica de los aumentos de actividad en la nube, imagina tu nube privada como un tanque de agua. En condiciones normales, el agua (tráfico de datos) se mantiene dentro de la capacidad del tanque. Sin embargo, cuando se produce una tormenta repentina (un aumento repentino del tráfico), el tanque corre el riesgo de desbordarse.
En una configuración de aumentos de actividad en la nube, los equipos de TI configuran un "activador" o umbral, que suele ser cuando el uso de recursos alcanza aproximadamente el 70% o el 80%. Una vez que se cruza este umbral, el sistema abre automáticamente una válvula a un tanque secundario: la nube pública. La aplicación sigue ejecutándose sin problemas, y el tráfico de desbordamiento se enruta a los recursos de la nube pública. Una vez que pasa la tormenta y los niveles de tráfico vuelven a bajar, el sistema cierra la válvula y anula el aprovisionamiento de los recursos de la nube pública, lo que devuelve las operaciones únicamente a la nube privada.
Hay diferentes formas de configurar estos aumentos de actividad, según el nivel de control o automatización que necesite un equipo.
Los aumentos de actividad en la nube no siempre son la opción adecuada para todas las aplicaciones, en especial para aquellas que dependen de datos complejos y sensibles que no pueden salir de una red privada. Por lo general, son más adecuados para cargas de trabajo con patrones de demanda fluctuantes, estacionales o impredecibles en los que la velocidad y el tiempo de actividad son fundamentales, como en las siguientes situaciones:
Los comercios minoristas suelen enfrentar aumentos masivos de tráfico durante eventos de compras populares como Black Friday o Cyber Monday. Los aumentos de actividad en la nube permiten que estas empresas manejen millones de compradores durante unos días con la nube pública y, luego, reduzcan la escala a su infraestructura privada cuando termine la temporada alta.
Los ingenieros y científicos de datos suelen ejecutar tareas de computación de alto rendimiento (HPC), como simulaciones complejas, entrenamiento de modelos de IA u otras tareas de alto procesamiento, como la renderización en 3D. Estos trabajos podrían necesitar miles de servidores por solo unas horas. El aumentos de actividad permite que los equipos alquilen esta enorme potencia de forma temporal en lugar de esperar en una larga cola de supercomputación o crear una supercomputadora que se utilizará poco.
Los desarrolladores de software suelen necesitar iniciar entornos temporales para probar código nuevo o actualizaciones. En lugar de ocupar espacio en los servidores privados principales, pueden transferir estos entornos de prueba a la nube pública. Esto ayuda a mantener el entorno de producción seguro y estable.
Si un centro de datos local se queda sin conexión debido a un corte de energía o un desastre natural, los aumentos de actividad en la nube pueden actuar como un mecanismo de conmutación por error que respalde la recuperación ante desastres. El sistema puede redireccionar el tráfico a la nube pública para mantener la aplicación en funcionamiento hasta que se arregle el sitio principal.
La implementación de los aumentos de actividad en la nube requiere más que solo dos entornos de procesamiento; requiere una estrategia para manejar la complejidad de mover datos y aplicaciones entre ellos. Para hacerlo de manera eficaz, las organizaciones necesitan funciones que garanticen una conectividad fluida y una administración coherente.
Una de las formas más eficaces de implementar un activador de aumentos de actividad en la nube es usar GGoogle Kubernetes Engine (GKE) y el Horizontal Pod Autoscaler (HPA) con métricas externas. En esta situación, tu aplicación local envía un indicador (una métrica) a Google Cloud Monitoring. Cuando ese indicador excede un umbral, GKE automáticamente inicia nuevos Pods en la nube para manejar la carga.
Aquí te mostramos cómo configurar un activador basado en la profundidad de una cola de Pub/Sub (un indicador común de que tus trabajadores locales están sobrecargados):
1. Habilita la API de métricas personalizadas: Primero, debes permitir que tu clúster de GKE lea métricas de Cloud Monitoring. Para ello, debes implementar el adaptador de métricas personalizadas de Stackdriver en tu clúster. Este adaptador actúa como un puente, ya que traduce las métricas de Google Cloud a algo que Kubernetes puede entender.
2. Define la configuración de HPA: Crea un archivo YAML HorizontalPodAutoscaler. A diferencia de un escalador automático estándar que analiza el uso de CPU, este analizará una métrica externa, específicamente, la cantidad de mensajes no entregados en una suscripción de Pub/Sub (num_undelivered_messages).
3. Aplica y supervisa: Aplica esta configuración con kubectl apply -f hpa.yaml. Ahora, GKE está "observando" tu cola. Si tu sistema local se ralentiza y la cola se llena más allá del objetivo (50 mensajes), el HPA activará automáticamente la creación de nuevos Pods en la nube para procesar el trabajo pendiente. Una vez que la cola esté vacía, GKE reducirá la escala de los Pods a cero.
No puedes administrar lo que no puedes ver. Para que los aumentos de actividad en la nube funcionen, los equipos de TI necesitan una visión clara de sus recursos tanto en su centro de datos privado como en la nube pública. Google Cloud ofrece herramientas que proporcionan visibilidad detallada sobre cómo las aplicaciones usan la CPU y la memoria.
Si comprenden exactamente cuánto "combustible" consume una aplicación, los equipos pueden establecer umbrales precisos para cuándo realizar un aumento de actividad. Si el umbral es demasiado bajo, es posible que gastes dinero en la nube pública cuando no lo necesitas. Si es demasiado alto, la app podría fallar antes de que lleguen los nuevos recursos. La supervisión unificada ayuda a las organizaciones a ajustar estos parámetros para equilibrar el rendimiento y el costo.
El balanceo manual funciona para proyectos pequeños y poco frecuentes, pero es posible que no se escale bien para aplicaciones empresariales. Para ser más eficientes, las organizaciones pueden implementar software y herramientas para organizar automáticamente los recursos de computación en la nube. Las herramientas de automatización, como Terraform o el administrador de implementación de Google Cloud, pueden ayudar a definir la infraestructura como código (IaC).
Esto significa que el sistema puede aprovisionar, configurar y administrar servidores automáticamente en función de la demanda en tiempo real. Cuando el aumento de tráfico disminuye, las herramientas de automatización también se encargan del "desaprovisionamiento" o cierre de esos recursos. Esto garantiza que la empresa deje de pagar por la nube pública en el momento en que ya no la necesite.
Mantener el control durante un aumento de actividad es vital para la seguridad y la administración del presupuesto. Las organizaciones necesitan una capacidad de supervisión sólida para hacer un seguimiento de los recursos y garantizar que se aprovisionen de forma adecuada sin interrupción del servicio.
Las herramientas de informes ayudan a hacer un seguimiento de cuánto cuestan los aumentos de actividad a lo largo del tiempo. Estos datos son esenciales para predecir presupuestos futuros. Además, se deben aplicar políticas de seguridad coherentes a los recursos de aumentos de actividad. Las herramientas que implementan la supervisión y la creación de informes pueden ayudar a reducir los costos y aumentar la eficiencia con el tiempo, ya que identifican tendencias y anomalías en el uso.
Adoptar una estrategia de aumentos de actividad en la nube puede ofrecer varias ventajas para las organizaciones que buscan equilibrar el rendimiento y el presupuesto.
Ahorro de costos
Las empresas solo pagan por los recursos adicionales de la nube pública cuando los usan, lo que puede ayudar a evitar el gasto de capital que implica comprar hardware que permanece inactivo durante los períodos de calma.
Flexibilidad y escalabilidad
Puede darles a los equipos la libertad de probar proyectos nuevos o manejar aumentos masivos de tráfico sin estar limitados por el espacio físico o la energía disponible en su propio centro de datos.
Resiliencia y continuidad empresarial
Si el centro de datos privado tiene un problema o se sobrecarga, la aplicación permanece en línea trasladando la carga a la nube pública, lo que ayuda a evitar fallas y tiempo de inactividad.
Optimización de recursos
Los equipos de TI pueden mantener su nube privada funcionando a un nivel constante y eficiente para tareas críticas, mientras que transfieren el tráfico variable e impredecible a la nube pública flexible.
Si bien el concepto de aumento de actividad en la nube es universal, la infraestructura que lo admite varía significativamente entre los proveedores. Google Cloud ofrece ventajas específicas que hacen que el aumento de actividad híbrido sea más rápido, confiable y fácil de administrar.
Comienza a desarrollar en Google Cloud con el crédito gratis de $300 y los más de 20 productos del nivel Siempre gratuito.