¿Qué es la escalabilidad en la nube?

La escalabilidad en la nube es la capacidad de un sistema de cloud computing para aumentar o disminuir sus recursos, como la potencia de computación, el almacenamiento y el ancho de banda de la red, con el fin de satisfacer las demandas cambiantes. Puede ser una ventaja clave de la nube, ya que permite a las empresas gestionar los aumentos o las disminuciones de la carga de trabajo sin tener que renovar toda su infraestructura. Esto significa que puedes ajustar fácilmente tus recursos a medida que tu empresa crece o que el tráfico de tu aplicación cambia, pagando solo por lo que usas.

Escalabilidad frente a elasticidad en el cloud computing

Aunque a menudo se usan indistintamente, la escalabilidad y la elasticidad son conceptos diferentes. Ambos conceptos se refieren a la capacidad de un sistema para gestionar las demandas cambiantes, pero lo hacen de formas distintas.

Escalabilidad

La escalabilidad es la capacidad de un sistema para gestionar una cantidad de trabajo cada vez mayor añadiendo recursos a lo largo del tiempo. A menudo, se trata de una estrategia planificada a largo plazo para satisfacer el aumento de la demanda. Por ejemplo, una empresa puede planificar el aumento de los recursos de su base de datos para prepararse para una gran campaña de marketing que atraerá a más usuarios. Es la capacidad de un sistema para ampliarse y adaptarse al crecimiento futuro.

Flexibilidad

La elasticidad es la capacidad de un sistema para ajustar los recursos de forma automática y rápida en tiempo real, respondiendo a los cambios inmediatos en la demanda. Piensa en ello como una goma elástica que se estira y se encoge. Por ejemplo, un sitio web de comercio electrónico podría diseñarse para añadir automáticamente más servidores que gestionen un aumento repentino del tráfico en un día como el Black Friday y, después, reducir el número de servidores cuando el tráfico disminuya. La elasticidad consiste en hacer ajustes dinámicos bajo demanda para adaptarse a la demanda actual, lo que puede ayudar a optimizar los costes y el rendimiento.

Tipos de escalabilidad en el cloud computing

La escalabilidad en la nube se presenta principalmente de dos formas: escalabilidad vertical y escalabilidad horizontal. El enfoque adecuado depende de la arquitectura de la aplicación y de la naturaleza de la carga de trabajo.

Escalado vertical (ascendente o descendente)

El escalado vertical es el proceso de añadir o quitar recursos de un solo servidor o máquina. Es como mejorar un solo ordenador con un procesador más rápido o más RAM. El objetivo es hacer que una máquina sea más potente.

Cómo funciona el escalado vertical

Puedes escalar verticalmente aumentando la capacidad de una máquina virtual (VM) que ya tengas. Por ejemplo, si tu aplicación se ejecuta en una máquina virtual con un número determinado de núcleos de CPU y una cantidad determinada de memoria, puedes escalar verticalmente simplemente eligiendo una máquina virtual más grande con más recursos. Del mismo modo, puedes reducir la escala pasando a una VM más pequeña.

Escalado horizontal (ascendente o descendente)

El escalado horizontal consiste en aumentar el número de máquinas o nodos de un sistema para distribuir la carga de trabajo de forma más eficaz. Es como añadir más ordenadores a una red para compartir el trabajo. El objetivo es aumentar la capacidad usando varias máquinas en lugar de hacer que una sola sea más potente.

Cómo funciona el escalado horizontal

El escalado horizontal consiste en ejecutar tu aplicación en varias máquinas virtuales. Un balanceador de carga se encarga de distribuir el tráfico entrante entre esas máquinas. A medida que aumenta la demanda, puedes añadir más máquinas virtuales al grupo de forma automática o manual. Cuando la demanda disminuya, puedes quitarlos.

Escalado vertical frente a horizontal: elegir la estrategia adecuada

La decisión de escalar vertical u horizontalmente depende de la arquitectura de tu aplicación y de las necesidades de tu empresa.

Función	Escalado vertical	Escalado horizontal
Complejidad	Es más sencillo, ya que solo implica una máquina.	Más complejo ya que requiere gestionar varios nodos y un equilibrador de carga.
Inactividad	Puede provocar una breve interrupción del servicio durante una actualización.	Normalmente no tiene tiempo de inactividad, ya que se añaden máquinas nuevas sin interrumpir las que ya están en funcionamiento.
Límite de escalabilidad	Limitado por la capacidad física de una sola máquina.	Casi ilimitado, ya que puedes añadir tantas máquinas como necesites.
Tolerancia a fallos	Tiene un único punto de fallo: si la máquina se estropea, la aplicación deja de estar disponible.	Alta tolerancia a fallos: si una máquina falla, las demás pueden seguir funcionando.

Función

Escalado vertical

Escalado horizontal

Complejidad

Es más sencillo, ya que solo implica una máquina.

Más complejo ya que requiere gestionar varios nodos y un equilibrador de carga.

Inactividad

Puede provocar una breve interrupción del servicio durante una actualización.

Normalmente no tiene tiempo de inactividad, ya que se añaden máquinas nuevas sin interrumpir las que ya están en funcionamiento.

Límite de escalabilidad

Limitado por la capacidad física de una sola máquina.

Casi ilimitado, ya que puedes añadir tantas máquinas como necesites.

Tolerancia a fallos

Tiene un único punto de fallo: si la máquina se estropea, la aplicación deja de estar disponible.

Alta tolerancia a fallos: si una máquina falla, las demás pueden seguir funcionando.

Para mejorar el rendimiento inicialmente, el escalado vertical puede ser el método más eficaz. A medida que tu aplicación se expande y requiere una mayor disponibilidad, la transición al escalado horizontal puede ser más apropiada. Un enfoque híbrido, a veces denominado "escalado diagonal", también combina ambos métodos.

Escalabilidad en la nube con Google Cloud

Aunque muchos proveedores ofrecen funciones de escalado estándar, Google Cloud proporciona un conjunto de herramientas diferenciadas y flexibles diseñadas para satisfacer las necesidades cambiantes de las aplicaciones modernas. Estas ofertas, que van desde predicciones basadas en el aprendizaje automático hasta funciones híbridas únicas, pueden ayudarte a optimizar el rendimiento y los costes de forma más eficaz.

Autoescalado predictivo

El autoescalado tradicional es reactivo: añade recursos solo después de que la demanda ya haya aumentado, lo que a veces puede provocar breves retrasos en el rendimiento. El autoescalado predictivo de Compute Engine resuelve este problema usando el aprendizaje automático para predecir la carga futura basándose en tu historial de datos. Puede escalar tu infraestructura antes de que llegue el tráfico previsto, lo que ayuda a asegurar que tus aplicaciones estén listas para servir a los usuarios en el momento en que llegue la demanda.

Tipos de máquinas personalizadas

La mayoría de los proveedores de servicios en la nube te obligan a elegir entre "tallas" predefinidas para tus máquinas virtuales, lo que suele llevar a pagar por recursos que no necesitas. Google Cloud ofrece tipos de máquinas personalizadas, lo que te permite adaptar el número exacto de vCPUs y la cantidad de memoria para tus cargas de trabajo. Este control granular te ayuda a escalar verticalmente tu infraestructura de forma eficiente, adaptando los recursos a la tarea en lugar de al revés.

Ráfaga en la nube y escalabilidad híbrida

Para las empresas que tienen una infraestructura on-premise, gestionar los picos de tráfico repentinos puede ser un reto. El cloud bursting te permite "transferir" el tráfico excedente a la nube pública cuando tu centro de datos privado alcanza su capacidad máxima. Las soluciones híbridas y multinube de Google Cloud, como GKE Enterprise, ofrecen la coherencia y la flexibilidad necesarias para gestionar cargas de trabajo en distintos entornos, lo que te permite escalar indefinidamente sin tener que abandonar tus inversiones actuales.

Escalabilidad sin servidor con Cloud Run

Cloud Run te permite ejecutar aplicaciones en contenedores sin tener que gestionar la infraestructura subyacente. Un factor clave que lo diferencia de otros servicios es su capacidad de escalarse a cero, lo que significa que, si no hay tráfico, no usas recursos y no pagas nada. Cuando el tráfico vuelve, Cloud Run puede escalar casi al instante de cero a miles de instancias, lo que lo hace ideal para aplicaciones con patrones de tráfico muy variables o impredecibles.

Balanceo de carga global

La escalabilidad no consiste solo en añadir servidores, sino en conseguir que el tráfico llegue a ellos de forma eficiente. Google Cloud Load Balancing usa una única dirección IP anycast global para distribuir el tráfico entre tus recursos de todo el mundo. Esto te permite escalar tu aplicación a nivel mundial sin configuraciones de DNS complejas ni fragmentación regional, lo que garantiza que los usuarios siempre se dirijan a la instancia más cercana que esté en buen estado y tenga capacidad disponible.

Ventajas clave de la escalabilidad en la nube

La escalabilidad en la nube puede ofrecer varias ventajas importantes que son difíciles de conseguir con la infraestructura on-premise tradicional.

Rentabilidad

De esta forma, puedes evitar el aprovisionamiento excesivo de recursos y los altos costes de mantener hardware inactivo. Con la escalabilidad de la nube, solo pagas por los recursos que usas, lo que convierte los costes fijos en variables.

Rendimiento y disponibilidad mejorados

Al ajustar los recursos de forma dinámica, tus aplicaciones pueden mantener un alto rendimiento más fácilmente, incluso durante los picos de demanda, lo que evita ralentizaciones e interrupciones del servicio que pueden frustrar a los usuarios.

Gestión de la demanda impredecible

La escalabilidad te ayuda a gestionar picos de tráfico inesperados, como los que se producen cuando una publicación en redes sociales se hace viral, sin tener que añadir hardware nuevo manualmente.

Agilidad empresarial

La capacidad de escalar rápidamente te ayuda a innovar y a responder a los cambios del mercado más rápido. Podrías implementar nuevas funciones o aplicaciones sin tener que esperar a que se configure la infraestructura.

Soluciona los retos empresariales que se te presenten con Google Cloud

Los nuevos clientes reciben 300 USD en crédito sin coste para invertirlos en Google Cloud.

Escalabilidad en la nube con Google Cloud

Google Cloud ofrece una serie de servicios diseñados para ayudarte a crear aplicaciones altamente escalables. Muchos de estos servicios tienen funciones de escalado automático integradas, por lo que no tienes que gestionar la infraestructura subyacente.

¿Qué es la escalabilidad en la nube?

Patrones para aplicaciones escalables y resilientes

Escalabilidad frente a elasticidad en el cloud computing

Escalabilidad

Flexibilidad

Tipos de escalabilidad en el cloud computing

Escalado vertical (ascendente o descendente)

Escalado horizontal (ascendente o descendente)

Escalado vertical frente a horizontal: elegir la estrategia adecuada

Escalabilidad en la nube con Google Cloud

Autoescalado predictivo

Tipos de máquinas personalizadas

Ráfaga en la nube y escalabilidad híbrida

Escalabilidad sin servidor con Cloud Run

Balanceo de carga global

Ventajas clave de la escalabilidad en la nube

Rentabilidad

Rendimiento y disponibilidad mejorados

Gestión de la demanda impredecible

Agilidad empresarial

Soluciona los retos empresariales que se te presenten con Google Cloud

Escalabilidad en la nube con Google Cloud

Ve un paso más allá

¿Necesitas ayuda para empezar?

Trabaja con un partner de confianza

Sigue explorando