Antes de que se produzca el evento de capacidad máxima, gestiona y optimiza los recursos que utilizan tus Google Cloud cargas de trabajo. Esto implica ajustar el tamaño de los recursos en función del uso y la demanda reales, usar el autoescalado para la asignación dinámica de recursos y revisar las recomendaciones de arquitectura y seguridad. Tanto Cloud Monitoring como Recommender (Active Assist) pueden ayudarte a identificar oportunidades para optimizar tus recursos en la nube. Con estas herramientas, puedes obtener información valiosa sobre el uso de los recursos y tomar decisiones fundamentadas antes del evento.
Consulta las Google Cloud prácticas recomendadas
Muchos problemas relacionados con los eventos de capacidad máxima se pueden evitar siguiendo las prácticas recomendadas para el Google Cloud producto que estés usando. A continuación, se muestran algunos ejemplos de guías de prácticas recomendadas:
General | |
BigQuery | |
Cloud Storage | |
Compute Engine | |
Dataflow | |
Dataproc | |
Google Kubernetes Engine |
Revisar la escalabilidad
El autoescalado puede asegurar que tus aplicaciones basadas en la nube tengan los recursos que necesitan para gestionar cargas de trabajo variables, al tiempo que evita el aprovisionamiento excesivo y los costes innecesarios. Google Cloud ofrece varias opciones de autoescalado específicas de cada producto, entre las que se incluyen las siguientes:
- Los grupos de instancias gestionados (MIGs) de Compute Engine son grupos de máquinas virtuales que se gestionan y escalan como una sola entidad. Con los MIGs, puedes definir políticas de autoescalado que especifiquen el número mínimo y máximo de VMs que se deben mantener en el grupo, así como las condiciones que activan el autoescalado.
- La escalabilidad automática de Google Kubernetes Engine (GKE) ajusta de forma dinámica los recursos de tu clúster para que se adapten a las necesidades de tu aplicación. Ofrece herramientas que pueden optimizar el uso de los recursos, asegurar el rendimiento de las aplicaciones y simplificar la gestión de los clústeres.
- Cloud Run ofrece autoescalado integrado, que ajusta automáticamente el número de instancias en función del tráfico entrante.
Antes del evento, te recomendamos que aumentes la escala manualmente. Aunque hayas configurado el autoescalado, es posible que no pueda adaptarse a la demanda debido a la velocidad del tráfico de eventos. Por lo tanto, precarga los recursos con antelación, incluidos los siguientes:
- Máquinas virtuales
- Cachés si quieres precargar
- Componentes sin servidor para evitar los arranques en frío
Revisar las recomendaciones de Active Assist
Active Assist hace referencia al conjunto de herramientas que se usan en Google Cloud para generar recomendaciones y estadísticas que te ayuden a optimizar tus proyectos Google Cloud . Para obtener más información, consulta ¿Qué es Active Assist?
Revisar las versiones de los productos
Asegúrate de que todos tus productos y servicios en la nube estén actualizados a la última versión estable.
Consultar alertas y paneles de control
Identifica y aborda los problemas de forma proactiva evaluando las alertas y los paneles de control que te proporcionan las herramientas de observabilidad de Google Cloud y las soluciones de terceros.
Consulta las métricas, los registros y los seguimientos de Observabilidad de Google Cloud para obtener información valiosa sobre el uso de los recursos, las características de rendimiento y el estado general de tus recursos. Monitoriza métricas importantes que se ajusten a los indicadores de estado del sistema, como la utilización de la CPU, el uso de la memoria, el tráfico de red, las operaciones de E/S de disco y los tiempos de respuesta de las aplicaciones. También debes tener en cuenta las métricas específicas de tu empresa. Si monitorizas estas métricas, puedes identificar posibles cuellos de botella, problemas de rendimiento y limitaciones de recursos. Además, puede configurar alertas para notificar de forma proactiva a los equipos correspondientes sobre posibles problemas o anomalías.
En el caso de las alertas, céntrate en las métricas críticas, define umbrales adecuados para minimizar la fatiga de alertas y asegúrate de responder a tiempo a los problemas importantes. Este enfoque específico te permite mantener la fiabilidad de las cargas de trabajo de forma proactiva. Para obtener más información, consulta el resumen de las alertas.