Optimiza de forma continua

Last reviewed 2024-09-25 UTC

Este principio del pilar de optimización de costos del framework de arquitectura proporciona recomendaciones para ayudarte a optimizar el costo de tus implementaciones en la nube en función de objetivos comerciales que cambian y evolucionan constantemente.Google Cloud

A medida que tu empresa crece y evoluciona, las cargas de trabajo en la nube deben adaptarse a los cambios en los requisitos de recursos y los patrones de uso. Para obtener el máximo valor de tu inversión en la nube, debes mantener la rentabilidad y, al mismo tiempo, seguir apoyando los objetivos comerciales. Esto requiere un enfoque proactivo y adaptable que se enfoque en la mejora y la optimización continuas.

Para optimizar los costos de forma continua, debes supervisar y analizar de forma proactiva tu entorno de nube, y realizar los ajustes adecuados para cumplir con los requisitos actuales. Enfócate en los indicadores clave de rendimiento (KPI) que afectan directamente la experiencia de los usuarios finales, se alinean con tus objetivos comerciales y proporcionan estadísticas para la mejora continua. Este enfoque te permite identificar y abordar las ineficiencias, adaptarte a las necesidades cambiantes y alinear de forma continua la inversión en la nube con los objetivos comerciales estratégicos. Para equilibrar la observabilidad integral con la rentabilidad, comprende los costos y beneficios de supervisar el uso de recursos y usa estrategias de optimización y mejora de procesos adecuadas.

Recomendaciones

Para supervisar de forma eficaz tu Google Cloud entorno y optimizar los costos de forma continua, ten en cuenta las siguientes recomendaciones.

Enfócate en las métricas relevantes para la empresa

La supervisión eficaz comienza con la identificación de las métricas más importantes para tu empresa y tus clientes. Estas métricas incluyen lo siguiente:

  • Métricas de experiencia del usuario: La latencia, las tasas de error, la productividad y las métricas de satisfacción del cliente son útiles para comprender la experiencia de los usuarios finales cuando usan tus aplicaciones.
  • Métricas de resultados comerciales: Los ingresos, el crecimiento de la base de clientes y la participación se pueden correlacionar con el uso de recursos para identificar oportunidades de optimización de costos.
  • Métricas de DevOps Research & Assessment (DORA): Las métricas, como la frecuencia de implementación, el plazo de entrega para los cambios, la tasa de errores de cambio y el tiempo de restablecimiento, proporcionan estadísticas sobre la eficiencia y la confiabilidad de tu proceso de entrega de software. Si mejoras estas métricas, puedes aumentar la productividad, reducir el tiempo de inactividad y optimizar el costo.
  • Métricas de ingeniería de confiabilidad de sitios (SRE): Los porcentajes de error aceptables ayudan a los equipos a cuantificar y administrar el nivel aceptable de interrupción del servicio. Cuando se establecen expectativas claras de confiabilidad, los porcentajes de errores aceptables empoderan a los equipos para innovar y, además, implementar cambios con más confianza, ya que conocen su margen de seguridad. Este enfoque proactivo promueve un equilibrio entre la innovación y la estabilidad, lo que ayuda a evitar costos operativos excesivos asociados con interrupciones importantes o tiempos de inactividad prolongados.

Usa la observabilidad para optimizar los recursos

Las siguientes son recomendaciones para usar la observabilidad y así identificar cuellos de botella de recursos y recursos infrautilizados en tus implementaciones en la nube:

  • Supervisa el uso de recursos: Usa las métricas de uso de recursos para identificar los recursosGoogle Cloud que se subutilizan. Por ejemplo, usa métricas como el uso de CPU y memoria para identificar los recursos de VM inactivos. En Google Kubernetes Engine (GKE), puedes ver un desglose detallado de los costos y las métricas de optimización relacionadas con los costos. En el caso de Google Cloud VMware Engine, revisa el uso de recursos para optimizar las CUD, el consumo de almacenamiento y el tamaño adecuado de ESXi.
  • Usa las recomendaciones de la nube: Active Assist es una cartera de herramientas inteligentes que te ayudan a optimizar tus operaciones en la nube. Estas herramientas proporcionan recomendaciones prácticas para reducir costos, aumentar el rendimiento, mejorar la seguridad y hasta tomar decisiones enfocadas en la sostenibilidad. Por ejemplo, las estadísticas sobre el ajuste del tamaño de las VMs pueden ayudar a optimizar la asignación de recursos y evitar gastos innecesarios.
  • Correlaciona el uso de recursos con el rendimiento: Analiza la relación entre el uso de recursos y el rendimiento de la aplicación para determinar si puedes cambiar a una versión inferior de recursos menos costosos sin afectar la experiencia del usuario.

Equilibra las necesidades de solución de problemas con el costo

Los datos de observabilidad detallados pueden ayudar a diagnosticar y solucionar problemas. Sin embargo, almacenar cantidades excesivas de datos de observabilidad o exportar datos innecesarios a herramientas de supervisión externas puede generar costos innecesarios. Para solucionar problemas de manera eficiente, ten en cuenta las siguientes recomendaciones:

  • Recopila datos suficientes para solucionar problemas: Asegúrate de que tu solución de supervisión capture suficientes datos para diagnosticar y resolver problemas de manera eficiente cuando surjan. Estos datos pueden incluir registros, seguimientos y métricas en varios niveles de detalle.
  • Usa el muestreo y la agregación: Equilibra la necesidad de datos detallados con las consideraciones de costos mediante técnicas de muestreo y agregación. Este enfoque te permite recopilar datos representativos sin incurrir en costos de almacenamiento excesivos.
  • Comprende los modelos de precios de tus herramientas y servicios de supervisión: Evalúa las diferentes soluciones de supervisión y elige opciones que se alineen con las necesidades, el presupuesto y los patrones de uso específicos de tu proyecto. Ten en cuenta factores como el volumen de datos, los requisitos de retención y las funciones requeridas cuando realices tu selección.
  • Revisa periódicamente la configuración de supervisión: Quita las métricas o los registros innecesarios para evitar recopilar datos excesivos.

Adaptar la recopilación de datos a los roles y establecer políticas de retención específicas para cada rol

Ten en cuenta las necesidades de datos específicas de los diferentes roles. Por ejemplo, los desarrolladores podrían necesitar principalmente acceso a registros de seguimiento y a nivel de la aplicación, mientras que los administradores de TI podrían enfocarse en los registros del sistema y las métricas de infraestructura. Si adaptas la recopilación de datos, puedes reducir los costos de almacenamiento innecesarios y evitar abrumar a los usuarios con información irrelevante.

Además, puedes definir políticas de retención según las necesidades de cada rol y los requisitos normativos. Por ejemplo, los desarrolladores pueden necesitar acceso a registros detallados por un período más corto, mientras que los analistas financieros pueden requerir datos a más largo plazo.

Considera los requisitos normativos y de cumplimiento

En algunos sectores, los requisitos reglamentarios exigen la retención de datos. Para evitar riesgos legales y financieros, debes asegurarte de que tus prácticas de supervisión y retención de datos te ayuden a cumplir con las reglamentaciones relevantes. Al mismo tiempo, debes mantener la eficiencia de costos. Ten en cuenta las siguientes recomendaciones:

  • Determina los requisitos específicos de retención de datos para tu industria o región, y asegúrate de que tu estrategia de supervisión cumpla con ellos.
  • Implementa los mecanismos de recuperación y archivado de datos adecuados para satisfacer las necesidades de auditoría y cumplimiento y, al mismo tiempo, minimizar los costos de almacenamiento.

Implementa alertas inteligentes

Las alertas ayudan a detectar y resolver problemas de forma oportuna. Sin embargo, es necesario encontrar un equilibrio entre un enfoque que te mantenga informado y uno que te abrume con notificaciones. Si diseñas sistemas de alertas inteligentes, puedes priorizar los problemas críticos que tienen un mayor impacto empresarial. Ten en cuenta las siguientes recomendaciones:

  • Prioriza los problemas que afectan a los clientes: Diseña alertas que se activen rápidamente para los problemas que afectan directamente la experiencia del cliente, como interrupciones del sitio web, tiempos de respuesta lentos o fallas en las transacciones.
  • Configura la detección de problemas temporales: Usa umbrales y mecanismos de retraso adecuados para evitar alertas innecesarias por problemas temporales o de autorecuperación del sistema que no afectan a los clientes.
  • Personaliza la gravedad de las alertas: Asegúrate de que los problemas más urgentes reciban atención inmediata diferenciando entre alertas críticas y no críticas.
  • Usa los canales de notificaciones con prudencia: Elige los canales adecuados para las notificaciones de alertas (correo electrónico, SMS o paginación) según la gravedad y la urgencia de las alertas.