Optimiza el costo: Almacenamiento

Last reviewed 2023-08-08 UTC

En este documento de framework de arquitectura de Google Cloud, se proporcionan recomendaciones para ayudarte a optimizar el uso y el costo de tus recursos de Cloud Storage, Persistent Disk y Filestore.

La guía de esta sección está destinada a los arquitectos y administradores responsables de aprovisionar y administrar el almacenamiento para las cargas de trabajo en la nube.

Cloud Storage

Cuando planifiques Cloud Storage para tus cargas de trabajo, ten en cuenta los requisitos de rendimiento, retención de datos y patrones de acceso.

Clase de almacenamiento

Elige una clase de almacenamiento que se adapte a los requisitos de retención de datos y frecuencia de acceso de tus cargas de trabajo, como se recomienda en la siguiente tabla:

Requisito de almacenamiento Recomendación
Datos a los que se accede con frecuencia (estadísticas de alta capacidad de procesamiento o data lakes, sitios web, videos en streaming y aplicaciones para dispositivos móviles) Standard Storage
Almacenamiento de bajo costo para datos a los que se accede con poca frecuencia que se pueden almacenar durante al menos 30 días (por ejemplo, copias de seguridad y contenido multimedia de cola larga). Nearline Storage
Datos de acceso infrecuente que se pueden almacenar por al menos 90 días (por ejemplo, réplicas de datos para la recuperación ante desastres) Coldline Storage
Almacenamiento de menor costo para datos a los que se accede con poca frecuencia que se pueden almacenar durante al menos 365 días (por ejemplo, archivos legales y normativos). Archive Storage

Location

Selecciona la ubicación para tus buckets según los requisitos de rendimiento, disponibilidad y redundancia de datos.

  • Las regiones se recomiendan cuando la región está cerca de los usuarios finales. Puedes seleccionar una región específica y obtener redundancia garantizada dentro de la región. Las regiones ofrecen almacenamiento rápido, redundante y asequible para los conjuntos de datos a los que los usuarios dentro de un área geográfica particular acceden con frecuencia.
  • Las multirregiones ofrecen alta disponibilidad para los usuarios distribuidos. Sin embargo, el costo de almacenamiento es más alto que el de las regiones. Los buckets multirregionales se recomiendan para los casos de uso de entrega de contenido y las cargas de trabajo de estadísticas de baja gama.
  • Las regiones dobles proporcionan alta disponibilidad y redundancia de datos. Google recomienda buckets de región doble para cargas de trabajo de estadísticas de alto rendimiento y para casos de uso que requieren buckets verdaderos de activo a activo con procesamiento y almacenamiento en varias ubicaciones. Las regiones dobles te permiten elegir dónde se almacenan tus datos, lo que puede ayudarte a cumplir con los requisitos de cumplimiento. Por ejemplo, puedes usar un bucket de región doble para cumplir con los requisitos específicos de la industria relacionados con la distancia física entre las copias de tus datos en la nube.

Políticas de ciclo de vida

Optimiza el costo de almacenamiento de tus objetos en Cloud Storage mediante la definición de políticas de ciclo de vida. Estas políticas te ayudan a ahorrar dinero, ya que cambian automáticamente a una versión inferior la clase de almacenamiento de los objetos específicos o borran los objetos según las condiciones que establezcas.

Configura las políticas de ciclo de vida según la frecuencia con la que se accede a los objetos y el tiempo que necesitas conservarlos. Los siguientes son ejemplos de políticas de ciclo de vida:

  • Política de cambio a una versión inferior: se espera que se acceda a un conjunto de datos con frecuencia, pero durante solo tres meses. Si quieres optimizar el costo de almacenamiento de este conjunto de datos, usa Standard Storage y configura una política de ciclo de vida para cambiar los objetos con más de 90 días de antigüedad a Coldline Storage.
  • Política de eliminación: un conjunto de datos debe conservarse durante 365 días para cumplir con ciertos requisitos legales y se puede borrar después de ese período. Configura una política para borrar cualquier objeto que tenga más de 365 días.

    A fin de ayudarte a garantizar que los datos que se deben conservar durante un período específico (para el cumplimiento legal o normativo) no se borren antes de esa hora y fecha, configura los bloqueos de políticas de retención.

Responsabilidad

Para impulsar la responsabilidad de los cargos operativos, los cargos de red y el costo de recuperación de datos, usa la configuración de Pagos del solicitante cuando corresponda. Con esta configuración, los costos se cobran al departamento o equipo que usa los datos, en lugar de al propietario.

Define y asigna etiquetas de seguimiento de costos de manera coherente para todos tus buckets y objetos. Automatiza el etiquetado cuando sea posible.

Redundancia

Usa las siguientes técnicas para mantener la redundancia de almacenamiento requerida sin duplicación de datos:

  • Para mantener la resiliencia de los datos con una sola fuente de información, usa un bucket de región doble o múltiple en lugar de copias redundantes de datos en diferentes buckets. Los buckets birregionales y multirregionales proporcionan redundancia en todas las regiones. Los datos se replican de forma asíncrona en dos o más ubicaciones y están protegidos contra las interrupciones regionales.
  • Si habilitas el control de versiones de objetos, considera definir políticas de ciclo de vida para quitar la versión más antigua de un objeto a medida que las versiones más recientes se vuelven no actuales. Cada versión no actual de un objeto se cobra a la misma tarifa que su versión publicada.
  • Inhabilita las políticas de control de versiones de objetos cuando ya no sean necesarias.
  • Revisa las políticas de copia de seguridad y retención de instantáneas de forma periódica y ajústalas para evitar copias de seguridad y retención de datos innecesarias.

Persistent Disk

Cada instancia de VM que implementas en Compute Engine tiene un disco de arranque y, de manera opcional, uno o más discos de datos. Cada disco genera un costo en función del tamaño, la región y el tipo de disco aprovisionados. Las instantáneas que tomes de tus discos generan costos según el tamaño de la instantánea.

Usa las siguientes recomendaciones operativas y de diseño para optimizar el costo de los discos persistentes:

  • No sobreasignes el espacio en el disco. No puedes reducir la capacidad del disco después del aprovisionamiento. Comienza con un disco pequeño y aumenta el tamaño cuando sea necesario. Los discos persistentes se facturan por la capacidad aprovisionada, no por los datos almacenados en los discos.
  • Elige un tipo de disco que coincida con las características de rendimiento de tu carga de trabajo. SSD ofrece IOPS y capacidad de procesamiento altos, pero cuesta más que los discos persistentes estándar.

  • Usa los discos persistentes regionales solo cuando la protección de los datos contra interrupciones zonales sea esencial. Los discos persistentes regionales se replican en otra zona dentro de la región, por lo que se genera el doble de costo que los discos zonales equivalentes.

  • Realiza un seguimiento del uso de tus discos persistentes mediante Cloud Monitoring y configura alertas para los discos con uso bajo.

  • Borra los discos que ya no necesitas.

  • Para los discos que contienen datos que podrías necesitar en el futuro, considera archivar los datos en Cloud Storage de bajo costo y, luego, borrarlos.

  • Busca y responde las recomendaciones en el Centro de recomendaciones.

Considera también usar hiperdiscos para el almacenamiento de alto rendimiento y discos efímeros (SSD locales) para el almacenamiento temporal.

Las instantáneas de disco son incrementales de forma predeterminada y se comprimen de forma automática. Considera las siguientes recomendaciones para optimizar el costo de las instantáneas de disco:

  • Cuando sea posible, organiza tus datos en discos persistentes distintos. Luego, puedes elegir crear copias de seguridad de los discos de forma selectiva y reducir el costo de las instantáneas de discos.
  • Cuando creas una instantánea, selecciona una ubicación según tus requisitos de disponibilidad y los costos de red asociados.
  • Si deseas usar una instantánea de disco de arranque para crear varias VM, crea una imagen a partir de la instantánea y, luego, usa la imagen a fin de crear tus VM. Este enfoque te ayuda a evitar cargos de red por los datos que se transfieren entre la ubicación de la instantánea y la ubicación en la que la restableces.
  • Considera configurar una política de retención a fin de minimizar los costos de almacenamiento a largo plazo para las instantáneas de discos.
  • Borra las instantáneas de discos que ya no necesitas. Cada instantánea en una cadena puede depender de los datos almacenados en una instantánea anterior. Por lo tanto, si borras una instantánea, no siempre se borran todos los datos de la instantánea. Para borrar de forma definitiva los datos de las instantáneas, debes borrar todas las instantáneas de la cadena.

Filestore

El costo de una instancia de Filestore depende de su nivel de servicio, la capacidad aprovisionada y la región en la que se aprovisiona la instancia. Las siguientes son recomendaciones operativas y de diseño para optimizar el costo de las instancias de Filestore:

  • Selecciona un nivel de servicio y un tipo de almacenamiento (HDD o SSD) que sea adecuado para tus necesidades de almacenamiento.
  • No asignes más capacidad. Comienza con un tamaño pequeño y auméntalo más tarde cuando sea necesario. La facturación de Filestore se basa en la capacidad aprovisionada, no en los datos almacenados.
  • Cuando sea posible, organiza tus datos en instancias de Filestore diferentes. Luego, puedes optar por crear copias de seguridad de las instancias de forma selectiva y reducir el costo de las copias de seguridad de Filestore.
  • Cuando elijas la región y la zona, considera crear instancias en la misma zona que los clientes. Se te factura por el tráfico de transferencia de datos desde la zona de la instancia de Filestore.
  • Cuando decidas la región en la que deben almacenarse las copias de seguridad de Filestore, considera los cargos por transferencia de datos para almacenar copias de seguridad en una región diferente a la de la instancia de origen.
  • Realiza un seguimiento del uso de tus instancias de Filestore mediante Cloud Monitoring y configura alertas para las instancias con uso bajo.
  • Reducir la escala verticalmente de la capacidad asignada para las instancias de Filestore que tienen un uso bajo. Puedes reducir la capacidad de las instancias, excepto el nivel Básico.

¿Qué sigue?