Opciones de almacenamiento


Compute Engine ofrece varias opciones de almacenamiento para tus instancias de VM. Cada una de las siguientes opciones de almacenamiento tiene características únicas de precio y rendimiento:

  • Los volúmenes de Persistent Disk proporcionan almacenamiento de red redundante y de alto rendimiento. Cada volumen de Persistent Disk se quita en cientos de discos físicos.
    • De forma predeterminada, las VMs usan discos persistentes zonales y almacenan tus datos en volúmenes ubicados dentro de una sola zona, como us-west1-c.
    • También puedes crear discos persistentes regionales, que replican los datos entre discos ubicados en dos zonas de forma síncrona y proporcionan protección si una zona deja de estar disponible.
  • Los volúmenes de Hyperdisk ofrecen el almacenamiento de red redundante más rápido para Compute Engine, con volúmenes y volúmenes configurables a los que se les puede cambiar el tamaño de forma dinámica.
  • Los SSDs locales son unidades físicas conectadas directamente al mismo servidor que tu VM. Pueden ofrecer un mejor rendimiento, pero son efímeros.
  • También puedes usar buckets de Cloud Storage y Filestore con las VMs.

Cada opción de almacenamiento tiene características únicas de precio y rendimiento. Consulta Precios de discos para comparar los costos. Si no estás seguro de qué opción usar, la solución más común es agregar un disco persistente a tu instancia.

Introducción

Según la configuración predeterminada, cada instancia de Compute Engine tiene un solo disco de arranque que contiene el sistema operativo. Por lo general, los datos del disco de arranque se almacenan en un volumen de Persistent Disk (PD). Cuando tus aplicaciones requieren espacio de almacenamiento adicional, puedes aprovisionar uno o más de los siguientes volúmenes de almacenamiento a tu instancia.

Para obtener más información sobre cada opción de almacenamiento, consulta la siguiente tabla:

PD
estándar
zonal
PD
estándar
regional
PD
balanceado
zonal
PD
balanceado
regional
PD SSD
zonal
PD SSD
regional
PD
de extremo zonal
Hyperdisk Extreme SSD locales Depósitos de Cloud Storage
Tipo de almacenamiento Almacenamiento en bloque eficiente y confiable Almacenamiento en bloque eficiente y confiable con replicación síncrona en dos zonas en una región Almacenamiento en bloque rentable y confiable Almacenamiento en bloque rentable y confiable con replicación síncrona en dos zonas de una región Almacenamiento en bloque rápido y confiable Almacenamiento en bloque rápido y confiable con replicación síncrona en dos zonas de una región Opción de almacenamiento en bloque de Persistent Disk con mayor rendimiento con IOPS personalizables La opción de almacenamiento en bloque más rápida con IOPS personalizables Almacenamiento en bloque local de alto rendimiento Almacenamiento de objetos asequible
Capacidad mínima por disco 10 GiB 200 GiB 10 GiB 10 GiB 10 GiB 10 GiB 500 GiB 64 GiB 375 GiB No disponible
Capacidad máxima por disco 64 TiB 64 TiB 64 TiB 64 TiB 64 TiB 64 TiB 64 TiB 64 TiB 375 GiB No disponible
Aumento de capacidad 1 GiB 1 GiB 1 GiB 1 GiB 1 GiB 1 GiB 1 GiB 1 GiB Depende del tipo de máquina No disponible
Capacidad máxima por instancia 257 TiB* 257 TiB* 257 TiB* 257 TiB* 257 TiB* 257 TiB* 257 TiB* 257 TiB* 9 TiB Casi infinito
Alcance del acceso Zona Zona Zona Zona Zona Zona Zona Zona Instancia Global
Redundancia de datos Zonal Multizonal Zonal Multizonal Zonal Multizonal Zonal Zonal Ninguna Regional, birregional o multirregional
Encriptación en reposo
Claves de encriptación personalizadas No
Instructivo Agrega un disco persistente estándar Agrega un disco persistente estándar regional Agrega un disco persistente balanceado Agrega un disco persistente regional balanceado Agrega un disco persistente SSD Agrega un disco persistente SSD regional Agrega un disco persistente extremo Agrega un Hyperdisk Agrega una SSD local Conecta un bucket

* Si planeas crear un volumen lógico mayor a 64 TB, revisa cómo afecta el tamaño del volumen lógico al rendimiento.

El incremento de capacidad para SSD locales depende de la cantidad de discos SSD (particiones) permitidas por VM, que varía según el tipo de máquina. Para obtener más información, consulta los Tipos de máquinas y SSD locales.

Además de las opciones de almacenamiento que se enumeran en la tabla anterior, Google Cloud ofrece los siguientes servicios de almacenamiento para tus instancias:

Los recursos de almacenamiento en bloque tienen diferentes características de rendimiento. Ten en cuenta el tamaño de almacenamiento y los requisitos de rendimiento cuando determinas el tipo de almacenamiento en bloque correcto para tus instancias de VM.

A fin de obtener información sobre los límites de rendimiento para cada tipo de disco, consulta los siguientes vínculos:

Los discos persistentes creados en modo de multiescritura tienen límites específicos de IOPS y capacidad de procesamiento. Para obtener más detalles, consulta rendimiento de discos persistentes en modo multiescritura.

Discos persistentes

Los discos persistentes son dispositivos de almacenamiento de red duraderos a los que tus instancias pueden acceder al igual que discos físicos de una computadora de escritorio o un servidor. Los datos de cada disco persistente se distribuyen en varios discos físicos. Compute Engine administra los discos físicos y la distribución de datos para garantizar la redundancia y optimizar el rendimiento.

Los discos persistentes se ubican de forma independiente de las instancias de tu máquina virtual (VM), por lo que puedes separar o trasladar los discos persistentes para mantener tus datos, incluso después de borrar tus instancias. El rendimiento del disco persistente se escala de forma automática con el tamaño, por lo que puedes cambiar el tamaño de tus discos persistentes existentes o agregar más discos persistentes a una instancia para cumplir con tus requisitos de rendimiento y espacio de almacenamiento.

Tipos de discos persistentes

Cuando configuras un disco persistente, puedes seleccionar uno de los siguientes tipos de disco:

  • Discos persistentes estándar (pd-standard)
    • Apto para cargas de trabajo de procesamiento de datos grandes que usan fundamentalmente E/S secuenciales.
    • Respaldado por unidades de disco duro estándar (HDD).
  • Discos persistentes balanceados (pd-balanced)
    • Una alternativa al disco persistente de rendimiento (pd-ssd)
    • Equilibrio entre rendimiento y costo. Para la mayoría de las formas de VM, excepto las muy grandes, estos discos tienen las mismas IOPS máximas que los discos persistentes SSD y una cantidad más baja de IOPS por GB. Este tipo de disco ofrece niveles de rendimiento adecuados para la mayoría de las aplicaciones de uso general a un precio que se encuentra entre los discos persistentes de rendimiento (pd-ssd) y los estándar.
    • Respaldado por unidades de estado sólido (SSD).
  • Discos persistentes de rendimiento (SSD) (pd-ssd)
    • Apto para aplicaciones empresariales y bases de datos de alto rendimiento que requieren una latencia más baja y más IOPS que los discos persistentes estándar.
    • Diseñado para latencias de milisegundos de un solo dígito; la latencia observada es específica de la aplicación.
    • Respaldado por unidades de estado sólido (SSD).
  • Discos persistentes extremos (pd-extreme)
    • Ofrecen un alto rendimiento constante para cargas de trabajo de acceso aleatorio y con capacidad de procesamiento masiva.
    • Diseñado para cargas de trabajo de bases de datos de alta gama.
    • Te permite aprovisionar las IOPS de destino.
    • Respaldado por unidades de estado sólido (SSD).
    • Disponible con una cantidad limitada de tipos de máquinas.

Si creas un disco en la consola de Google Cloud, el tipo de disco predeterminado es pd-balanced. Si creas un disco con la CLI de gcloud o la API de Compute Engine, el tipo de disco predeterminado es pd-standard.

Para obtener información sobre la compatibilidad de tipos de máquinas, consulta los siguientes vínculos:

Durabilidad de los discos persistentes

La durabilidad del disco representa la probabilidad de pérdida de datos, por diseño, de un disco típico en un año típico, mediante un conjunto de suposiciones sobre fallas de hardware, la probabilidad de eventos catastróficos, prácticas de aislamiento y procesos de ingeniería en los Centros de Datos de Google y las codificaciones internas que usa cada tipo de disco. Los eventos de pérdida de datos del disco persistente son muy poco frecuentes y suelen ser el resultado de fallas de hardware coordinadas, errores de software o una combinación de ambos. Google también toma muchas medidas para mitigar el riesgo de toda la industria por el daño silencioso en los datos. Un error humano de un cliente de Google Cloud, como cuando un cliente borra un disco por accidente, está fuera del alcance de la durabilidad del disco persistente.

Existe un riesgo mínimo de que se pierdan datos con un disco persistente regional debido a las codificaciones y la replicación internas de los datos. Los discos persistentes regionales proporcionan el doble de réplicas que los discos persistentes zonales, con sus réplicas distribuidas entre dos zonas de la misma región, por lo que proporcionan alta disponibilidad. Se pueden usar para la recuperación ante desastres si se pierde un centro de datos completo y no se puede recuperar (aunque eso nunca ocurrió). Se puede acceder a las réplicas adicionales en una segunda zona de inmediato si una zona principal deja de estar disponible durante una interrupción prolongada.

Ten en cuenta que la durabilidad es una agregación para cada tipo de disco y no representa un Acuerdo de Nivel de Servicio (ANS) que está respaldado en términos financieros.

En la siguiente tabla, se muestra la durabilidad para cada diseño de tipo de disco. La durabilidad del 99.999% significa que, con 1,000 discos, podrías pasar cien años sin perder uno.

Disco persistente estándar zonal Disco persistente balanceado zonal Disco persistente SSD zonal Disco persistente extremo zonal Disco persistente estándar regional Disco persistente regional equilibrado Disco persistente SSD regional
Mejor que el 99.99% Mejor que el 99.999% Mejor que el 99.999% Mejor que el 99.9999% Mejor que el 99.999% Mejor que el 99.9999% Mejor que el 99.9999%

Discos persistentes zonales

Facilidad de uso

Compute Engine controla la mayoría de las tareas de administración de disco para que no tengas que ocuparte de la partición, los conjuntos de discos redundantes o la administración de subvolúmenes. Por lo general, no necesitas crear volúmenes lógicos más grandes, pero puedes ampliar la capacidad del disco persistente secundario adjunto a 257 TB por instancia y aplicar estas prácticas a tus discos persistentes si lo deseas. Puedes ahorrar tiempo y obtener el mejor rendimiento si formateas tus discos persistentes con un solo sistema de archivos y sin tablas particionadas.

Si necesitas separar tus datos en varios volúmenes únicos, crea discos adicionales, en lugar de dividir tus discos existentes en varias particiones.

Cuando necesites espacio adicional en tus discos persistentes, cambia el tamaño de tus discos en lugar de volver a particionar y formatear.

Rendimiento

El rendimiento del disco persistente es predecible y se escala de forma lineal con capacidad aprovisionada hasta que se alcanzan los límites para las CPU virtuales aprovisionadas de una instancia. Para obtener más información sobre los límites y la optimización del escalamiento del rendimiento, consulta Configura discos para cumplir con los requisitos de rendimiento.

Los discos persistentes estándar son eficientes y asequibles para controlar operaciones de lectura y escritura secuenciales, pero no están optimizados a fin de controlar tasas altas de operaciones de entrada y salida aleatorias por segundo (IOPS). Si las apps requieren tasas altas de IOPS aleatorias, debes usar SSD o discos persistentes extremos. Los discos persistentes SSD están diseñados para latencias de milisegundos de un solo dígito. La latencia que se observa es específica de la aplicación.

Compute Engine optimiza el rendimiento y el ajuste de escala en discos persistentes de forma automática. No necesitas seleccionar varios discos ni discos precalentados para obtener el mejor rendimiento. Cuando necesites más espacio en el disco o un mejor rendimiento, cambia el tamaño de tus discos y, en lo posible, agrega más CPU virtuales para agregar más espacio de almacenamiento, IOPS y capacidad de procesamiento. El rendimiento del disco persistente se basa en la capacidad total del disco persistente adjunta a una instancia y en la cantidad de CPU virtuales que tiene la instancia.

Para los dispositivos de arranque, puedes reducir los costos mediante un disco persistente estándar. Los discos persistentes pequeños de 10 GB pueden funcionar en casos prácticos básicos de administración de paquetes y arranque. Sin embargo, a fin de garantizar un rendimiento coherente para un uso más general del dispositivo de arranque, debes usar un disco persistente balanceado como disco de arranque.

Cada operación de escritura de disco persistente contribuye al tráfico de salida de red acumulativo para tu instancia. Esto significa que las operaciones de escritura del disco persistente están limitadas por el límite de salida de red para tu instancia.

Confiabilidad

Los discos persistentes tienen redundancia incorporada a fin de proteger tus datos contra fallas del equipo, así como para garantizar la disponibilidad de los datos a través de eventos de mantenimiento del centro de datos. Las sumas de verificación se calculan para todas las operaciones del disco persistente a fin de que podamos asegurarnos de que lo que leas sea lo que escribiste.

Además, puedes crear instantáneas de discos persistentes para obtener protección contra la pérdida de datos debido a un error del usuario. Las instantáneas son incrementales y crearlas solo te llevará unos minutos, incluso si tus discos de instantáneas se encuentran adjuntos a instancias en ejecución.

Modo de multiescritura

Puedes conectar un disco persistente SSD en modo de multiescritura a un máximo de dos VM N2 de forma simultánea para que ambas puedan leer y escribir en el disco. Los discos persistentes en modo multiescritura proporcionan una capacidad de almacenamiento en bloque compartido y presentan una base de infraestructura para compilar un sistema de archivos de red (NFS) distribuido y servicios similares con alta disponibilidad. Sin embargo, los discos persistentes con modo multiescritura requieren sistemas de archivos especializados, como GlusterFS o GFS2. Muchos sistemas de archivos, como EXT4, XFS y NTFS, no están diseñados para usarse con almacenamiento en bloque compartido. Para obtener más información sobre las prácticas recomendadas cuando se comparten discos persistentes entre las VM, consulta las prácticas recomendadas. Si necesitas almacenamiento de archivos completamente administrado, puedes activar un archivo compartido de Filestore en tus VM de Compute Engine.

A fin de habilitar el modo multiescritura para los discos persistentes nuevos, crea un nuevo disco y especifica la marca --multi-writer en la CLI de gcloud o la propiedad multiWriter en la API de Compute Engine. Para obtener más información, consulta Comparte discos persistentes entre VM.

Encriptación del disco persistente

Compute Engine encripta de forma automática tus datos antes de que se trasladen fuera de tu instancia al espacio de almacenamiento del disco persistente. Cada disco persistente permanece encriptado con claves definidas por el sistema o con claves suministradas por el cliente. Google distribuye datos de discos persistentes en varios discos físicos de cierta manera que los usuarios no pueden controlar.

Cuando borras un disco persistente, Google descarta las claves de encriptación, lo que hace que los datos sean irrecuperables. Este proceso es irreversible.

Si deseas controlar las claves de encriptación que se usan para encriptar tus datos, crea tus discos con tus propias claves de encriptación.

Restricciones

  • No puedes conectar un disco persistente a una instancia en otro proyecto.

  • Puedes conectar un disco persistente balanceado a un máximo de 10 instancias de VMs en modo de solo lectura.

  • Para los tipos personalizados de máquinas o los tipos de máquinas predefinidos que tienen un mínimo de 1 CPU virtual, puedes conectar hasta 128 discos persistentes.

  • Cada disco persistente puede alcanzar un tamaño de hasta 64 TB, por lo que no es necesario administrar varios conjuntos de discos para crear grandes volúmenes lógicos. Cada instancia puede adjuntar solo una cantidad limitada de espacio de disco persistente total y un número limitado de discos persistentes individuales. Los tipos predefinidos de máquinas y tipos personalizados de máquinas tienen los mismos límites de discos persistentes.

  • La mayoría de las instancias pueden tener hasta 128 discos persistentes y hasta 257 TB de espacio de disco persistente total adjunto. El espacio total de discos persistentes para una instancia incluye el tamaño del disco persistente de inicio.

  • Los tipos de máquinas de núcleo compartido tienen un límite de 16 discos persistentes y 3 TB de espacio total en el disco persistente.

  • Crear volúmenes lógicos de más de 64 TB puede requerir una consideración especial. Para obtener más información sobre el rendimiento de un volumen lógico más grande, consulta Tamaño del volumen lógico.

Discos persistentes regionales

Los discos persistentes regionales tienen cualidades de almacenamiento similares a los discos persistentes zonales. Sin embargo, los discos persistentes regionales proporcionan almacenamiento duradero y replicación de datos entre dos zonas en la misma región.

Si diseñas sistemas sólidos o servicios de alta disponibilidad en Compute Engine, usa discos persistentes regionales combinados con otras prácticas recomendadas, como crear una copia de seguridad de los datos mediante instantáneas. Los discos persistentes regionales también están diseñados para funcionar con grupos de instancias administrados regionales.

En el caso improbable de una interrupción zonal, puedes conmutar por error la carga de trabajo que se ejecuta en discos persistentes regionales a otra zona mediante la marca --force-attach. La marca --force-attach te permite adjuntar el disco persistente regional a una instancia de VM en espera incluso si el disco no se puede desconectar de la VM original debido a su falta de disponibilidad. Para obtener más información, consulta Conmutación por error del disco persistente regional. No se puede forzar la conexión de un disco persistente zonal a una instancia.

Rendimiento

Los discos persistentes regionales están diseñados para cargas de trabajo que requieren un objetivo de punto de recuperación (RPO) y un objetivo de tiempo de recuperación (RTO) menores en comparación con las instantáneas de disco persistentes.

Los discos persistentes regionales son una opción cuando el rendimiento de escritura es menos crítico que la redundancia de datos en varias zonas.

Al igual que los discos persistentes zonales, los regionales pueden lograr un mayor rendimiento de IOPS y de capacidad de procesamiento en instancias con una mayor cantidad de CPU virtuales. Para obtener más información sobre esta y otras limitaciones, consulta Configura los discos para cumplir con los requisitos de rendimiento.

Cuando necesites más espacio en el disco o mayor rendimiento, puedes cambiar el tamaño de los discos regionales para agregar más espacio de almacenamiento, IOPS y capacidad de procesamiento.

Confiabilidad

Compute Engine replica los datos de tu disco persistente regional en las zonas que seleccionaste cuando creaste tus discos. Los datos de cada répl