Diseña una estrategia de almacenamiento óptima para tu carga de trabajo en la nube

Last reviewed 2023-09-07 UTC

En esta guía, encontrarás ayuda para evaluar los requisitos de almacenamiento de tu carga de trabajo en la nube, comprender las opciones de almacenamiento disponibles en Google Cloud y diseñar una estrategia de almacenamiento que proporcione un valor empresarial óptimo.

Para obtener un resumen visual de las recomendaciones de diseño principales, consulta el diagrama de árbol de decisión.

Si ya leíste este documento y necesitas un resumen de los cambios, consulta la sección registro de cambios.

Descripción general del proceso de diseño

Como cloud architect, cuando planificas el almacenamiento de una carga de trabajo en la nube, primero debes considerar las características funcionales de la carga de trabajo, las restricciones de seguridad, los requisitos de la resiliencia, las expectativas de rendimiento y los objetivos de costos. A continuación, se muestra lo siguiente: debes revisar los servicios y las funciones de almacenamiento disponibles en Google Cloud. Luego, en función de tus requisitos y las opciones disponibles, selecciona los servicios y las funciones de almacenamiento que necesitas.

En el diagrama siguiente, se muestra este proceso de diseño de 3 fases:

Enfoque por fases para diseñar el almacenamiento de las cargas de trabajo en la nube.

Define tus requisitos

Usa los cuestionarios de esta sección para definir los requisitos clave de almacenamiento de la carga de trabajo que deseas implementar en Google Cloud.

Lineamientos para definir los requisitos de almacenamiento

Cuando respondas los cuestionarios, ten en cuenta los siguientes lineamientos:

  • Define los requisitos de forma detallada

    Por ejemplo, si tu aplicación necesita almacenamiento de archivos basado en el sistema de archivos de red (NFS), identifica la versión de NFS requerida.

  • Considera los requisitos futuros

    Por ejemplo, tu implementación actual puede brindar servicios a los usuarios en países dentro de Asia, pero puedes expandir el negocio a otros continentes. En este caso, considera los requisitos regulatorios relacionados con el almacenamiento de los nuevos territorios empresariales.

  • Ten en cuenta las oportunidades y los requisitos específicos de la nube

    • Aprovecha las oportunidades específicas de la nube.

      Por ejemplo, para optimizar el costo de almacenamiento de los datos almacenados en Cloud Storage, puedes controlar la duración del almacenamiento mediante políticas de retención de datos y opciones de configuración del ciclo de vida.

    • Considera los requisitos específicos de la nube.

      Por ejemplo, puede que los datos locales existan en un solo centro de datos y que debas replicar los datos migrados en dos ubicaciones de Google Cloud para redundancia.

Cuestionarios

Los cuestionarios que aparecen a continuación no son listas de tareas exhaustivas para la planificación. Úsalas como punto de partida para analizar de forma sistemática todos los requisitos de almacenamiento de la carga de trabajo que deseas implementar en Google Cloud.

Evalúa las características de la carga de trabajo

  • ¿Qué tipo de datos necesitas almacenar?

    Ejemplos

    • Contenido de sitio web estático
    • Copias de seguridad y archivos para la recuperación ante desastres
    • Registros de auditoría para el cumplimiento
    • Objetos de datos grandes que los usuarios descargan directamente
    • Datos de transacciones
    • Datos heterogéneos y no estructurados

  • ¿Cuánta capacidad necesitas? Ten en cuenta los requisitos actuales y futuros.

  • ¿La capacidad debe escalar de forma automática con el uso?

  • ¿Cuáles son los requisitos de acceso? Por ejemplo, ¿se debe poder acceder a los datos desde fuera de Google Cloud?

  • ¿Cuáles son los patrones de lectura y escritura esperados?

    Ejemplos

    • Lecturas y escrituras frecuentes
    • Escrituras frecuentes, pero lecturas ocasionales
    • Operaciones de lectura y escritura ocasionales
    • Escrituras ocasionales, pero lecturas frecuentes

  • ¿La carga de trabajo necesita acceso basado en archivos, por ejemplo, mediante NFS?

  • ¿Varios clientes deben poder leer o escribir datos en simultáneo?

Identifica restricciones de seguridad

  • ¿Cuáles son tus requisitos de encriptación de datos? Por ejemplo, ¿necesitas usar claves que controlas?

  • ¿Hay algún requisito de residencia de datos?

Define los requisitos de resiliencia de datos

  • ¿Tu carga de trabajo necesita almacenamiento en caché de baja latencia o espacio temporal?
  • ¿Necesita replicar los datos en la nube para agregar redundancia?
  • ¿Necesitas coherencia estricta de lectura y escritura para los conjuntos de datos replicados?

Establece expectativas de rendimiento

  • ¿Cuál es la tasa de E/S requerida?

  • ¿Qué niveles de capacidad de procesamiento de lectura y escritura necesita tu aplicación?

  • ¿Para qué entornos necesitas almacenamiento? En una carga de trabajo determinada, tal vez necesites almacenamiento de alto rendimiento para el entorno de producción, pero puedes elegir una opción de menor rendimiento para los entornos que no son de producción.

Revisa las opciones de almacenamiento

Google Cloud ofrece servicios de almacenamiento para todos los formatos de almacenamiento clave: bloque, archivo y objeto. Revisa y evalúa las funciones, las opciones de diseño y las ventajas relativas de los servicios disponibles para cada formato de almacenamiento.

Descripción general

Almacenamiento en bloque

Los datos que almacenas en el almacenamiento en bloque se dividen en fragmentos que se almacenan como un bloque independiente con una dirección única. Las aplicaciones acceden a los datos mediante la referencia a las direcciones de bloque correspondientes. El almacenamiento en bloque está optimizado para cargas de trabajo de IOPS altas, como el procesamiento de transacciones. Es similar a la red de área de almacenamiento local (SAN) y a los sistemas de almacenamiento conectado de forma directa (DAS).

Las opciones de almacenamiento en bloque en Google Cloud son parte del servicio de Compute Engine.

Opción Descripción general
Persistent Disk Unidades de disco duro (HDD) y unidades de estado sólido (SSD) para aplicaciones empresariales y de bases de datos implementadas en VM de Compute Engine y clústeres de Google Kubernetes Engine (GKE)
Google Cloud Hyperdisk Almacenamiento de red rápido y redundante para las VMs de Compute Engine, con rendimiento y volúmenes configurables a los que se les puede cambiar el tamaño de forma dinámica.
SSD local Almacenamiento efímero en bloque conectado de forma local para aplicaciones de alto rendimiento.

Almacenamiento de archivos

Los datos se organizan y se representan en una jerarquía de archivos que se almacenan en carpetas, similar a lo que sucede en el almacenamiento conectado a la red local (NAS). Los sistemas de archivos se pueden activar en clientes mediante protocolos como NFS y bloques de mensajes del servidor (pyme). Las aplicaciones acceden a los datos con el nombre de archivo y la ruta de acceso del directorio relevantes.

Google Cloud proporciona una variedad de soluciones completamente administradas y de terceros para el almacenamiento de archivos.

Solución Descripción general
Google Cloud Filestore

Servidores de archivos NFSv3 para VM de Compute Engine y clústeres de Google Kubernetes Engine.

Puedes elegir un nivel de servicio (Básico, de escala masiva o Empresarial) que se adapte a tu caso de uso.

Google Cloud NetApp Volumes Almacenamiento basado en archivos con NFSv4.1 o SMB.
Más opciones Consulta Resumen de opciones de servidor de archivos.

Almacenamiento de objetos

Los datos se almacenan como objetos en una jerarquía plana de buckets. A cada objeto se le asigna un ID global único. Los objetos pueden tener metadatos definidos por el usuario y asignados por el sistema para ayudarte a organizar y administrar los datos. Las aplicaciones acceden a los datos mediante la referencia a los ID de objeto mediante las API de REST o las bibliotecas cliente. El almacenamiento de objetos es similar a la SAN local en cuanto a capacidad de escalamiento, pero es más fácil de administrar y menos costoso.

Cloud Storage proporciona almacenamiento de objetos de bajo costo, muy duradero y sin límites para varios tipos de datos. Se puede acceder a los datos que almacenas en Cloud Storage desde cualquier lugar, dentro y fuera de Google Cloud. La replicación con redundancia geográfica proporciona la máxima confiabilidad. Puedes seleccionar una clase de almacenamiento que se adapte a tus requisitos de retención de datos y frecuencia de acceso.

Análisis comparativo

En la siguiente tabla, se proporciona un análisis comparativo de las capacidades clave de los servicios de almacenamiento en Google Cloud.

Persistent Disk Hyperdisk SSD local Filestore Google Cloud NetApp Volumes Cloud Storage
Capacidad

Entre 10 GiB y 64 TiB por disco

257 TiB por VM

Entre 64 GiB y 64 TiB por disco

257 TiB por VM

375 GiB por disco

9 TiB por VM

De 1 a 100 TiB por instancia de Filestore (la capacidad mínima y máxima y los incrementos de escalamiento varían según el nivel de servicio)

Entre 2 y 500 TiB por grupo de almacenamiento

Entre 100 GiB y 100 TiB por volumen

Sin límite máximo o inferior
Escalamiento
  • Escala verticalmente
  • Agrega y quita discos
  • Realiza un ajuste de escala automático con grupos de instancias administrados
Escala el rendimiento y la capacidad de forma dinámica No escalable
  • Nivel Básico: Escala verticalmente
  • Niveles empresariales y zonales: aumenta y reduce la escala verticalmente
Aumenta o reduce la escala verticalmente Escala automáticamente según el uso
Uso compartido
Uso compartido limitado
  • Solo lectura: varias VM
  • Multiescritura: 2 VM
No se puede compartir No se puede compartir Activable en varias VM de Compute Engine, clientes remotos y clústeres de GKE Activable en varias VMs de Compute Engine y clústeres de GKE
  • Lectura y escritura desde cualquier lugar
  • Se integra a Cloud CDN y a CDN de terceros.
Claves de encriptación
Claves administradas por Google, administradas por el cliente o proporcionadas por él Claves administradas por Google, administradas por el cliente o proporcionadas por él Claves administradas por Google
  • Claves administradas por Google (todos los niveles de servicio)
  • Claves administradas por el cliente (niveles Enterprise y Zonal)
Claves administradas por Google o por el cliente Claves administradas por Google, administradas por el cliente o proporcionadas por él
Persistencia
La vida útil del disco La vida útil del disco Efímera (los datos se alojan hasta que se detiene o se borra la VM) Ciclo de vida de la instancia de Filestore Ciclo de vida del volumen Vida útil del bucket
Disponibilidad
Zonal Zonal
  • Disponibilidad regional en instancias empresariales, disponibilidad zonal para instancias básicas y zonales
  • Instantáneas para instancias empresariales y zonales
  • Copias de seguridad
Rendimiento
Escala de forma lineal un rendimiento alto, según el tamaño del disco y la cantidad de CPU Almacenamiento persistente, de alto rendimiento y escalable de forma dinámica Almacenamiento temporal de alto rendimiento
  • Nivel básico: rendimiento coherente
  • Niveles empresariales y zonales: rendimiento del escalamiento de forma lineal

Rendimiento escalable

Las expectativas dependen del nivel de servicio

Ajuste de escala automático de las tasas de lectura y escritura, y la redistribución dinámica de cargas
Administración
Formatea y activa de forma manual Formatea y activa de forma manual Da formato a rayas y activa de forma manual Completamente administrado Completamente administrado Completamente administrado
Cargas de trabajo
  • Aplicaciones intensivas de IOPS o sensibles a la latencia
  • Bases de datos
  • Almacenamiento compartido de solo lectura
  • Copias de seguridad de VM rápidas y duraderas
  • Cargas de trabajo con rendimiento intensivo
  • Estadísticas de escalamiento horizontal
  • Bases de datos optimizadas para escribir en la memoria flash
  • Almacenamiento en caché eficaz para estadísticas
  • Disco para instalación nueva
  • Sistemas de archivos locales de lift-and-shift
  • Archivos de configuración compartidos
  • Utilidades y herramientas comunes
  • Registros centralizados
  • Sistemas de archivos locales de lift-and-shift
  • Archivos de configuración compartidos
  • Utilidades y herramientas comunes
  • Registros centralizados
  • Cargas de trabajo de Windows
  • Videos en streaming
  • Bibliotecas de elementos multimedia
  • Data lakes de alta capacidad de procesamiento
  • Copias de seguridad y archivos
  • Contenido de cola larga

Elige una opción de almacenamiento

Seleccionar una opción de almacenamiento consta de dos partes:

  • Decide qué servicios de almacenamiento necesitas.
  • Selección de las características requeridas y las opciones de diseño en un servicio determinado

    Ejemplos de funciones específicas del servicio y opciones de diseño

    Persistent Disk

    • Región y zona de implementación
    • Replicación regional
    • Tipo de disco, tamaño e IOPS (para un disco persistente extremo)
    • Claves de encriptación: administradas por Google, administradas por el cliente o proporcionadas por el cliente
    • Programación de instantáneas

    Hyperdisk

    • Zona de implementación
    • Tipo de disco, tamaño e IOPS
    • Claves de encriptación: administradas por Google, administradas por el cliente o proporcionadas por el cliente
    • Programación de instantáneas

    Filestore

    • Región y zona de implementación
    • Nivel de la instancia
    • Capacidad
    • Rango de IP: Asignado de forma automática o personalizado
    • Control de acceso

    NetApp Volumes

    • Región de Implementación
    • Nivel de servicio para el grupo de almacenamiento
    • Capacidad de grupo y volumen
    • Protocolo de volumen
    • Reglas de exportación de volumen

    Cloud Storage

    • Ubicación: multirregión, birregión, una sola región
    • Clase de almacenamiento: Estándar, Nearline, Coldline y Archive
    • Control de acceso: Uniforme o detallado
    • Claves de encriptación: administradas por Google, administradas por el cliente o proporcionadas por el cliente
    • Política de retención

Recomendaciones de almacenamiento

Usa las siguientes recomendaciones como punto de partida para elegir los servicios y las funciones de almacenamiento que satisfacen tus requisitos. Estas recomendaciones también se presentan como un árbol de decisión más adelante en este documento.

  • Para las aplicaciones que necesitan acceso basado en archivos, elige un servicio de almacenamiento de archivos adecuado en función del protocolo de acceso requerido.

    Protocolo de acceso Recomendación
    NFSv3

    Usa Filestore.

    Elige un nivel de servicio (Básico, Zonal o Empresarial) que se adapte a tus requisitos de disponibilidad y rendimiento.

    SMB o NFSv4.1 Usa NetApp Volumes.

  • Para cargas de trabajo que necesiten un almacenamiento principal con alto rendimiento, usa SSD locales, Persistent Disks o Hyperdisks según tus requisitos.

    Requisito Recomendación
    Disco para instalación nueva o almacenamiento en caché rápido

    Usa discos SSD locales (efímeros).

    IOPS secuenciales Usa Persistent Disks con el tipo de disco pd-standard.
    Carga de trabajo con muchas IOPS Usa Persistent Disks con el tipo de disco pd-extreme o pd-ssd.
    Equilibrio entre rendimiento y costo Usa Persistent Disks con el tipo de disco pd-balanced.
    Capacidad y rendimiento escalables de forma dinámica

    Usa Hyperdisk.

    Elige un tipo de Hyperdisk adecuado:

    • Se recomienda la capacidad de procesamiento de Hyperdisk para las estadísticas de escalamiento horizontal, las unidades de datos en apps sensibles al costo y el almacenamiento en frío.
    • Se recomienda Hyperdisk Extreme para las cargas de trabajo que necesitan E/S alta, como las bases de datos de alto rendimiento.

    • Según los requisitos de redundancia, elige entre discos zonales y regionales.
      Requisito Recomendación
      Redundancia dentro de una sola zona en una región Usa Persistent Disks o Hyperdisks zonales.
      Redundancia en varias zonas dentro de una región Usa Persistent Disks regionales.
      Para obtener un análisis comparativo detallado, consulta Opciones de disco persistente.
  • Para el almacenamiento a escala ilimitada y disponible a nivel global, usa Cloud Storage.

    Elige la clase de Cloud Storage adecuada en función de la frecuencia de acceso a los datos y la duración del almacenamiento.

    Requisito Recomendación >
    La frecuencia de acceso varía o el período de retención de datos es desconocido o no predecible. Usa la función de Autoclass para trasladar automáticamente los objetos en un bucket a las clases de almacenamiento adecuadas según el patrón de acceso de cada objeto.
    Almacenamiento para los datos a los que se accede con frecuencia, incluidos los data lakes, las estadísticas de alta capacidad de procesamiento, los sitios web, los videos en streaming y las apps para dispositivos móviles.

    Usa Standard Storage.

    Usa Cloud CDN para almacenar en caché los datos a los que se accede con frecuencia y entregarlos desde ubicaciones cercanas a los clientes.

    Almacenamiento de bajo costo para datos a los que se accede con poca frecuencia que se pueden almacenar durante al menos 30 días (por ejemplo, copias de seguridad y contenido multimedia de cola larga). Usa Nearline Storage.
    Almacenamiento de bajo costo para datos de acceso poco frecuente que se pueden almacenar por al menos 90 días (por ejemplo, recuperación ante desastres) Usa Coldline Storage.
    Almacenamiento de menor costo para datos a los que se accede con poca frecuencia que se pueden almacenar por al menos 365 días, incluidos los archivos regulatorios. Usa Archive Storage.

    Para obtener un análisis comparativo detallado, consulta Clases de Cloud Storage.

Árbol de decisión

El siguiente árbol de decisión te guiará a través de las recomendaciones que se analizaron antes:

Aumentar el tamaño de la imagen

Árbol de decisión para seleccionar una estrategia de almacenamiento.

¿Qué sigue?

Registro de cambios

En esta sección, se proporciona un resumen de los cambios técnicos significativos de esta guía.

Fecha Descripción de los cambios
25 de agosto de 2023
  • Se agregó información sobre los siguientes productos y funciones:
    • Hyperdisk
    • Google Cloud NetApp Volumes
    • Autoclass de Cloud Storage
    • Instantáneas para Filestore Zonal
    • Copias de seguridad para Filestore Zonal y Enterprise
  • Se simplificó el diagrama de árbol de decisión y se actualizó para incluir los siguientes productos y funciones:
    • Hyperdisk
    • NetApp Volumes
    • Autoclass de Cloud Storage
    • Niveles de Filestore
6 de octubre de 2021 Se agregó información sobre el nivel Empresarial de Filestore.
20 de agosto de 2021 Publicación inicial.