En esta guía, encontrarás ayuda para evaluar los requisitos de almacenamiento de tu carga de trabajo en la nube, comprender las opciones de almacenamiento disponibles en Google Cloud y diseñar una estrategia de almacenamiento que proporcione un valor empresarial óptimo.
Para obtener un resumen visual de las recomendaciones de diseño principales, consulta el diagrama de árbol de decisión.
Si ya leíste este documento y necesitas un resumen de los cambios, consulta la sección registro de cambios.
Descripción general del proceso de diseño
Como cloud architect, cuando planificas el almacenamiento de una carga de trabajo en la nube, primero debes considerar las características funcionales de la carga de trabajo, las restricciones de seguridad, los requisitos de la resiliencia, las expectativas de rendimiento y los objetivos de costos. A continuación, se muestra lo siguiente: debes revisar los servicios y las funciones de almacenamiento disponibles en Google Cloud. Luego, en función de tus requisitos y las opciones disponibles, selecciona los servicios y las funciones de almacenamiento que necesitas.
En el diagrama siguiente, se muestra este proceso de diseño de 3 fases:
Define tus requisitos
Usa los cuestionarios de esta sección para definir los requisitos clave de almacenamiento de la carga de trabajo que deseas implementar en Google Cloud.
Lineamientos para definir los requisitos de almacenamiento
Cuando respondas los cuestionarios, ten en cuenta los siguientes lineamientos:
Define los requisitos de forma detallada
Por ejemplo, si tu aplicación necesita almacenamiento de archivos basado en el sistema de archivos de red (NFS), identifica la versión de NFS requerida.
Considera los requisitos futuros
Por ejemplo, tu implementación actual puede brindar servicios a los usuarios en países dentro de Asia, pero puedes expandir el negocio a otros continentes. En este caso, considera los requisitos regulatorios relacionados con el almacenamiento de los nuevos territorios empresariales.
Ten en cuenta las oportunidades y los requisitos específicos de la nube
Aprovecha las oportunidades específicas de la nube.
Por ejemplo, para optimizar el costo de almacenamiento de los datos almacenados en Cloud Storage, puedes controlar la duración del almacenamiento mediante políticas de retención de datos y opciones de configuración del ciclo de vida.
Considera los requisitos específicos de la nube.
Por ejemplo, puede que los datos locales existan en un solo centro de datos y que debas replicar los datos migrados en dos ubicaciones de Google Cloud para redundancia.
Cuestionarios
Los cuestionarios que aparecen a continuación no son listas de tareas exhaustivas para la planificación. Úsalas como punto de partida para analizar de forma sistemática todos los requisitos de almacenamiento de la carga de trabajo que deseas implementar en Google Cloud.
Evalúa las características de la carga de trabajo
¿Qué tipo de datos necesitas almacenar?
Ejemplos
- Contenido de sitio web estático
- Copias de seguridad y archivos para la recuperación ante desastres
- Registros de auditoría para el cumplimiento
- Objetos de datos grandes que los usuarios descargan directamente
- Datos de transacciones
- Datos heterogéneos y no estructurados
¿Cuánta capacidad necesitas? Ten en cuenta los requisitos actuales y futuros.
¿La capacidad debe escalar de forma automática con el uso?
¿Cuáles son los requisitos de acceso? Por ejemplo, ¿se debe poder acceder a los datos desde fuera de Google Cloud?
¿Cuáles son los patrones de lectura y escritura esperados?
Ejemplos
- Lecturas y escrituras frecuentes
- Escrituras frecuentes, pero lecturas ocasionales
- Operaciones de lectura y escritura ocasionales
- Escrituras ocasionales, pero lecturas frecuentes
¿La carga de trabajo necesita acceso basado en archivos, por ejemplo, mediante NFS?
¿Varios clientes deben poder leer o escribir datos en simultáneo?
Identifica restricciones de seguridad
¿Cuáles son tus requisitos de encriptación de datos? Por ejemplo, ¿necesitas usar claves que controlas?
¿Hay algún requisito de residencia de datos?
Define los requisitos de resiliencia de datos
- ¿Tu carga de trabajo necesita almacenamiento en caché de baja latencia o espacio temporal?
- ¿Necesita replicar los datos en la nube para agregar redundancia?
- ¿Necesitas coherencia estricta de lectura y escritura para los conjuntos de datos replicados?
Establece expectativas de rendimiento
¿Cuál es la tasa de E/S requerida?
¿Qué niveles de capacidad de procesamiento de lectura y escritura necesita tu aplicación?
¿Para qué entornos necesitas almacenamiento? En una carga de trabajo determinada, tal vez necesites almacenamiento de alto rendimiento para el entorno de producción, pero puedes elegir una opción de menor rendimiento para los entornos que no son de producción.
Revisa las opciones de almacenamiento
Google Cloud ofrece servicios de almacenamiento para todos los formatos de almacenamiento clave: bloque, archivo y objeto. Revisa y evalúa las funciones, las opciones de diseño y las ventajas relativas de los servicios disponibles para cada formato de almacenamiento.
Descripción general
Almacenamiento en bloque
Los datos que almacenas en el almacenamiento en bloque se dividen en fragmentos que se almacenan como un bloque independiente con una dirección única. Las aplicaciones acceden a los datos mediante la referencia a las direcciones de bloque correspondientes. El almacenamiento en bloque está optimizado para cargas de trabajo de IOPS altas, como el procesamiento de transacciones. Es similar a la red de área de almacenamiento local (SAN) y a los sistemas de almacenamiento conectado de forma directa (DAS).
Las opciones de almacenamiento en bloque en Google Cloud son parte del servicio de Compute Engine.
Opción | Descripción general |
---|---|
Persistent Disk | Unidades de disco duro (HDD) y unidades de estado sólido (SSD) para aplicaciones empresariales y de bases de datos implementadas en VM de Compute Engine y clústeres de Google Kubernetes Engine (GKE) |
Google Cloud Hyperdisk | Almacenamiento de red rápido y redundante para las VMs de Compute Engine, con rendimiento y volúmenes configurables a los que se les puede cambiar el tamaño de forma dinámica. |
SSD local | Almacenamiento efímero en bloque conectado de forma local para aplicaciones de alto rendimiento. |
Almacenamiento de archivos
Los datos se organizan y se representan en una jerarquía de archivos que se almacenan en carpetas, similar a lo que sucede en el almacenamiento conectado a la red local (NAS). Los sistemas de archivos se pueden activar en clientes mediante protocolos como NFS y bloques de mensajes del servidor (pyme). Las aplicaciones acceden a los datos con el nombre de archivo y la ruta de acceso del directorio relevantes.
Google Cloud proporciona una variedad de soluciones completamente administradas y de terceros para el almacenamiento de archivos.
Solución | Descripción general |
---|---|
Google Cloud Filestore |
Servidores de archivos NFSv3 para VM de Compute Engine y clústeres de Google Kubernetes Engine. Puedes elegir un nivel de servicio (Básico, de escala masiva o Empresarial) que se adapte a tu caso de uso. |
Google Cloud NetApp Volumes | Almacenamiento basado en archivos con NFSv4.1 o SMB. |
Más opciones | Consulta Resumen de opciones de servidor de archivos. |
Almacenamiento de objetos
Los datos se almacenan como objetos en una jerarquía plana de buckets. A cada objeto se le asigna un ID global único. Los objetos pueden tener metadatos definidos por el usuario y asignados por el sistema para ayudarte a organizar y administrar los datos. Las aplicaciones acceden a los datos mediante la referencia a los ID de objeto mediante las API de REST o las bibliotecas cliente. El almacenamiento de objetos es similar a la SAN local en cuanto a capacidad de escalamiento, pero es más fácil de administrar y menos costoso.
Cloud Storage proporciona almacenamiento de objetos de bajo costo, muy duradero y sin límites para varios tipos de datos. Se puede acceder a los datos que almacenas en Cloud Storage desde cualquier lugar, dentro y fuera de Google Cloud. La replicación con redundancia geográfica proporciona la máxima confiabilidad. Puedes seleccionar una clase de almacenamiento que se adapte a tus requisitos de retención de datos y frecuencia de acceso.
Análisis comparativo
En la siguiente tabla, se proporciona un análisis comparativo de las capacidades clave de los servicios de almacenamiento en Google Cloud.
Persistent Disk | Hyperdisk | SSD local | Filestore | Google Cloud NetApp Volumes | Cloud Storage | |
---|---|---|---|---|---|---|
Capacidad |
Entre 10 GiB y 64 TiB por disco 257 TiB por VM |
Entre 64 GiB y 64 TiB por disco 257 TiB por VM |
375 GiB por disco 9 TiB por VM |
De 1 a 100 TiB por instancia de Filestore (la capacidad mínima y máxima y los incrementos de escalamiento varían según el nivel de servicio) | Entre 2 y 500 TiB por grupo de almacenamiento Entre 100 GiB y 100 TiB por volumen |
Sin límite máximo o inferior |
Escalamiento |
|
Escala el rendimiento y la capacidad de forma dinámica | No escalable |
|
Aumenta o reduce la escala verticalmente | Escala automáticamente según el uso |
Uso compartido |
Uso compartido limitado
|
No se puede compartir | No se puede compartir | Activable en varias VM de Compute Engine, clientes remotos y clústeres de GKE | Activable en varias VMs de Compute Engine y clústeres de GKE |
|
Claves de encriptación |
Claves administradas por Google, administradas por el cliente o proporcionadas por él | Claves administradas por Google, administradas por el cliente o proporcionadas por él | Claves administradas por Google |
|
Claves administradas por Google o por el cliente | Claves administradas por Google, administradas por el cliente o proporcionadas por él |
Persistencia |
La vida útil del disco | La vida útil del disco | Efímera (los datos se alojan hasta que se detiene o se borra la VM) | Ciclo de vida de la instancia de Filestore | Ciclo de vida del volumen | Vida útil del bucket |
Disponibilidad |
|
Zonal | Zonal |
|
| |
Rendimiento |
Escala de forma lineal un rendimiento alto, según el tamaño del disco y la cantidad de CPU | Almacenamiento persistente, de alto rendimiento y escalable de forma dinámica | Almacenamiento temporal de alto rendimiento |
|
Rendimiento escalable Las expectativas dependen del nivel de servicio |
Ajuste de escala automático de las tasas de lectura y escritura, y la redistribución dinámica de cargas |
Administración |
Formatea y activa de forma manual | Formatea y activa de forma manual | Da formato a rayas y activa de forma manual | Completamente administrado | Completamente administrado | Completamente administrado |
Cargas de trabajo |
|
|
|
|
|
|
Elige una opción de almacenamiento
Seleccionar una opción de almacenamiento consta de dos partes:
- Decide qué servicios de almacenamiento necesitas.
- Selección de las características requeridas y las opciones de diseño en un servicio determinado
Ejemplos de funciones específicas del servicio y opciones de diseño
Persistent Disk
- Región y zona de implementación
- Replicación regional
- Tipo de disco, tamaño e IOPS (para un disco persistente extremo)
- Claves de encriptación: administradas por Google, administradas por el cliente o proporcionadas por el cliente
- Programación de instantáneas
Hyperdisk
- Zona de implementación
- Tipo de disco, tamaño e IOPS
- Claves de encriptación: administradas por Google, administradas por el cliente o proporcionadas por el cliente
- Programación de instantáneas
Filestore
- Región y zona de implementación
- Nivel de la instancia
- Capacidad
- Rango de IP: Asignado de forma automática o personalizado
- Control de acceso
NetApp Volumes
- Región de Implementación
- Nivel de servicio para el grupo de almacenamiento
- Capacidad de grupo y volumen
- Protocolo de volumen
- Reglas de exportación de volumen
Cloud Storage
- Ubicación: multirregión, birregión, una sola región
- Clase de almacenamiento: Estándar, Nearline, Coldline y Archive
- Control de acceso: Uniforme o detallado
- Claves de encriptación: administradas por Google, administradas por el cliente o proporcionadas por el cliente
- Política de retención
Recomendaciones de almacenamiento
Usa las siguientes recomendaciones como punto de partida para elegir los servicios y las funciones de almacenamiento que satisfacen tus requisitos. Estas recomendaciones también se presentan como un árbol de decisión más adelante en este documento.
Para las aplicaciones que necesitan acceso basado en archivos, elige un servicio de almacenamiento de archivos adecuado en función del protocolo de acceso requerido.
Protocolo de acceso Recomendación NFSv3 Usa Filestore.
Elige un nivel de servicio (Básico, Zonal o Empresarial) que se adapte a tus requisitos de disponibilidad y rendimiento.
SMB o NFSv4.1 Usa NetApp Volumes. Para cargas de trabajo que necesiten un almacenamiento principal con alto rendimiento, usa SSD locales, Persistent Disks o Hyperdisks según tus requisitos.
Requisito Recomendación Disco para instalación nueva o almacenamiento en caché rápido Usa discos SSD locales (efímeros).
IOPS secuenciales Usa Persistent Disks con el tipo de disco pd-standard
.Carga de trabajo con muchas IOPS Usa Persistent Disks con el tipo de disco pd-extreme
opd-ssd
.Equilibrio entre rendimiento y costo Usa Persistent Disks con el tipo de disco pd-balanced
.Capacidad y rendimiento escalables de forma dinámica Usa Hyperdisk.
Elige un tipo de Hyperdisk adecuado:
- Se recomienda la capacidad de procesamiento de Hyperdisk para las estadísticas de escalamiento horizontal, las unidades de datos en apps sensibles al costo y el almacenamiento en frío.
- Se recomienda Hyperdisk Extreme para las cargas de trabajo que necesitan E/S alta, como las bases de datos de alto rendimiento.
- Según los requisitos de redundancia, elige entre discos zonales y regionales.
Requisito Recomendación Redundancia dentro de una sola zona en una región Usa Persistent Disks o Hyperdisks zonales. Redundancia en varias zonas dentro de una región Usa Persistent Disks regionales.
Para el almacenamiento a escala ilimitada y disponible a nivel global, usa Cloud Storage.
Elige la clase de Cloud Storage adecuada en función de la frecuencia de acceso a los datos y la duración del almacenamiento.
Requisito Recomendación > La frecuencia de acceso varía o el período de retención de datos es desconocido o no predecible. Usa la función de Autoclass para trasladar automáticamente los objetos en un bucket a las clases de almacenamiento adecuadas según el patrón de acceso de cada objeto. Almacenamiento para los datos a los que se accede con frecuencia, incluidos los data lakes, las estadísticas de alta capacidad de procesamiento, los sitios web, los videos en streaming y las apps para dispositivos móviles. Usa Standard Storage.
Usa Cloud CDN para almacenar en caché los datos a los que se accede con frecuencia y entregarlos desde ubicaciones cercanas a los clientes.
Almacenamiento de bajo costo para datos a los que se accede con poca frecuencia que se pueden almacenar durante al menos 30 días (por ejemplo, copias de seguridad y contenido multimedia de cola larga). Usa Nearline Storage. Almacenamiento de bajo costo para datos de acceso poco frecuente que se pueden almacenar por al menos 90 días (por ejemplo, recuperación ante desastres) Usa Coldline Storage. Almacenamiento de menor costo para datos a los que se accede con poca frecuencia que se pueden almacenar por al menos 365 días, incluidos los archivos regulatorios. Usa Archive Storage. Para obtener un análisis comparativo detallado, consulta Clases de Cloud Storage.
Árbol de decisión
El siguiente árbol de decisión te guiará a través de las recomendaciones que se analizaron antes:
Aumentar el tamaño de la imagen
¿Qué sigue?
- Estima el costo de almacenamiento con la calculadora de precios de Google Cloud.
- Conoce las prácticas recomendadas a fin de compilar una topología de nube optimizada para la seguridad, la resiliencia, el costo y el rendimiento.
- Obtén más información sobre las diferencias entre el almacenamiento de objetos, bloques y archivo en Google Cloud (video).
- Obtén más información sobre cómo usar sistemas de archivos paralelos como Lustre para cargas de trabajo de HPC.
Registro de cambios
En esta sección, se proporciona un resumen de los cambios técnicos significativos de esta guía.
Fecha | Descripción de los cambios |
---|---|
25 de agosto de 2023 |
|
6 de octubre de 2021 | Se agregó información sobre el nivel Empresarial de Filestore. |
20 de agosto de 2021 | Publicación inicial. |