Google Cloud para profesionales de centros de datos: almacenamiento

En este artículo, se analizan los servicios de almacenamiento en Google Cloud y cómo se relacionan con los modelos de almacenamiento tradicionales. También se describen los siguientes tipos de almacenamiento y sus equivalentes en la nube:

  • Almacenamiento en disco, incluidos el almacenamiento de conexión directa (DAS), el almacenamiento conectado en red (NAS) y las redes de área de almacenamiento (SAN)
  • Almacenamiento de objetos
  • Almacenamiento de archivos, incluidos los medios de cinta magnética y los conjuntos de discos

Componentes de almacenamiento principales

En esta sección, se proporciona una breve encuesta sobre los componentes principales de almacenamiento proporcionados por Google Cloud.

Almacenamiento en bloque

Google Cloud proporciona dos tipos de almacenamiento en bloque. Ambos tipos de discos están integrados en Compute Engine, el producto de infraestructura como servicio (IaaS) de Google Cloud, y pueden activarse en instancias de máquina virtual (VM) de Compute Engine:

  • Discos persistentes: volúmenes conectados a la red que puedes adjuntar a tus instancias de VM
  • SSD locales, conectados de forma directa a la máquina física en la que se ejecuta tu instancia de VM.

Discos persistentes

Los discos persistentes son volúmenes de almacenamiento en bloque virtuales. Cuando creas una instancia de VM, esta viene con un único disco persistente de arranque que contiene el sistema operativo de la máquina. Puedes adjuntar hasta 128 volúmenes o 257 TB de discos persistentes, según el tipo de máquina de tu VM.

El rendimiento de un disco persistente depende del tipo de disco, el tamaño del disco y la capacidad de procesamiento máxima de la instancia de VM a la que está conectado el disco. Cada disco persistente puede ser HDD o SSD, y cada uno tiene las características de rendimiento asociadas normalmente con su homólogo físico: los discos persistentes estándar HDD son eficientes y económicos para manejar operaciones secuenciales de lectura y escritura, mientras que los SSD son más apropiados para altas tasas de IOPS aleatorias. El rendimiento de un disco persistente determinado aumentará con el tamaño del disco hasta que alcance los límites de capacidad de procesamiento de la instancia de VM adjunta.

Las máquinas que contienen los discos persistentes se ubican en la misma zona que las máquinas que contienen tus instancias de VM y están conectadas con la estructura de la red de Google. Por lo general, las redes de Google pueden entregar más de un petabit por segundo de ancho de banda de bisección total, lo que ayuda a garantizar que estos discos persistentes conectados en red tengan una capacidad de procesamiento y propiedades de E/S comparables a los discos tradicionales conectados a nivel local.

Si bien los discos persistentes están disponibles dentro de la zona en la que residen, no se replican en otras zonas. Si la instancia de VM adjunta a un disco persistente queda sin conexión, ese disco persistente conserva sus datos, pero se vuelve inaccesible. A fin de garantizar una alta disponibilidad para los discos persistentes, el diseño debe considerar este aspecto entre las regiones y zonas en las que se ejecuta la carga de trabajo. Si deseas obtener más información sobre regiones y zonas, consulta Regiones y zonas.

SSD local

Un SSD local está físicamente conectado a la misma máquina host que tu instancia de VM de Compute Engine. Los SSD locales tienen mayor capacidad de procesamiento y menor latencia que los discos persistentes estándar o los discos persistentes SSD. De todos modos, ten en cuenta las siguientes advertencias sobre los SSD locales:

  • Los SSD locales son menos flexibles que los discos persistentes. A diferencia de los discos persistentes, los SSD locales están restringidos a 375 GB de tamaño. Puedes adjuntar hasta 8 volúmenes a una instancia de VM de núcleo no compartido determinada, pero no puedes adjuntar SSD locales a una instancia de VM de núcleo compartido. Además, no puedes usar un SSD local como dispositivo de arranque.
  • Por lo general, los SSD locales no son persistentes. Aunque tus datos persisten si reinicias tu instancia de VM, los datos se perderán si la detienes.

Almacenamiento de objetos

Cloud Storage es un servicio de almacenamiento de objetos alojados que te permite almacenar y acceder a grandes cantidades de objetos binarios, o BLOB, de diferentes tamaños. Los depósitos de Cloud Storage son la opción de almacenamiento más escalable y duradera disponible en Google Cloud. Si tus aplicaciones no requieren almacenamiento en bloque, deberías considerar la posibilidad de almacenar tus datos en un depósito de Cloud Storage.

Cloud Storage ofrece cuatro clases principales de almacenamiento. Todas las clases de almacenamiento de Cloud Storage proporcionan un acceso rápido a todos los datos y admiten el mismo conjunto de llamadas a la API:

  • Estándar ofrece la mayor disponibilidad de las clases de Cloud Storage en una ubicación determinada. Esta clase es ideal para el almacenamiento de contenido a gran escala y la entrega de archivos multimedia. Cuando se usa en la misma región que tus recursos de procesamiento, es ideal para análisis de datos, aprendizaje automático y cargas de procesamiento, como el procesamiento de archivos multimedia.
  • Nearline, Coldline y Archive proporcionan almacenamiento rentable para los datos a los que no deseas acceder de forma frecuente, como datos de copias de seguridad, para recuperación ante desastres y de archivo.

Comparaciones de modelos de servicio

En esta sección, se asocian los modelos de almacenamiento de centros de datos más comunes a las ofertas de Google Cloud Storage y se analiza cómo se alejan los servicios en la nube de las tecnologías tradicionales de centros de datos.

Almacenamiento de conexión directa (DAS)

En un centro de datos, el almacenamiento de conexión directa (DAS), a veces llamado disco local, es un volumen físico conectado de forma directa a un servidor físico. Este volumen se puede adjuntar de manera interna, como con un disco de arranque, o de manera externa, como con un disco duro externo. Si deseas permitir que otros servidores accedan a los datos de un disco local, debes permitir de forma explícita que el sistema operativo del servidor comparta el disco a través de tu red.

En la nube, el disco local y el DAS no son necesariamente sinónimos. En Google Cloud, por ejemplo, tanto los SSD locales como los discos persistentes admiten cargas de trabajo que esperan discos locales:

  • Los discos persistentes, mientras estén conectados a la red en segundo plano, son el análogo predeterminado para DAS en Compute Engine. Ambos tipos de discos persistentes proporcionan un gran rendimiento para sus respectivos casos prácticos, y ambos son menos costosos que los SSD locales, por lo que son una buena opción para la mayoría de las cargas de trabajo.
  • Los SSD locales son análogos de forma más directa al DAS tradicional, y son una buena opción para cargas de trabajo que tienen altos requisitos de rendimiento de almacenamiento. Sin embargo, los SSD locales no brindan almacenamiento continuo. No se pueden usar como discos de arranque y no deben usarse para cargas de trabajo que esperan un almacenamiento local continuo.

Almacenamiento conectado a la red (NAS)

En un centro de datos, un dispositivo de almacenamiento conectado a la red (NAS), también llamado archivador, proporciona una forma para que las aplicaciones lean y actualicen archivos que se comparten entre máquinas. Por lo general, un archivador usa un protocolo que permite a las máquinas cliente activar un sistema de archivos y acceder a estos como si estuvieran alojados a nivel local.

Google Cloud proporciona Filestore, una solución de archivador nativo como servicio. También puedes ejecutar un archivador en Google Cloud de varias maneras. Para obtener más información, consulta Servidores de archivos en Compute Engine.

Red de área de almacenamiento (SAN)

En un centro de datos, una red de área de almacenamiento (SAN) es una unidad de almacenamiento remoto que proporciona acceso a nivel de bloque y una capa de administración interna a través de la cual puedes aprovisionar números de unidad lógica individuales (LUN) para recursos. Cuando se conectan a una SAN, los usuarios la activan como un disco en lugar de conectarse a un servidor con discos adjuntos, como en el caso de un archivador.

En Google Cloud, puedes usar discos persistentes para admitir cargas de trabajo que esperan SAN. En el contexto de las SAN, los discos persistentes son análogos a los volúmenes de discos lógicos a los que se accedería mediante dispositivos de número de unidad lógica (LUN), y se pueden aprovisionar de forma similar. Al igual que con los volúmenes de discos lógicos basados en LUN, puedes activar varios discos persistentes en una sola instancia de VM. También puedes activar un único disco persistente de solo lectura en varias instancias de VM.

Los discos persistentes son locales de una zona determinada, lo que significa que puedes continuar usando la zona LUN como una estrategia para restringir el acceso a la máquina si es necesario.

Cuando transfieres tu SAN a Google Cloud, también obtienes algunos beneficios adicionales que son exclusivos de la nube:

  • Una SAN basada en disco persistente casi no tiene límite de almacenamiento. Puedes aprovisionar nuevos discos persistentes sobre la marcha sin preocuparte por quedarte sin espacio de almacenamiento físico. Sin embargo, las instancias de VM individuales están limitadas a 128 discos persistentes o 64 TB de almacenamiento en bloque.
  • No tienes que preocuparte por las consideraciones de hardware físico, como la optimización de la cantidad de instancias de VM que puedes conectar a un LUN determinado.
  • Debido a que los discos persistentes se replican de manera predeterminada, no debes preocuparte por elegir un nivel RAID óptimo.

Almacenamiento de archivos

En un centro de datos, usas tipos de medios de almacenamiento de archivos estándar, como medios de cinta magnética, un arreglo de discos de almacenamiento, o ambos, para datos de archivo que deben conservarse a largo plazo con fines comerciales o legales. Cada uno de estos tipos de almacenamiento tiene sus inconvenientes:

  • Los arreglos de discos de almacenamiento pueden ser costosos. Además del costo inicial de hardware en sí, si tu política de copias de seguridad requiere que los datos se transfieran a otro lugar, es posible que debas mantener las copias de seguridad en un segundo centro de datos. Esta situación conlleva los costos adicionales de establecer y mantener la conectividad a ese centro de datos.
  • Los medios de cinta magnética son menos costosos que un conjunto de discos de almacenamiento, pero requieren más gastos administrativos. Para administrar de manera efectiva tus archivos de cinta, necesitas un servidor de catálogo que te permita rastrear el historial de las cintas, una biblioteca de cintas y un administrador de sistemas para administrar la biblioteca y las importaciones y exportaciones que la acompañan. Algunas empresas también requieren un proveedor externo que pueda realizar entregas y retiros seguros de cintas con regularidad.

Cuando trabajas en la nube, este gasto de hardware y recursos humanos se reduce. Por ejemplo, en Google Cloud, puedes reemplazar ambos métodos por Cloud Storage Nearline, Cloud Storage Coldline y Cloud Storage Archive, que proporcionan progresivamente soluciones de almacenamiento más "en frío". Cloud Storage Nearline está diseñado para los datos a los que esperas acceder menos de una vez al mes. Cloud Storage Coldline está diseñado para los datos a los que esperas acceder menos de una vez por trimestre. Cloud Storage Archive está diseñado para los datos a los que esperas acceder menos de una vez al año.

Cloud Storage Nearline, Cloud Storage Coldline y Cloud Storage Archive ayudan a solucionar muchos de los problemas que afectan a los métodos tradicionales de almacenamiento de archivos. Por ejemplo, a diferencia de los medios de cinta magnética, las tres clases de almacenamiento son duraderas y confiables. No tienes que preocuparte por el funcionamiento de tu cinta ni tampoco por recuperarla de una instalación externa, o por corregir datos que abarcan varias cintas. Además, ya no tienes que preocuparte por la replicación de datos. De forma predeterminada, cada clase de almacenamiento de Cloud Storage replica tus datos para garantizar su durabilidad y disponibilidad.

Además, Cloud Storage Nearline, Cloud Storage Coldline y Cloud Storage Archive ofrecen una latencia baja comparable a un conjunto de discos de almacenamiento en las instalaciones, con solo subsegundos para recuperar tu primer byte de datos. Sin embargo, a diferencia de un conjunto de discos de almacenamiento, no tienes que pagar los costos iniciales de hardware ni los costosos contratos de mantenimiento. Con Cloud Storage, solo pagas por lo que usas.

Por último, Cloud Storage se integra a varios sistemas populares de administración de catálogos. Con este modelo, puedes seguir usando tu software actual y enviar tus nuevas copias de seguridad de archivo a Cloud Storage Nearline, Cloud Storage Coldline o Cloud Storage Archive. Para obtener más información, consulta la documentación sobre los socios de Cloud Storage.

Costos

Discos persistentes y SSD locales

Los discos persistentes de Compute Engine y los SSD locales tienen un precio por GB por mes. Para obtener más información sobre el precio del disco persistente y el SSD local, consulta Precios de disco persistente.

Cloud Storage Standard

El modelo de precios de Cloud Storage contrasta de manera considerable con el del almacenamiento tradicional de centros de datos. En un centro de datos, debes comprar tu hardware de almacenamiento NAS o SAN por adelantado. En cambio, en Cloud Storage se cobra por uso. Se te facturará la cantidad de datos que almacenes por mes, la cantidad de salida de red, la transferencia de datos entre ubicaciones y la cantidad de solicitudes a la API que realices. No tienes que preocuparte por los contratos de mantenimiento o los costos asociados con las posibles fallas de hardware que conlleva la compra de tu propio hardware.

Si deseas obtener más información sobre los precios de Cloud Storage, consulta Precios de Cloud Storage.

Cloud Storage Nearline, Cloud Storage Coldline y Cloud Storage Archive

Al igual que con la clase de almacenamiento Cloud Storage Standard, Cloud Storage Nearline, Cloud Storage Coldline y Cloud Storage Archive se facturan según la cantidad de datos almacenados por mes, la salida de red y la cantidad de datos transferidos entre ubicaciones. Como clases de archivo, las tres también tienen una tarifa de recuperación de almacenamiento y un período de almacenamiento mínimo. Se te cobrará el resto del período si borras o modificas los datos antes de que transcurra el período mínimo de almacenamiento. Por ejemplo, si borras un objeto 5 días después de almacenarlo en Cloud Storage Nearline, se te cobrarán los 25 días restantes de almacenamiento para ese objeto.

Para obtener más información sobre los precios de Cloud Storage Nearline, Cloud Storage Coldline y Cloud Storage Archive, consulta Precios de Cloud Storage.

¿Qué sigue?

Siguiente: Administración en Google Cloud