Elige entre el almacenamiento SSD y HDD
Cuando creas una instancia de Bigtable, debes elegir si sus clústeres almacenarán los datos en unidades de estado sólido (SSD) o en unidades de disco duro (HDD):
- El almacenamiento SSD es la elección más eficiente y rentable para la mayoría de los casos prácticos.
- El almacenamiento HDD a veces es adecuado para conjuntos de datos grandes que no son sensibles a la latencia o a los que se accede con poca frecuencia.
Sin importar el tipo de almacenamiento que elijas, tus datos se almacenarán en un sistema de archivos replicado y distribuido que abarca miles de millones de unidades físicas.
Los lineamientos que se indican en esta página pueden ayudarte a decidir entre SSD y HDD.
Si tienes dudas, elige el almacenamiento SSD
Existen muchos motivos por los que, generalmente, es mejor usar el almacenamiento SSD en tu clúster de Bigtable:
- El SSD es mucho más rápido y tiene un rendimiento más predecible que el HDD. En un clúster de Bigtable, el almacenamiento SSD ofrece latencias mucho más bajas para las operaciones de lectura y escritura que el almacenamiento HDD.
- La capacidad de procesamiento del HDD es mucho más limitada que la del SSD. En un clúster que usa almacenamiento HDD, es posible alcanzar la capacidad de procesamiento máxima antes de que el uso de CPU alcance el 100%, una situación que se puede supervisar mediante la métrica carga del disco. Para aumentar la capacidad de procesamiento, debes agregar más nodos, pero el costo de los nodos adicionales podría exceder tus ahorros que obtienes por usar el almacenamiento HDD. El almacenamiento SSD no tiene esta limitación, ya que su capacidad de procesamiento por nodo es mucho mayor; por lo general, un clúster que usa almacenamiento SSD solo alcanza el máximo de la capacidad de procesamiento cuando usa toda la CPU y memoria disponibles.
- Las lecturas de filas individuales en HDD son muy lentas. Debido al tiempo de búsqueda en el disco, el almacenamiento HDD solo admite el 5% de las lecturas de filas por segundo que se realizan en el almacenamiento SSD. Sin embargo, los análisis grandes de varias filas no se ven afectados negativamente.
- Los ahorros de HDD son mínimos y dependen del costo de los nodos de tu clúster de Bigtable, a menos que almacenes grandes cantidades de datos. Por este motivo, como regla general, no deberías considerar usar el almacenamiento HDD, a menos que almacenes al menos 10 TB de datos y tu carga de trabajo no sea sensible a la latencia.
Una posible desventaja del almacenamiento SSD es que requiere más nodos en tus clústeres según la cantidad de datos que almacenes. Sin embargo, en la práctica, es posible que necesites esos nodos adicionales a fin de que tus clústeres puedan controlar todo el tráfico entrante, no solo para admitir la cantidad de datos que almacenas.
Casos prácticos del almacenamiento HDD
El almacenamiento HDD es adecuado para los casos de uso que cumplan con los siguientes criterios:
- Esperas almacenar, al menos, 10 TB de datos.
- No usarás los datos para respaldar una aplicación orientada al usuario o sensible a la latencia.
Tu carga de trabajo se define en una de las siguientes categorías:
- Cargas de trabajo por lotes con análisis y escrituras, y solo lecturas aleatorias ocasionales de una pequeña cantidad de filas o lecturas de puntos.
- Archivo de datos, en el que se escriben grandes cantidades de datos y se leen con poca frecuencia.
Por ejemplo, si piensas almacenar una gran cantidad de datos históricos de muchos dispositivos de teledetección y, luego, usarlos para generar informes diarios, los ahorros por usar almacenamiento HDD compensarían el sacrificio de rendimiento. Por el contrario, si piensas usar los datos para mostrar un panel en tiempo real, probablemente no sea recomendable usar el almacenamiento HDD; en este caso, las lecturas serían mucho más frecuentes, y estas que no son análisis son mucho más lentas con el almacenamiento HDD.
Cambia entre el almacenamiento SSD y HDD
Cuando creas una instancia de Bigtable, la elección de almacenamiento SSD o HDD que elijas para ella es permanente. No puedes usar la consola de Google Cloud a fin de cambiar el tipo de almacenamiento que se usa para la instancia.
Si deseas cambiar el tipo de almacenamiento en el que se almacena una tabla, usa la función de copias de seguridad:
- Crea o planifica usar una instancia que use el tipo de almacenamiento que deseas.
- Crea una copia de seguridad de la tabla.
- Restablece desde la copia de seguridad a una tabla nueva en la otra instancia
¿Qué sigue?
Crea una instancia con almacenamiento SSD o HDD.