Instancias, clústeres y nodos

Para usar Cloud Bigtable, debes crear instancias que contengan hasta cuatro clústeres a los que tus aplicaciones puedan conectarse. Cada clúster contiene nodos, las unidades de procesamiento que administran tus datos y ejecutan las tareas de mantenimiento.

En esta página, encontrarás información sobre las instancias, los clústeres y los nodos de Cloud Bigtable.

Antes de leer esta página, debes familiarizarte con la descripción general de Cloud Bigtable.

Instancias

Una instancia de Cloud Bigtable es, en gran parte, solo un contenedor para tus clústeres y nodos, los que hacen todo el trabajo.

Las tablas pertenecen a las instancias, y no a los clústeres o a los nodos. Si tienes una instancia con más de un clúster, no puedes asignar tablas a clústeres individuales o crear políticas de recolección de basura únicas para cada clúster. Tampoco puedes hacer que cada clúster almacene un conjunto de datos distinto en la misma tabla.

Las instancias tienen algunas propiedades importantes que es importante conocer, como las siguientes:

  • El tipo de instancia (de producción o desarrollo)
  • El tipo de almacenamiento (SSD o HDD)
  • Los perfiles de aplicación, para instancias que usan la replicación

Estas propiedades se describen con más detalle en las siguientes secciones.

Tipos de instancias

Cuando creas una instancia, debes seleccionar de qué tipo va a ser:

  • Producción: Una instancia estándar con 1 o 2 clústeres y 3 nodos o más en cada uno de ellos. No puedes transformar una instancia de producción en una de desarrollo.
  • Desarrollo: Una instancia de bajo costo para desarrollo y pruebas, con un rendimiento limitado a la equivalencia de un clúster con 1 nodo. No existen garantías de supervisión ni capacidad de procesamiento; la replicación no está disponible y no se aplica el ANS. Puedes mejorar una instancia de desarrollo a una de producción en cualquier momento.

Tipos de almacenamiento

Cuando creas una instancia, debes elegir si sus clústeres almacenarán los datos en unidades de estado sólido (SSD) o en discos duros (HDD). A menudo, SSD es la elección más eficiente y rentable, pero no siempre.

La elección entre SSD y HDD es permanente, y todos los clústeres de tu instancia deberán usar el mismo tipo de almacenamiento, por lo que debes elegir el tipo de almacenamiento adecuado para tu caso práctico. A fin de tomar una decisión más informada, consulta Cómo elegir entre almacenamiento SSD y HDD.

Perfiles de aplicación

Después de crear una instancia de producción, Cloud Bigtable utiliza la instancia para almacenar los perfiles de aplicación. En las instancias que usan la replicación, los perfiles de aplicación controlan cómo se conectan las aplicaciones con los clústeres de la instancia. Si tu instancia no utiliza la replicación, puedes usar los perfiles de aplicación para asignar identificadores a cada aplicación o a cada una de sus funciones; luego, puedes ver los gráficos de cada perfil de app en GCP Console.

Si deseas obtener más información sobre los perfiles de aplicación, consulta Perfiles de aplicación. Para aprender a configurar los perfiles de aplicación de tu instancia, consulta Cómo configurar los perfiles de aplicación.

Clústeres

Un clúster representa el servicio real de Cloud Bigtable. Cada clúster pertenece a una instancia de Cloud Bigtable que puede tener hasta cuatro clústeres. Cuando la aplicación envía solicitudes a una instancia de Cloud Bigtable, un clúster se encarga de controlarlas.

Cada clúster se encuentra en una sola zona. Los clústeres de una instancia deben estar en zonas únicas. Puedes crear un clúster adicional en cualquier zona en la que Cloud Bigtable esté disponible. Por ejemplo, si el primer clúster está en us-east1-b, puedes elegir una zona diferente en la misma región, como us-east1-c, o una zona en una región separada, como europe-west2-a. Para obtener una lista de las zonas y regiones en las que Cloud Bigtable está disponible, consulta Ubicaciones de Cloud Bigtable.

Las instancias de Cloud Bigtable que tienen solo 1 clúster no usan la replicación. Si agregas un segundo clúster a una instancia de producción, Cloud Bigtable comenzará a replicar los datos automáticamente, mantendrá copias independientes en cada zona de los clústeres y sincronizará las actualizaciones entre ellas. Puedes seleccionar a qué clúster se conectarán tus aplicaciones, lo que te permite separar los distintos tipos de tráfico entre un clúster y el otro, o puedes dejar que Cloud Bigtable lo equilibre. Si un clúster deja de estar disponible, puedes realizar la conmutación por error de uno a otro. Si deseas obtener más información sobre el funcionamiento de la replicación, consulta la Descripción general de la replicación.

Nodos

Todos los clústeres de las instancias de producción tienen 3 nodos o más, que son recursos de procesamiento que Cloud Bigtable usa para administrar tus datos.

En segundo plano, Cloud Bigtable divide todos los datos de tus tablas en tablets más pequeños. Estos se almacenan en el disco aparte de los nodos, pero en la misma zona que estos. Cada nodo es responsable de realizar el seguimiento de los tablets específicos en el disco; controlar las escrituras y lecturas entrantes en estos y llevar a cabo las tareas de mantenimiento, como las compactaciones periódicas. Cada tablet se asocia con un solo nodo. Si deseas obtener más información sobre cómo Cloud Bigtable almacena y administra los datos, consulta Arquitectura de Cloud Bigtable.

Un clúster debe tener suficientes nodos para admitir su carga de trabajo actual y la cantidad de datos que almacena. De lo contrario, es posible que el clúster no pueda administrar las solicitudes entrantes y aumente la latencia. Deberías supervisar el uso del disco y la CPU del clúster y agregar nodos si superas los límites y las recomendaciones que se indican a continuación.

Uso de CPU

Cloud Bigtable informa las siguientes métricas sobre el uso de CPU:

Métrica Descripción
Uso de CPU promedio

El uso de CPU promedio de todos los nodos del clúster.

Los valores máximos recomendados proporcionan espacio para picos breves en el uso.

Si un clúster supera el valor máximo recomendado para tu configuración durante algo más que unos pocos minutos, agrégale nodos al clúster.

Uso de CPU del nodo más activo

El uso de CPU del nodo más activo del clúster.

Si, a menudo, el nodo más activo se encuentra por encima del valor recomendado, incluso cuando el uso de CPU promedio es razonable, es posible que estés accediendo a una porción pequeña de tus datos con mucha mayor frecuencia que al resto.

Los valores de estas métricas no deben exceder lo siguiente:

Configuración Valores máximos recomendados
Un solo clúster

70 % de uso de CPU promedio
90 % de uso de CPU del nodo más activo

Cualquier número de clústeres con enrutamiento de un solo clúster

70 % de uso de CPU promedio
90 % de uso de CPU del nodo más activo

2 clústeres con enrutamiento de varios clústeres

35 % de uso de CPU promedio
45 % de uso de CPU del nodo más activo

3 o más clústeres con enrutamiento de varios clústeres

Depende de tu configuración. Consulta los ejemplos de configuración de la replicación para casos prácticos comunes.

Uso del disco

Cloud Bigtable informa las siguientes métricas sobre el uso del disco:

Métrica Descripción
Utilización del almacenamiento (bytes)

La cantidad de datos almacenados en el clúster.

Este valor afecta tus costos. Además, como se describe a continuación, es posible que debas agregar nodos a cada clúster a medida que aumente la cantidad de datos.

Utilización del almacenamiento (% del máx.)

El porcentaje de la capacidad de almacenamiento del clúster que se encuentra en uso. La capacidad se basa en la cantidad de nodos del clúster.

Por lo general, no se debe usar más del 70% del límite estricto del almacenamiento a fin de tener espacio para agregar más datos. Si no piensas agregar grandes cantidades de datos a tu instancia, puedes usar hasta el 100% del límite estricto.

Si usas un porcentaje de almacenamiento superior al recomendado, agrega nodos al clúster. También puedes borrar los datos existentes, pero los datos borrados ocupan más espacio, no menos, hasta que se realiza una compactación.

Si deseas obtener más información sobre cómo se calcula este valor, consulta Uso de almacenamiento por nodo.

Carga del disco

El porcentaje que tu clúster utiliza del ancho de banda máximo posible para las lecturas y las escrituras de HDD. Disponible solo para clústeres de HDD.

Si este valor se encuentra frecuentemente al 100%, es posible que la latencia aumente. Agrega nodos al clúster para reducir el porcentaje de carga del disco.

Nodos para clústeres replicados

En una instancia que use la replicación, asegúrate de que todos los clústeres tengan nodos suficientes para admitir tu caso práctico:

  • Si usas la replicación para ofrecer una disponibilidad alta o si utilizas el enrutamiento de varios clústeres en alguno de tus perfiles de aplicación, cada clúster debería tener la misma cantidad de nodos. Además, como mostramos en Uso de CPU, el uso recomendado se redujo a la mitad.

    Esta configuración te ayuda a garantizar que el clúster en buen estado tenga capacidad suficiente para controlar todo el tráfico, en caso de que sea necesario realizar una conmutación por error automática.

  • Si todos tus perfiles de aplicación usan el enrutamiento de un solo clúster, cada clúster puede tener una cantidad de nodos diferente. Cambia el tamaño de cada uno en función de su carga de trabajo.

    Dado que Cloud Bigtable almacena una copia separada de tus datos en cada clúster, estos siempre deben tener nodos suficientes para admitir el uso del disco y replicar las escrituras entre ellos.

    De todas formas, puedes realizar la conmutación por error manual de un clúster a otro si es necesario. Sin embargo, si un clúster tiene muchos más nodos que otro y debes realizar una conmutación por error al que tiene menos, es posible que debas agregar nodos primero. Nada garantiza que habrá nodos disponibles cuando necesites realizar la conmutación por error. La única manera de reservarlos por adelantado es agregarlos al clúster.

¿Qué sigue?

¿Te sirvió esta página? Envíanos tu opinión:

Enviar comentarios sobre…

Documentación de Cloud Bigtable