Supervisa Cloud Bigtable

Puedes supervisar Cloud Bigtable de manera visual mediante los gráficos disponibles en Google Cloud Console y Cloud Monitoring o de manera programática mediante Cloud Monitoring.

Los datos disponibles a través de Google Cloud Console y Cloud Monitoring proporcionan una descripción general de alto nivel del uso de Cloud Bigtable. También puedes usar la herramienta Key Visualizer para desglosar los patrones de acceso por clave de fila y solucionar problemas específicos de rendimiento. Si deseas obtener más detalles, consulta la página Primeros pasos con Key Visualizer.

Comprender el uso de CPU y del disco

Sin importar la herramienta que uses para supervisar tu instancia, es fundamental que te fijes en el uso de CPU y del disco de cada clúster de la instancia. Si el uso de alguno de estos elementos supera ciertos límites, el rendimiento del clúster se verá afectado, y se mostrarán errores cuando intentes leer o escribir datos.

Uso de CPU

Los nodos de tus clústeres usan recursos de CPU para manejar las tareas de lectura, escritura y administrativas. Si deseas obtener más información sobre cómo la cantidad de nodos afecta el rendimiento de un clúster, consulta Rendimiento de las cargas de trabajo típicas.

Cloud Bigtable informa las siguientes métricas sobre el uso de CPU:

Métrica Descripción
Uso de CPU promedio

El uso de CPU promedio de todos los nodos del clúster.

Los valores máximos recomendados proporcionan espacio para picos breves en el uso.

Si un clúster supera el valor máximo recomendado para tu configuración durante algo más que unos pocos minutos, agrégale nodos al clúster.

Uso de CPU del nodo más activo

El uso de CPU del nodo más activo del clúster.

Si, a menudo, el nodo más activo se encuentra por encima del valor recomendado, incluso cuando el uso de CPU promedio es razonable, es posible que estés accediendo a una porción pequeña de tus datos con mucha mayor frecuencia que al resto.

  • Usa la herramienta Key Visualizer para identificar hotspots en tu tabla que podrían estar causando alzas en el uso de CPU.
  • Verifica el diseño del esquema para asegurarte de que admita una distribución uniforme de lecturas y escrituras en cada tabla.

Los valores de estas métricas no deben exceder lo siguiente:

Configuración Valores máximos recomendados
Un solo clúster

70% de uso de CPU promedio
90% de uso de CPU del nodo más activo

Cualquier número de clústeres con enrutamiento de un solo clúster

70% de uso de CPU promedio
90% de uso de CPU del nodo más activo

2 clústeres con enrutamiento de varios clústeres

35% de uso de CPU promedio
45% de uso de CPU del nodo más activo

3 o más clústeres con enrutamiento de varios clústeres

Depende de tu configuración. Consulta los ejemplos de configuración de la replicación para casos prácticos comunes.

Uso del disco

En cada clúster de tu instancia, Cloud Bigtable almacena una copia independiente de todas las tablas.

Cloud Bigtable realiza un seguimiento del uso del disco en unidades binarias, como gigabytes binarios (GB), en los que 1 GB equivale a 230bytes. Esta unidad de medida también se conoce como gibibyte (GiB).

Cloud Bigtable informa las siguientes métricas sobre el uso del disco:

Métrica Descripción
Utilización del almacenamiento (bytes)

La cantidad de datos almacenados en el clúster.

Este valor influye en tus costos. Además, como se describe a continuación, es posible que debas agregar nodos a cada clúster a medida que aumente la cantidad de datos.

Utilización del almacenamiento (porcentaje del máx.)

El porcentaje de la capacidad de almacenamiento del clúster que se encuentra en uso. La capacidad se basa en la cantidad de nodos del clúster.

Por lo general, no se debe usar más del 70% del límite estricto del almacenamiento a fin de tener espacio para agregar más datos. Si no piensas agregar grandes cantidades de datos a tu instancia, puedes usar hasta el 100% del límite estricto.

Si usas un porcentaje de almacenamiento superior al recomendado, agrega nodos al clúster. También puedes borrar los datos existentes, pero los datos borrados ocupan más espacio (no menos) hasta que se realiza una compactación.

Si quieres obtener más información sobre cómo se calcula este valor, consulta Uso de almacenamiento por nodo.

Carga del disco

El porcentaje que tu clúster utiliza del ancho de banda máximo posible para las lecturas y las escrituras de HDD. Disponible solo para clústeres de HDD.

Si este valor se encuentra frecuentemente al 100%, es posible que la latencia aumente. Agrega nodos al clúster para reducir el porcentaje de carga del disco.

Obtén una descripción general del rendimiento con Cloud Console

Usa la página de descripción general de la instancia para comprender el estado actual de los clústeres.

En esta página, se muestran los valores actuales de varias métricas clave de cada clúster:

Métrica Descripción
Promedio de uso de CPU El uso de CPU promedio de todos los nodos del clúster.
Uso de CPU del nodo más activo

El uso de CPU del nodo más activo del clúster.

Si el valor es superior al máximo recomendado para el nodo más activo, se puede producir latencia y otros problemas para el clúster.

Filas leídas La cantidad de filas que se leen por segundo.
Filas escritas La cantidad de filas que se escriben por segundo.
Rendimiento de lectura La cantidad de bytes sin comprimir por segundo de datos de respuesta enviados. Esta métrica se refiere a la cantidad total de datos que se muestra después de aplicar los filtros.
Rendimiento de escritura La cantidad de bytes sin comprimir por segundo recibidos cuando se escribieron los datos.
Tasa de error del sistema El porcentaje de todas las solicitudes que fallaron en el servidor de Cloud Bigtable.
Latencia de replicación para las entradas La mayor cantidad de tiempo en el percentil 99, en segundos, para que una escritura en otro clúster se replique en este clúster.
Latencia de replicación para las salidas La mayor cantidad de tiempo en el percentil 99, en segundos, para que una escritura en este clúster se replique en otro clúster.

Si deseas ver una descripción general de estas métricas clave, sigue los pasos que se indican a continuación:

  1. Abre la lista de instancias de Cloud Bigtable en Cloud Console.

    Abrir la lista de instancias

  2. Haz clic en la instancia cuyas métricas quieres ver. En Cloud Console, se muestran las métricas actuales de los clústeres de tu instancia.

Supervisa el rendimiento en el tiempo con Cloud Console

Usa la página de supervisión de tu instancia para comprender el rendimiento pasado de tu instancia. Puedes analizar el rendimiento de cada clúster y desglosar las métricas para varios tipos de recursos de Cloud Bigtable. Los gráficos pueden mostrar un período que puede variar desde la última hora hasta los últimos 30 días.

Gráficos para los recursos de Cloud Bigtable

En la página de supervisión, hay gráficos para los distintos tipos de recursos de Cloud Bigtable:

  • Instancias
  • Tablas
  • Perfiles de aplicación

Los gráficos están disponibles para las siguientes métricas:

Métrica Disponible para Descripción
Uso de CPU Instancias El uso de CPU promedio de todos los nodos del clúster.
Uso de CPU (nodo más activo) Instancias

El uso de CPU del nodo más activo del clúster.

Si el valor es superior al máximo recomendado para el nodo más activo, se puede producir latencia y otros problemas para el clúster.

Tasa de error del usuario Instancias

La tasa de errores causados por la solicitud, en lugar de los errores del servidor de Cloud Bigtable. La tasa de errores del usuario incluye los siguientes códigos de estado:

  • INVALID_ARGUMENT
  • NOT_FOUND
  • PERMISSION_DENIED
  • RESOURCE_EXHAUSTED
  • OUT_OF_RANGE

A menudo, los errores de los usuarios se generan por problemas de configuración, como una solicitud que indica una tabla, un perfil de aplicación o un clúster incorrectos.

Tasa de error del sistema Instancias El porcentaje de todas las solicitudes que fallaron en el servidor de Cloud Bigtable. En la tasa de errores del sistema se incluyen los siguientes códigos de estado:
  • UNKNOWN
  • ABORTED
  • UNIMPLEMENTED
  • INTERNAL
  • UNAVAILABLE
Conmutaciones por error automáticas Instancias
Tablas
Perfiles de aplicación

La cantidad de solicitudes que se redirigieron de forma automática de un clúster a otro debido a una situación de conmutación por error (p. ej., debido a un retraso o a una breve interrupción del servicio). El redireccionamiento automático puede ocurrir cuando el perfil de una app usa enrutamiento de varios clústeres.

Este gráfico no incluye las solicitudes con redireccionamiento manual.

Uso del almacenamiento (bytes) Instancias
Tablas

La cantidad de datos almacenados en el clúster.

Esta métrica refleja el hecho de que Cloud Bigtable comprime tus datos cuando se almacenan.

Utilización del almacenamiento (% del máx.) Instancias

El porcentaje de la capacidad de almacenamiento del clúster que se encuentra en uso. La capacidad se basa en la cantidad de nodos del clúster.

Si deseas obtener más información sobre cómo se calcula este valor, consulta Almacenamiento por nodo.

Carga del disco Instancias El porcentaje que tu clúster utiliza del ancho de banda máximo posible para las lecturas y las escrituras de HDD. Disponible solo para clústeres de HDD.
Filas leídas Instancias
Tablas
Perfiles de aplicación

La cantidad de filas que se leen por segundo.

Esta métrica proporciona una vista más útil del rendimiento general de Cloud Bigtable que la cantidad de solicitudes de lectura, ya que una sola solicitud puede leer una gran cantidad de filas.

Filas escritas Instancias
Tablas
Perfiles de aplicación

La cantidad de filas que se escriben por segundo.

Esta métrica proporciona una vista más útil del rendimiento general de Cloud Bigtable que la cantidad de solicitudes de escritura, ya que una sola solicitud puede escribir una gran cantidad de filas.

Solicitudes de lectura Instancias
Tablas
Perfiles de aplicación
La cantidad de lecturas aleatorias y solicitudes de análisis por segundo.
Solicitudes de escritura Instancias
Tablas
Perfiles de aplicación
La cantidad de solicitudes de escritura por segundo.
Rendimiento de lectura Instancias
Tablas
Perfiles de aplicación
La cantidad de bytes sin comprimir por segundo de datos de respuesta enviados. Esta métrica se refiere a la cantidad total de datos que se muestra después de aplicar los filtros.
Rendimiento de escritura Instancias
Tablas
Perfiles de aplicación
La cantidad de bytes sin comprimir por segundo recibidos cuando se escribieron los datos.
Conteo de nodos Instancias La cantidad de nodos del clúster.

Si deseas ver las métricas de estos recursos, sigue los pasos que se indican a continuación:

  1. Abre la lista de instancias de Cloud Bigtable en Cloud Console.

    Abrir la lista de instancias

  2. Haz clic en la instancia cuyas métricas quieres ver.

  3. En el panel de la izquierda, haz clic en Supervisión. En Cloud Console, se muestra una serie de gráficos para la instancia, así como una vista tabular de las métricas de la instancia. De forma predeterminada, en Cloud Console, se muestran las métricas de la última hora y se ven las métricas independientes para cada clúster de la instancia.

    Si deseas ver todos los gráficos, desplázate por el panel donde estos se muestran.

    Para ver las métricas a nivel de tabla, haz clic en Tablas.

    Para ver las métricas de los perfiles de apps individuales, haz clic en Perfiles de aplicación.

    Para ver todas las métricas de la instancia combinadas, busca la sección Agrupar por sobre los gráficos y haz clic en Instancia.

    Para ver las métricas de un período más largo, haz clic en la flecha junto a 1 hora. Elige un intervalo de tiempo preconfigurado o ingresa un intervalo de tiempo personalizado y, luego, haz clic en Aplicar.

Gráficos para replicación

En la página de supervisión, hay un gráfico que muestra la latencia de replicación en el tiempo. Puedes ver la latencia promedio para replicar escrituras en los percentiles 50, 99 y 100.

Si deseas ver la latencia de replicación en el tiempo, sigue los pasos que se indican a continuación:

  1. Abre la lista de instancias de Cloud Bigtable en Cloud Console.

    Abrir la lista de instancias

  2. Haz clic en la instancia cuyas métricas quieres ver.

  3. En el panel de la izquierda, haz clic en Supervisión. Se abrirá la página con la pestaña Instancia seleccionada.

  4. Haz clic en la pestaña Replicación. En Cloud Console, se muestra la latencia de replicación en el tiempo. De forma predeterminada, en Cloud Console, se muestra la latencia de replicación de la última hora.

    Para alternar entre los gráficos de latencia agrupados por tabla o por clúster, usa el menú Agrupar por.

    Para cambiar el percentil que deseas ver, usa el menú Percentil.

    Para ver las métricas de un período más largo, haz clic en la flecha junto a 1 hora. Elige un intervalo de tiempo preconfigurado o ingresa un intervalo de tiempo personalizado y, luego, haz clic en Aplicar.

Supervisa una instancia con Cloud Monitoring

Cloud Bigtable exporta métricas de uso que puedes supervisar de manera programática mediante Cloud Monitoring. Puedes usar la API de Cloud Monitoring o el Explorador de métricas para hacer un seguimiento de las métricas de uso de Cloud Bigtable. Además, puedes crear políticas de alertas que se basan en las métricas de uso y puedes incluir los gráficos de las métricas de uso de Cloud Bigtable en un panel personalizado.

Si deseas ver las métricas de uso en el Explorador de métricas, sigue los pasos que se indican a continuación:

  1. Abre la página Supervisión en Cloud Console.

    Abrir la página Supervisión

    Si se te solicita que elijas una cuenta, elige la que usas para acceder a Google Cloud Platform.

  2. Haz clic en Recursos y, luego, en Explorador de métricas.

  3. En Buscar tipo de recurso y métrica, escribe bigtable. Aparecerá una lista de recursos y métricas de Cloud Bigtable.

  4. Haz clic en una métrica para ver un gráfico de esta.

También puedes usar una biblioteca de gráficos, como Matplotlib para Python, a fin de trazar y analizar las métricas de uso de Cloud Bigtable. Para obtener más información, consulta el instructivo sobre el uso de Matplotlib con Cloud Monitoring y Cloud Bigtable.

Para obtener información adicional sobre el uso de Cloud Monitoring, consulta la documentación de Cloud Monitoring.

Próximos pasos