Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.

Supervisión

Puedes supervisar Cloud Bigtable de forma visual mediante los gráficos disponibles en Google Cloud Console o de manera programática con la API de Cloud Monitoring.

En la consola de Google Cloud, los datos de supervisión están disponibles en los siguientes lugares:

  • Supervisión de Bigtable
  • Descripción general de la instancia de Bigtable
  • Descripción general del clúster de Bigtable
  • Descripción general de la tabla de Bigtable
  • Google Cloud's operations suite de Cloud Monitoring
  • Key Visualizer

Las páginas de supervisión y descripción general proporcionan una vista de alto nivel del uso de Bigtable. Puedes usar Key Visualizer para desglosar los patrones de acceso por clave de fila y solucionar problemas específicos de rendimiento.

Comprende el uso de CPU y del disco

Sin importar la herramienta que uses para supervisar tu instancia, es fundamental que te fijes en el uso de CPU y del disco de cada clúster de la instancia. Si el uso de alguno de estos elementos supera ciertos límites, el rendimiento del clúster se verá afectado, y se mostrarán errores cuando intentes leer o escribir datos.

Uso de CPU

Los nodos de tus clústeres usan recursos de CPU para manejar las tareas de lectura, escritura y administrativas. Si deseas obtener más información sobre cómo la cantidad de nodos afecta el rendimiento de un clúster, consulta Rendimiento de las cargas de trabajo típicas.

Bigtable informa las siguientes métricas sobre el uso de CPU:

Métrica Descripción
Uso de CPU promedio

El uso de CPU promedio de todos los nodos del clúster.

Los valores máximos recomendados proporcionan espacio para picos breves en el uso.

Si un clúster supera el valor máximo recomendado para tu configuración durante algo más que unos pocos minutos, agrégale nodos al clúster.

Uso de CPU del nodo más activo

El uso de CPU del nodo más activo del clúster. Esta métrica se sigue proporcionando para garantizar la continuidad, pero en la mayoría de los casos, debes usar la métrica Uso de CPU más detallado del nodo más activo con mayor precisión.

Uso de CPU con un nivel de detalle alto del nodo más activo

Una medición detallada del uso de CPU para el nodo más activo del clúster. Te recomendamos que uses esta métrica en lugar del uso de CPU del nodo más activo, porque esta métrica es más precisa.

El nodo más activo no necesariamente es el mismo nodo, ya que puede cambiar con rapidez, en especial durante trabajos por lotes grandes o análisis de tablas.

Si, a menudo, el nodo más activo se encuentra por encima del valor recomendado, incluso cuando el uso de CPU promedio es razonable, es posible que estés accediendo a una porción pequeña de tus datos con mucha mayor frecuencia que al resto.

Uso de CPU por perfil de app, método y tabla

Uso de CPU por perfil de app, método y tabla

Si observas un uso de CPU mayor que el esperado para un clúster, usa esta métrica a fin de determinar si el uso de CPU de un perfil de aplicación, método de API o tabla en particular genera la carga de CPU.

Los valores de estas métricas no deben exceder lo siguiente:

Configuración Valores máximos recomendados1
  1. Las cantidades máximas recomendadas son para todo un clúster; no hay valores máximos recomendados para el uso de CPU por perfil de aplicación, método o tabla. Usa esta métrica más detallada para la observabilidad de las posibles causas del uso alto de CPU de un clúster.
Un solo clúster

70% de uso de CPU promedio
90% de uso de CPU del nodo más activo

Cualquier número de clústeres con enrutamiento de un solo clúster

70% de uso de CPU promedio
90% de uso de CPU del nodo más activo

2 clústeres con enrutamiento de varios clústeres

35% de uso de CPU promedio
45% de uso de CPU del nodo más activo

3 o más clústeres con enrutamiento de varios clústeres

Depende de tu configuración. Consulta los ejemplos de configuración de la replicación para casos prácticos comunes.

Uso del disco

En cada clúster de tu instancia, Bigtable almacena una copia independiente de todas las tablas.

Bigtable realiza un seguimiento del uso del disco en unidades binarias, como gigabytes binarios (GB), en los que 1 GB equivale a 230bytes. Esta unidad de medida también se conoce como gibibyte (GiB).

Bigtable informa las siguientes métricas sobre el uso del disco:

Métrica Descripción
Utilización del almacenamiento (bytes)

La cantidad de datos almacenados en el clúster.

Este valor afecta tus costos. Además, como se describe a continuación, es posible que debas agregar nodos a cada clúster a medida que aumente la cantidad de datos.

Utilización del almacenamiento (porcentaje del máx.)

El porcentaje de la capacidad de almacenamiento del clúster que se encuentra en uso. La capacidad se basa en la cantidad de nodos del clúster.

Por lo general, no se debe usar más del 70% del límite estricto del almacenamiento a fin de tener espacio para agregar más datos. Si no piensas agregar grandes cantidades de datos a tu instancia, puedes usar hasta el 100% del límite estricto.

Si usas un porcentaje de almacenamiento superior al recomendado, agrega nodos al clúster. También puedes borrar los datos existentes, pero los datos borrados ocupan más espacio (no menos) hasta que se realiza una compactación.

Si deseas obtener más información sobre cómo se calcula este valor, consulta Uso de almacenamiento por nodo.

Carga del disco

El porcentaje que tu clúster utiliza del ancho de banda máximo posible para las lecturas y las escrituras de HDD. Disponible solo para clústeres de HDD.

Si este valor se encuentra frecuentemente al 100%, es posible que la latencia aumente. Agrega nodos al clúster para reducir el porcentaje de carga del disco.

Instancias de varios clústeres y compactación

Las métricas de almacenamiento reflejan el tamaño de los datos en el disco a partir de la última compactación. Debido a que la compactación se realiza de forma progresiva durante el transcurso de una semana, las métricas de uso de CPU de un clúster a veces pueden ser diferentes de las métricas de otros clústeres de la instancia. Los siguientes son algunos impactos observables de esto:

  • Un clúster nuevo que se agregó recientemente a una instancia puede mostrar de forma temporal 0 bytes de almacenamiento, aunque todos los datos se hayan replicado de forma correcta en el clúster nuevo.

  • Una tabla puede ser de un tamaño diferente en cada clúster, incluso cuando la replicación funciona de forma correcta.

Descripción general de la instancia

En esta página, se muestran los valores actuales de varias métricas clave de cada clúster:

Métrica Descripción
Promedio de uso de CPU El uso de CPU promedio de todos los nodos del clúster.
Uso de CPU del nodo más activo

El uso de CPU del nodo más activo del clúster. Esta métrica se sigue proporcionando para garantizar la continuidad, pero en la mayoría de los casos, debes usar la métrica Uso de CPU más detallado del nodo más activo con mayor precisión.

Uso de CPU con un nivel de detalle alto del nodo más activo

Una medición detallada del uso de CPU para el nodo más activo del clúster. Te recomendamos que uses esta métrica en lugar del uso de CPU del nodo más activo, porque esta métrica es más precisa.

El nodo más activo no necesariamente es el mismo nodo, ya que puede cambiar con rapidez, en especial durante trabajos por lotes grandes o análisis de tablas.

Si el valor es superior al máximo recomendado para el nodo más activo, se puede producir latencia y otros problemas para el clúster.

Filas leídas La cantidad de filas que se leen por segundo.
Filas escritas La cantidad de filas que se escriben por segundo.
Rendimiento de lectura La cantidad de bytes por segundo de datos de respuesta enviados. Esta métrica se refiere a la cantidad total de datos que se muestra después de aplicar los filtros.
Rendimiento de escritura La cantidad de bytes por segundo recibidos cuando se escribieron los datos.
Tasa de error del sistema El porcentaje de todas las solicitudes que fallaron en el servidor de Bigtable.
Latencia de replicación para las entradas La mayor cantidad de tiempo en el percentil 99, en segundos, para que una escritura en otro clúster se replique en este clúster.
Latencia de replicación para las salidas La mayor cantidad de tiempo en el percentil 99, en segundos, para que una escritura en este clúster se replique en otro clúster.

Si deseas ver una descripción general de estas métricas clave, sigue los pasos que se indican a continuación:

  1. Abre la lista de instancias de Bigtable en Google Cloud Console.

    Abrir la lista de instancias

  2. Haz clic en la instancia cuyas métricas quieres ver. En la consola de Google Cloud, se muestran las métricas actuales de los clústeres de tu instancia.

Descripción general del clúster

Usa la página de descripción general del clúster para comprender el estado actual y anterior de un clúster individual.

La página de descripción general del clúster muestra gráficos que indican las siguientes métricas para cada clúster:

Métrica Descripción
Cantidad de nodos La cantidad de nodos que usa el clúster en un momento determinado.
Objetivo de cantidad máxima de nodos La cantidad máxima de nodos en los que Bigtable escalará el clúster hasta que el ajuste de escala automático esté habilitado. Esta métrica solo es visible cuando el ajuste de escala automático está habilitado en el clúster. Puedes cambiar este valor en la página Editar clúster.
Objetivo de cantidad mínima de nodos La cantidad mínima de nodos a la que Bigtable reducirá la escalará del clúster cuando esté habilitado el ajuste de escala automático. Esta métrica solo es visible cuando el ajuste de escala automático está habilitado en el clúster. Puedes cambiar este valor en la página Editar clúster.
Cantidad de nodos recomendada para el objetivo de CPU La cantidad de nodos que Bigtable recomienda para el clúster según el objetivo de uso de CPU que establezcas. Esta métrica solo es visible cuando el ajuste de escala automático está habilitado para el clúster. Si esta cantidad es mayor que el objetivo de recuento máximo de nodos, considera aumentar el objetivo de uso de CPU o aumentar la cantidad máxima de nodos para el clúster. Si esta cantidad es inferior a la cantidad mínima de nodos, es posible que el clúster se aprovisione en exceso para tu uso, y deberías considerar reducir la mínima.
Cantidad de nodos recomendada para el objetivo de almacenamiento La cantidad de nodos que Bigtable recomienda para el clúster en función del objetivo de uso de almacenamiento integrado. Esta métrica solo es visible cuando el ajuste de escala automático está habilitado para el clúster. Si esta cantidad es mayor que el objetivo de recuento máximo de nodos, considera aumentar la cantidad máxima de nodos para el clúster.
Uso de CPU El uso de CPU promedio de todos los nodos del clúster.
Uso de almacenamiento

La cantidad de datos almacenados en el clúster.

Esta métrica refleja el hecho de que Bigtable comprime tus datos cuando se almacenan.

Para ver la página de descripción general de un clúster, haz lo siguiente:

  1. Abre la lista de instancias de Bigtable en Google Cloud Console.

    Abrir la lista de instancias

  2. Haz clic en la instancia cuyas métricas quieres ver.

  3. Desplázate hasta la sección posterior a la sección que muestra el estado actual de algunas de las métricas del clúster.

  4. Haz clic en el ID del clúster para abrir la página Descripción general del clúster.

Logs

El gráfico Registros muestra las entradas de registro de eventos del sistema para el clúster. Los registros de eventos del sistema se generan solo para clústeres que usan el ajuste de escala automático. Si deseas obtener información sobre las formas adicionales de ver los registros de auditoría de Bigtable, consulta Registros de auditoría.

Descripción general de la tabla

Usa la página de descripción general de la tabla para comprender el estado actual y anterior de una tabla individual.

En la página de descripción general de la tabla, se muestran los gráficos con las siguientes métricas de la tabla. Cada gráfico muestra una línea separada en cada clúster en el que se encuentra la tabla.

Métrica Descripción
Uso del almacenamiento (bytes)

El porcentaje de la capacidad de almacenamiento del clúster que usa la tabla. La capacidad se basa en la cantidad de nodos del clúster.

Si deseas obtener más información sobre cómo se calcula este valor, consulta Uso de almacenamiento por nodo.

Uso de CPU El uso de CPU promedio de todos los nodos del clúster.
Latencia de lectura

Momento en que una solicitud de lectura muestra una respuesta.

La medición de la latencia de lectura comienza cuando Bigtable recibe la solicitud y finaliza cuando se envía al cliente el último byte de datos. En el caso de las solicitudes de grandes cantidades de datos, la latencia de lectura puede verse afectada por la habilidad del cliente para consumir la respuesta.

Latencia de escritura

Momento en que una solicitud de escritura muestra una respuesta.

Filas leídas

La cantidad de filas que se leen por segundo.

Esta métrica proporciona una vista más útil del rendimiento general de Bigtable que la cantidad de solicitudes de lectura, ya que una sola solicitud puede leer una gran cantidad de filas.

Filas escritas

La cantidad de filas que se escriben por segundo.

Esta métrica proporciona una vista más útil del rendimiento general de Bigtable que la cantidad de solicitudes de escritura, ya que una sola solicitud puede escribir una gran cantidad de filas.

Solicitudes de lectura La cantidad de lecturas aleatorias y solicitudes de análisis por segundo.
Solicitudes de escritura La cantidad de solicitudes de escritura por segundo.
Rendimiento de lectura La cantidad de bytes por segundo de datos de respuesta enviados. Esta métrica se refiere a la cantidad total de datos que se muestra después de aplicar los filtros.
Rendimiento de escritura La cantidad de bytes por segundo recibidos cuando se escribieron los datos.
Conmutaciones por error automáticas

La cantidad de solicitudes que se redirigieron de forma automática de un clúster a otro debido a una situación de conmutación por error (p. ej., debido a un retraso o a una breve interrupción del servicio). El redireccionamiento automático puede ocurrir cuando el perfil de una app usa enrutamiento de varios clústeres.

Este gráfico no incluye las solicitudes con redireccionamiento manual.

La página de descripción general de la tabla también muestra el estado de replicación de la tabla en cada clúster de la instancia. En cada clúster, la página muestra lo siguiente:

  • Estado
  • ID del clúster
  • Zona
  • La cantidad de almacenamiento de clústeres que usa la tabla
  • Clave de encriptación y estado de la clave
  • Fecha de la última copia de seguridad de la tabla seleccionada actualmente
  • Un vínculo a la página Editar clúster.

Para ver la página de descripción general de una tabla, haz lo siguiente:

  1. Abre la lista de instancias de Bigtable en Google Cloud Console.

    Abrir la lista de instancias

  2. Haz clic en la instancia cuyas métricas quieres ver.

  3. En el panel izquierdo, haga clic en Tablas. La consola de Google Cloud muestra una lista de todas las tablas en la instancia.

  4. Haz clic en un ID de tabla para abrir la página Descripción general de la tabla.

Supervisa el rendimiento en el tiempo.

Usa la página de supervisión de tu instancia de Bigtable para comprender el rendimiento pasado de tu instancia. Puedes analizar el rendimiento de cada clúster y desglosar las métricas para varios tipos de recursos de Bigtable. Los gráficos pueden mostrar un período que puede variar desde la última hora hasta las últimas 6 semanas.

Supervisa gráficos para los recursos de Bigtable

En la página de supervisión de Bigtable, hay gráficos para los distintos tipos de recursos de Bigtable:

  • Instancias
  • Tablas
  • Perfiles de aplicación
  • Replicación

Los gráficos de la página de supervisión muestran las siguientes métricas:

Métrica Disponible para Descripción
Uso de CPU Instancias
Tablas
Perfiles de aplicación
El uso de CPU promedio de todos los nodos del clúster.
Uso de CPU (nodo más activo) Instancias

El uso de CPU del nodo más activo del clúster. Esta métrica se sigue proporcionando para garantizar la continuidad, pero en la mayoría de los casos, debes usar la métrica Uso de CPU más detallado del nodo más activo con mayor precisión.

Uso de CPU de nivel de detalle alto (nodo más activo) Instancias

Una medición detallada del uso de CPU para el nodo más activo del clúster. Te recomendamos que uses esta métrica en lugar del uso de CPU del nodo más activo, porque esta métrica es más precisa.

El nodo más activo no necesariamente es el mismo nodo, ya que puede cambiar con rapidez, en especial durante trabajos por lotes grandes o análisis de tablas.

Si el valor es superior al máximo recomendado para el nodo más activo, se puede producir latencia y otros problemas para el clúster.

Latencia de lectura Instancias
Tablas
Perfiles de aplicación

Momento en que una solicitud de lectura muestra una respuesta.

La medición de la latencia de lectura comienza cuando Bigtable recibe la solicitud y finaliza cuando se envía al cliente el último byte de datos. En el caso de las solicitudes de grandes cantidades de datos, la latencia de lectura puede verse afectada por la habilidad del cliente para consumir la respuesta.

Latencia de escritura Instancias
Tablas
Perfiles de aplicación

Momento en que una solicitud de escritura muestra una respuesta.

Tasa de error del usuario Instancias

La tasa de errores causados por la solicitud, en lugar de los errores del servidor de Bigtable. La tasa de errores del usuario incluye los siguientes códigos de estado:

  • INVALID_ARGUMENT
  • NOT_FOUND
  • PERMISSION_DENIED
  • RESOURCE_EXHAUSTED
  • OUT_OF_RANGE

A menudo, los errores de los usuarios se generan por problemas de configuración, como una solicitud que indica una tabla, un perfil de aplicación o un clúster incorrectos.

Tasa de error del sistema Instancias El porcentaje de todas las solicitudes que fallaron en el servidor de Bigtable. En la tasa de errores del sistema se incluyen los siguientes códigos de estado:
  • UNKNOWN
  • ABORTED
  • UNIMPLEMENTED
  • INTERNAL
  • UNAVAILABLE
Conmutaciones por error automáticas Instancias
Tablas
Perfiles de aplicación

La cantidad de solicitudes que se redirigieron de forma automática de un clúster a otro debido a una situación de conmutación por error (p. ej., debido a un retraso o a una breve interrupción del servicio). El redireccionamiento automático puede ocurrir cuando el perfil de una app usa enrutamiento de varios clústeres.

Este gráfico no incluye las solicitudes con redireccionamiento manual.

Uso del almacenamiento (bytes) Tablas
de instancias

La cantidad de datos almacenados en el clúster.

Esta métrica refleja el hecho de que Bigtable comprime tus datos cuando se almacenan.

Utilización del almacenamiento (% del máx.) Instancias

El porcentaje de la capacidad de almacenamiento del clúster que se encuentra en uso. La capacidad se basa en la cantidad de nodos del clúster.

Si deseas obtener más información sobre cómo se calcula este valor, consulta Uso de almacenamiento por nodo.

Carga del disco Instancias El porcentaje que tu clúster utiliza del ancho de banda máximo posible para las lecturas y las escrituras de HDD. Disponible solo para clústeres de HDD.
Filas leídas Instancias
Tablas
Perfiles de aplicación

La cantidad de filas que se leen por segundo.

Esta métrica proporciona una vista más útil del rendimiento general de Bigtable que la cantidad de solicitudes de lectura, ya que una sola solicitud puede leer una gran cantidad de filas.

Filas escritas Instancias
Tablas
Perfiles de aplicación

La cantidad de filas que se escriben por segundo.

Esta métrica proporciona una vista más útil del rendimiento general de Bigtable que la cantidad de solicitudes de escritura, ya que una sola solicitud puede escribir una gran cantidad de filas.

Solicitudes de lectura Instancias
Tablas
Perfiles de aplicación
La cantidad de lecturas aleatorias y solicitudes de análisis por segundo.
Solicitudes de escritura Instancias
Tablas
Perfiles de aplicación
La cantidad de solicitudes de escritura por segundo.
Rendimiento de lectura Instancias
Tablas
Perfiles de aplicación
La cantidad de bytes por segundo de datos de respuesta enviados. Esta métrica se refiere a la cantidad total de datos que se muestra después de aplicar los filtros.
Rendimiento de escritura Instancias
Tablas
Perfiles de aplicación
La cantidad de bytes por segundo recibidos cuando se escribieron los datos.
Conteo de nodos Instancias La cantidad de nodos del clúster.

Si deseas ver las métricas de estos recursos, sigue los pasos que se indican a continuación:

  1. Abre la lista de instancias de Bigtable en Google Cloud Console.

    Abrir la lista de instancias

  2. Haz clic en la instancia cuyas métricas quieres ver.

  3. En el panel de la izquierda, haz clic en Supervisión. En la consola de Google Cloud, se muestra una serie de gráficos para la instancia, así como una vista tabular de las métricas de la instancia. De forma predeterminada, en la consola de Google Cloud, se muestran las métricas de la última hora y se ven las métricas independientes para cada clúster de la instancia.

    Si deseas ver todos los gráficos, desplázate por el panel donde estos se muestran.

    Para ver las métricas a nivel de tabla, haz clic en Tablas.

    Para ver las métricas de los perfiles de apps individuales, haz clic en Perfiles de aplicación.

    Para ver todas las métricas de la instancia combinadas, busca la sección Agrupar por sobre los gráficos y haz clic en Instancia.

    Para ver las métricas de un período más largo, haz clic en la flecha junto a 1 hora. Elige un intervalo de tiempo preconfigurado o ingresa un intervalo de tiempo personalizado y, luego, haz clic en Aplicar.

Gráficos para replicación

En la página de supervisión, hay un gráfico que muestra la latencia de replicación en el tiempo. Puedes ver la latencia promedio para replicar escrituras en los percentiles 50, 99 y 100.

Si deseas ver la latencia de replicación en el tiempo, sigue los pasos que se indican a continuación:

  1. Abre la lista de instancias de Bigtable en Google Cloud Console.

    Abrir la lista de instancias

  2. Haz clic en la instancia cuyas métricas quieres ver.

  3. En el panel de la izquierda, haz clic en Supervisión. Se abrirá la página con la pestaña Instancia seleccionada.

  4. Haz clic en la pestaña Replicación. En la consola de Google Cloud, se muestra la latencia de replicación en el tiempo. De forma predeterminada, en la consola de Google Cloud, se muestra la latencia de replicación de la última hora.

    Para alternar entre los gráficos de latencia agrupados por tabla o por clúster, usa el menú Agrupar por.

    Para cambiar el percentil que deseas ver, usa el menú Percentil.

    Para ver las métricas de un período más largo, haz clic en la flecha junto a 1 hora. Elige un intervalo de tiempo preconfigurado o ingresa un intervalo de tiempo personalizado y, luego, haz clic en Aplicar.

Supervisar con Cloud Monitoring

Bigtable exporta las métricas de uso a Cloud Monitoring. Puedes usar estas métricas de varias maneras:

  • Supervisa de manera programática mediante la API de Cloud Monitoring.
  • Realiza la supervisión visual en el Explorador de métricas.
  • Configurar una política de alertas
  • Agrega métricas de uso de Bigtable a un panel personalizado.
  • Usa una biblioteca de gráficos, como Matplotlib para Python, a fin de trazar y analizar las métricas de uso de Bigtable.

Si deseas ver las métricas de uso en el Explorador de métricas, sigue los pasos que se indican a continuación:

  1. Abre la página Supervisión en la consola de Google Cloud.

    Abrir la página Monitoring

    Si se te solicita que elijas una cuenta, elige la que usas para acceder a Google Cloud Platform.

  2. Haz clic en Recursos y, luego, en Explorador de métricas.

  3. En Buscar tipo de recurso y métrica, escribe bigtable. Aparecerá una lista de recursos y métricas de Bigtable.

  4. Haz clic en una métrica para ver un gráfico de esta.

Para obtener información adicional sobre el uso de Cloud Monitoring, consulta la documentación de Cloud Monitoring.

Para obtener una lista completa de las métricas de Bigtable, consulta Métricas.

¿Qué sigue?