Identificar las transacciones que podrían causar latencias altas

En esta página, se describe cómo usar las estadísticas de bloqueo y de transacciones para identificar las transacciones que generan latencias altas.

Descripción general

A fin de garantizar la coherencia de varias transacciones simultáneas, Spanner usa bloqueos para controlar el acceso a los datos. La contención de bloqueo ocurre cuando muchas transacciones requieren acceso frecuente al mismo bloqueo, lo que genera latencias altas. Sin una interfaz visual, puede ser tedioso identificar las transacciones problemáticas que generan una gran cantidad de problemas de contención de bloqueo.

Las operaciones de Spanner adquieren bloqueos cuando las operaciones son parte de una transacción de lectura y escritura. Las transacciones de solo lectura no adquieren bloqueos.

Spanner te guía a través de los siguientes pasos para ayudarte a identificar las transacciones que generan latencias altas:

  1. Comprueba si hay un aumento repentino de latencias con Spanner Monitoring.
  2. Comprueba si hay problemas de contención de bloqueo mediante las estadísticas de bloqueo.
  3. Identifica las transacciones problemáticas con las estadísticas de transacciones.

Precios

No se aplican costos adicionales por las estadísticas de bloqueo ni de transacciones.

Parámetros de configuración de regiones

Las estadísticas de bloqueo y las estadísticas de transacciones están disponibles en las configuraciones regionales y multirregionales.

Retención de datos

La retención máxima de los datos que se muestran en los paneles de Estadísticas de bloqueo y de Estadísticas de transacciones es de 30 días. En el caso de los gráficos, los datos se recuperan de las tablas SPANNER_SYS.*, que tienen un período de retención máximo de 30 días.

Para obtener más información sobre estas tablas y la retención de datos, consulta Estadísticas de bloqueo y Estadísticas de transacciones.

Funciones obligatorias

Necesitas diferentes roles y permisos de IAM según si eres un usuario de IAM o un usuario de control de acceso detallado.

Usuario de Identity and Access Management (IAM)

Si quieres obtener los permisos que necesitas para ver la página de estadísticas de bloqueo y transacciones, pídele a tu administrador que te otorgue los siguientes roles de IAM en la instancia:

Se requieren los siguientes permisos del rol Lector de base de datos de Cloud Spanner (roles/spanner.databaseReader) para ver la página de estadísticas de bloqueo y transacciones:

  • spanner.databases.beginReadOnlyTransaction
  • spanner.databases.select
  • spanner.sessions.create

Usuario de control de acceso detallado

Si eres un usuario de control de acceso detallado, asegúrate de hacer lo siguiente:

  • Tener el Visualizador de Cloud Spanner(roles/spanner.viewer)
  • Solo tienen privilegios de control de acceso detallados y se les otorga la función del sistema spanner_sys_reader o una de sus funciones de miembro.
  • Selecciona las funciones de spanner_sys_reader o de miembro como tu función actual del sistema en la página de descripción general de la base de datos.

Para obtener más información, consulta Acerca del control de acceso detallado y Funciones detalladas del sistema de control de acceso.

Verifica si hay un aumento repentino de latencias con Spanner Monitoring

Puedes usar Cloud Monitoring a fin de configurar alertas para las métricas que superen los umbrales especificados de todas las solicitudes.

Si recibes una alerta que indica un aumento repentino en las latencias de una instancia, puedes confirmarlo en el panel de Spanner Monitoring, que muestra gráficos de varias métricas importantes. El gráfico Latencia te ayuda a ver las latencias altas en los percentiles 50 y 99.

Para confirmar un aumento repentino en las latencias de escritura del percentil 99, sigue estos pasos:

  1. En la consola de Google Cloud, ve a la página Instancias de Spanner.

    Ir a Instancias de Spanner

  2. Haz clic en el nombre de la instancia .

    En la consola de Google Cloud, se muestra una descripción general de la instancia.

  3. Haz clic en Monitoring en el menú de navegación.

    En la consola de Google Cloud, se muestran gráficos de datos de la instancia.

  4. En el gráfico Latencia, establece Función en Write y Percentil en 99th.

  5. Revisa el gráfico actualizado para verificar si muestra algún aumento repentino.

Un gráfico que muestra las latencias de escritura en el percentil 99

Si observas que el uso de CPU no está aumentando y que los errores aumentan en operaciones por segundo, es probable que los aumentos de latencia se deban a las contenciones de bloqueo.

Verifica si hay problemas de contención de bloqueo con las estadísticas de bloqueo

El panel Estadísticas de bloqueo te ayuda a ver el tiempo de espera de bloqueo en una instancia o una base de datos seleccionada. Puede ayudarte a confirmar si las latencias altas se deben a contenciones de bloqueo.

Comprueba el tiempo de espera de bloqueo alto

Para comprobar si el tiempo de espera de bloqueo es alto, sigue estos pasos:

  1. Haz clic en Bloquear estadísticas en el menú de navegación.

    En la consola de Google Cloud, se muestra el gráfico Tiempo de bloqueo total, que muestra el tiempo de espera de bloqueo de cada base de datos en la instancia.

    Los datos que se muestran corresponden a 1 hour de forma predeterminada, como se muestra en el selector de hora en la esquina superior derecha del panel de estadísticas de bloqueo. Para ver datos de un rango más amplio, selecciona otra opción, como 1 day.

    Para obtener más información, consulta Trabaja con gráficos.

  2. En el selector Bases de datos en la parte superior, selecciona la base de datos que muestra el tiempo de espera de bloqueo más alto.

    El gráfico Tiempo de bloqueo total se actualiza para mostrar los datos solo de la base de datos seleccionada.

    Además, en otro gráfico, Tiempo de bloqueo por rango de fila, se muestran los gráficos del tiempo de espera de bloqueo por rangos de filas.

  3. Haz clic en el gráfico y arrástralo de forma horizontal para expandir la hora en la que se ve un aumento repentino de latencia.

Panel de estadísticas de bloqueo

Analiza los datos de espera de bloqueo

En la tabla Lock Insights, se muestran las siguientes columnas de las tablas del sistema SPANNER_SYS.LOCK_STATS:

  • Clave de inicio del rango de filas: La clave de fila en la que ocurrió el conflicto de bloqueo. Cuando el conflicto incluye un rango de filas, el valor representa la clave de inicio del rango. Un signo más (+) significa un rango.
  • Tiempo de espera de bloqueo: El tiempo total de espera de bloqueo representado visualmente en una barra horizontal. De forma predeterminada, la tabla usa esta columna para los ordenamientos y muestra la clave de inicio del rango de filas con el tiempo de espera de bloqueo más alto en la parte superior.
  • Tiempo de espera de bloqueo (segundos): El tiempo de espera de bloqueo acumulado de los conflictos de bloqueo registrados para todas las columnas del rango de clave de fila, en segundos.
  • Tiempo de espera de bloqueo (%): El tiempo de espera de los conflictos de bloqueo registrados para todas las columnas en el rango de clave de fila como un porcentaje del tiempo de espera de bloqueo total de todos los rangos de clave de fila en la base de datos.

Para correlacionar los datos del gráfico Tiempo de bloqueo por rango de fila con los datos de la tabla, selecciona una línea. Se destacará la fila relacionada. Por el contrario, debes seleccionar la casilla de verificación de una fila de la tabla para ver la línea relacionada en el gráfico.

Tabla de estadísticas de bloqueo

Para filtrar los datos de la tabla, haz lo siguiente:

  1. Haz clic en el cuadro de texto junto a Filtro.

  2. Selecciona una propiedad y un operador, y especifica un valor.

En la tabla, se muestran datos que coinciden con el filtro.

Ver solicitudes de bloqueo de muestra

El panel Solicitudes de bloqueo de muestra muestra detalles sobre las solicitudes de bloqueo de muestra de transacciones rivales.

Para ver información de muestra de la solicitud de bloqueo correspondiente a una clave de inicio de rango de filas, haz clic en el vínculo relacionado en la tabla.

La tabla muestra las siguientes columnas de información:

  • Nombre de la columna de muestra: Es la columna que encontró el conflicto de bloqueo en el rango de clave de fila.
  • Modo de bloqueo: Es el modo de bloqueo solicitado.
  • Ver transacciones: Es un vínculo a la página Estadísticas de transacciones, que muestra las transacciones que podrían competir por los bloqueos.

La página de detalles de las estadísticas de bloqueo

Identifica transacciones rivales con las estadísticas de transacciones

El panel Estadísticas de transacciones te ayuda a ver la latencia en las transacciones de una instancia o una base de datos seleccionada. Puede ayudarte a identificar las transacciones que podrían generar latencias altas debido a las contenciones de bloqueo.

Visualiza las latencias de las transacciones

Para ver la latencia de las transacciones, sigue estos pasos:

  1. Haz clic en Estadísticas de transacciones en el panel de navegación izquierdo.

  2. En el selector Bases de datos en la parte superior, selecciona la base de datos que muestra el tiempo de espera de bloqueo más alto.

    Como alternativa, en el panel Estadísticas de bloqueo, haz clic en Ver transacciones para filtrar las transacciones que leen o escriben en una columna de muestra específica.

    Los datos que se muestran corresponden a 1 hour de forma predeterminada, como se muestra en el selector de hora en la esquina superior derecha del panel de estadísticas de transacciones.

En el panel, se muestran los siguientes gráficos:

  • El gráfico Latencia promedio (todas las transacciones) muestra la latencia de todas las transacciones en la instancia.

  • En el gráfico Latencia promedio (por transacción), se muestra la latencia de cada transacción para la base de datos seleccionada.

El panel de estadísticas de transacciones

Analiza los datos de la transacción

Puedes ver y analizar los datos de cada transacción en la tabla que aparece debajo de los gráficos. En la tabla, se muestran los datos de métricas de las tablas del sistema SPANNER_SYS.TXN_STATS en las siguientes columnas:

  • Huella digital: El hash de la etiqueta de la transacción, si existe. De lo contrario, el hash se calcula en función de las operaciones involucradas en la transacción. El valor es un vínculo que dirige a la página Detalles de la transacción.
  • Etiqueta de transacción: Es la etiqueta de transacción opcional para la transacción. Los datos estadísticos de varias transacciones que tienen la misma cadena de etiqueta se agrupan en una sola fila con la etiqueta TRANSACTION_TAG que coincide con la cadena de etiqueta.
  • Tablas afectadas: Las tablas afectadas por la transacción.
  • Lectura de Table.column: Son las columnas de las que lee la transacción.
  • Table.column Written: Las columnas en las que se escribió la transacción.
  • Latencia prom. (segundos): Promedio de segundos que se requiere para realizar la transacción. De forma predeterminada, la tabla se ordena por esta columna en orden descendente.

Para correlacionar los datos del gráfico Latencia promedio (por transacción) con los datos de la tabla, selecciona una línea en el gráfico. Se destacará la fila correspondiente de la tabla.

Para filtrar los datos de la tabla, haz lo siguiente:

  1. Haz clic junto a Filtro.

  2. Selecciona una propiedad y un operador, y especifica un valor.

En la tabla, se muestran datos que coinciden con el filtro.

Tabla de estadísticas de transacciones

Consulta información detallada sobre una transacción

Para ver información detallada sobre una transacción, como la que muestra la latencia más alta, haz clic en el vínculo Huella digital en la fila correspondiente de la tabla.

Aparecerá la página Detalles de la transacción. Además de la tabla de detalles en la parte superior, muestra la siguiente información:

  • Una barra que muestra valores numéricos para cada una de estas métricas:

    • Promedio de bytes: La cantidad promedio de bytes que escribió la transacción
    • Latencia promedio: Es el promedio de segundos que se toman desde la primera operación de la transacción para confirmar o anular.
    • Latencia de confirmación promedio: El promedio de segundos que se tarda en realizar la operación de confirmación.
    • Recuento total de intentos: Es la cantidad total de intentos de transacción.
    • Recuento total de anulaciones: La cantidad total de intentos de transacción que se anularon, incluidos los que se anularon antes de llamar al método de confirmación de la transacción.
  • Gráficos que representan estos valores.

    Además, en el gráfico Promedio de participantes, se muestra la cantidad promedio de participantes en cada intento de confirmación.

La página de detalles de las estadísticas de transacciones

Investiga si se puede optimizar la forma de la transacción para reducir las latencias. Considera aplicar las prácticas recomendadas para reducir la contención de bloqueo.

Pasos siguientes