Identifica las transacciones que podrían causar latencias altas

En esta página, se describe cómo usar las estadísticas de bloqueo y Estadísticas de transacciones para identificar las transacciones que generan latencias.

Descripción general

Para garantizar la coherencia de varias transacciones simultáneas Spanner usa bloqueos para controlar el acceso a los datos. La contención de bloqueos ocurre cuando muchas transacciones requieren acceso frecuente al mismo bloqueo, lo que genera latencias altas. Sin un visual, puede ser tedioso identificar las transacciones problemáticas que generan una gran cantidad de problemas de contención de bloqueo.

Las operaciones de Spanner adquieren bloqueos cuando forman parte de una transacción de lectura y escritura. Las transacciones de solo lectura no adquieren bloqueos.

Spanner te ayuda a identificar las transacciones que generan latencias altas guiándote en los siguientes pasos:

  1. Verifica si hay un aumento repentino en las latencias con la supervisión de Spanner.
  2. Comprueba si hay problemas de contención de bloqueo con las estadísticas de bloqueo.
  3. Identifica las transacciones problemáticas con las estadísticas de transacciones.

Precios

No se aplican costos adicionales por las estadísticas de bloqueo ni de transacciones.

Parámetros de configuración de región

Las estadísticas de bloqueo y de transacciones están disponibles en regionales y multirregionales.

Retención de datos

La retención máxima de datos para los datos que se muestran en los paneles de estadísticas de bloqueo y estadísticas de transacciones es de 30 días. En el caso de los gráficos, los datos se recuperan de las tablas SPANNER_SYS.*, que tienen un período de retención máximo de 30 días.

Para obtener más información sobre estas tablas y la retención de datos, consulta Estadísticas de bloqueo y Estadísticas de transacciones.

Roles obligatorios

Necesitas diferentes roles y permisos de IAM según si eres un usuario de IAM o un usuario de control de acceso detallado.

Usuario de Identity and Access Management (IAM)

Para obtener los permisos que necesitas para ver la página de estadísticas de bloqueos y transacciones, pídele a tu administrador que te otorgue los siguientes roles de IAM en la instancia:

Para ver la página de estadísticas de bloqueos y transacciones, se requieren los siguientes permisos en el rol de Lector de bases de datos de Cloud Spanner (roles/spanner.databaseReader):

  • spanner.databases.beginReadOnlyTransaction
  • spanner.databases.select
  • spanner.sessions.create

Usuario del control de acceso detallado

Si eres un usuario de control de acceso detallado, asegúrate de hacer lo siguiente:

  • Tener el Visualizador de Cloud Spanner (roles/spanner.viewer)
  • Solo tienen privilegios de control de acceso detallados y se les otorga spanner_sys_reader. rol de sistema o uno de sus roles miembros.
  • Selecciona las funciones de spanner_sys_reader o de miembros como tu función del sistema actual en la página de descripción general de la base de datos.

Para obtener más información, consulta Acerca del control de acceso detallado y Roles de sistema de control de acceso detallados.

Comprueba si hay un aumento repentino en las latencias con Spanner Monitoring

Puedes usar Cloud Monitoring para configurar alertas para métricas que superen umbrales para todas las solicitudes.

Si recibes una alerta que indica un aumento repentino en las latencias puedes confirmarlo en el Spanner Panel de supervisión, que muestra gráficos para varias métricas importantes. El gráfico de Latencia te ayuda a ver los valores latencias en los percentiles 50 y 99.

Para confirmar un aumento repentino en las latencias de escritura en el percentil 99, sigue estos pasos:

  1. En la consola de Google Cloud, ve a la página Instancias de Spanner.

    Ir a Instancias de Spanner

  2. Haz clic en el nombre de la instancia .

    En la consola de Google Cloud, se muestra una descripción general de la instancia.

  3. En el menú de navegación, haz clic en Monitoring.

    La consola de Google Cloud muestra gráficos de datos de instancia.

  4. En el gráfico Latencia, establece Función en Write y Percentil en 99th.

  5. Revisa el gráfico actualizado para ver si muestra algún aumento repentino.

Gráfico que muestra las latencias de escritura en el percentil 99

Si observas que la utilización de la CPU no aumenta y que los errores aumentan en las operaciones por segundo, es probable que los aumentos repentinos de latencia se deban a las contentiones de bloqueo.

Comprueba si hay problemas de contención de bloqueo con las estadísticas de bloqueo

El panel de estadísticas de bloqueo te ayuda a ver el tiempo de espera de bloqueo en una instancia o una base de datos seleccionada. Puede ayudarte a confirmar si las latencias altas se deben a la contención de bloqueos.

Verifica si hay un tiempo de espera de bloqueo alto

Para verificar si hay un tiempo de espera de bloqueo alto, sigue estos pasos:

  1. Haz clic en Bloquear estadísticas en el menú de navegación.

    La consola de Google Cloud muestra el gráfico Total lock wait, que muestra el tiempo de espera de bloqueo de cada base de datos de la instancia.

    Los datos que se muestran son de 1 hour de forma predeterminada, como se muestra en el selector de hora de la esquina superior derecha del panel de estadísticas de bloqueo. Para ver los datos de un rango más amplio, selecciona otra opción, como 1 day.

    Para obtener más información, consulta Trabaja con gráficos.

  2. En el selector Bases de datos que se encuentra en la parte superior, selecciona la base de datos que muestra el tiempo de espera de bloqueo más alto.

    El gráfico Tiempo de bloqueo total se actualiza para mostrar solo los datos de la base de datos seleccionada.

    Además, otro gráfico, Tiempo de bloqueo por rango de filas, muestra gráficos del tiempo de bloqueo por rangos de filas.

  3. Haz clic en el gráfico y arrástralo horizontalmente para expandir la hora en la que se ve un aumento repentino de latencia.

El panel Estadísticas de bloqueo

Analiza los datos de espera de bloqueo

En la tabla Bloquear estadísticas, se muestran las siguientes columnas de la SPANNER_SYS.LOCK_STATS del sistema:

  • Clave de inicio del rango de filas: Es la clave de fila en la que se produjo el conflicto de bloqueo. Cuando el conflicto involucra un rango de filas, el valor representa la clave de inicio del rango. Un signo más (+) indica un rango.
  • Tiempo de espera de bloqueo: Es el tiempo total de espera de bloqueo representado de forma visual en una barra horizontal. De de forma predeterminada, la tabla usa esta columna para ordenar y muestra la clave de inicio del rango de filas con el tiempo de espera de bloqueo más alto en la parte superior.
  • Tiempo de espera de bloqueo (segundos): El tiempo de espera de bloqueo acumulado de los conflictos de bloqueo registrados. para todas las columnas del rango de clave de fila, en segundos.
  • Tiempo de espera de bloqueo (%): Es el tiempo de espera de los conflictos de bloqueo registrados para todas las columnas del intervalo de clave de fila como un porcentaje del tiempo de espera de bloqueo total para todos los intervalos de clave de fila de la base de datos.

Para correlacionar los datos del gráfico Espera de bloqueo por rango de filas con los datos de la tabla, selecciona una línea. La fila relacionada aparecerá destacada. Por el contrario, selecciona la casilla de verificación de una fila en la tabla para ver la línea relacionada en el gráfico.

La tabla de estadísticas de bloqueo

Para filtrar los datos en la tabla, haz lo siguiente:

  1. Haz clic en el cuadro de texto junto a Filtro.

  2. Selecciona una propiedad, un operador y especifica un valor.

La tabla muestra los datos que coinciden con el filtro.

Ver ejemplos de solicitudes de bloqueo

En el panel Solicitudes de bloqueo de muestra, se muestran detalles sobre las solicitudes de bloqueo de muestra de las transacciones en conflicto.

Para ver la información de la solicitud de bloqueo de muestra de una clave de inicio de rango de filas, haz clic en el vínculo relacionado en la tabla.

En la tabla, se muestran las siguientes columnas de información:

  • Ejemplo de nombre de columna: Es la columna que encontró el bloqueo. conflicto en el rango de clave de fila.
  • Modo bloqueado: Es el modo bloqueado solicitado.
  • Ver transacciones: Un vínculo a la página Estadísticas de transacciones, que muestra las transacciones que podrían estar compitiendo por los bloqueos.

Página de detalles de las estadísticas de bloqueo

Identifica las transacciones en conflicto con las estadísticas de transacciones

El panel Estadísticas de transacciones te ayuda a ver la latencia en las transacciones de una instancia o una base de datos seleccionada. Puede ayudarte a identificar las transacciones que podrían generar latencias altas debido a las contiendas de bloqueo.

Consulta las latencias de las transacciones

Para ver la latencia de las transacciones, sigue estos pasos:

  1. Haz clic en Estadísticas de transacciones en el panel de navegación izquierdo.

  2. En el selector Bases de datos de la parte superior, selecciona la base de datos que se muestra. el tiempo de espera de bloqueo más alto.

    Como alternativa, en el panel de estadísticas de bloqueo, haz clic en Ver transacciones para filtrar las transacciones que leen o escriben en una columna de muestra específica.

    Los datos que se muestran son de 1 hour de forma predeterminada, como se muestra en el selector de tiempo de la esquina superior derecha del panel Información sobre transacciones.

En el panel, se muestran los siguientes gráficos:

  • En el gráfico Latencia promedio (todas las transacciones), se muestra la latencia de todas las transacciones de la instancia.

  • El gráfico Latencia promedio (por transacción) muestra la latencia de cada para la base de datos seleccionada.

El panel Estadísticas de transacciones

Analiza los datos de las transacciones

Puedes ver y analizar los datos de cada transacción en la tabla que aparece debajo de los gráficos. En la tabla, se muestran los datos de métricas de las tablas del sistema SPANNER_SYS.TXN_STATS en las siguientes columnas:

  • Huella digital: Es el hash de la etiqueta de transacción, si existe. De lo contrario, el hash se calcula con base en las operaciones involucradas en la transacción. El valor es un vínculo que dirige a la página Detalles de la transacción.
  • Etiqueta de transacción: Es la etiqueta de transacción opcional. para la transacción. Datos estadísticos para varias transacciones que tienen la misma etiqueta cadena se agrupa en una sola fila, donde la etiqueta TRANSACTION_TAG coincide con la cadena de etiquetas.
  • Tablas afectadas: Son las tablas afectadas por la transacción.
  • Lectura de tabla.columna: Las columnas desde las que se lee la transacción.
  • Escritura de tabla.columna: Las columnas en las que se escribió la transacción.
  • Latencia promedio (segundos): Es el promedio de segundos necesarios para realizar la transacción. De forma predeterminada, la tabla se ordena por esta columna en orden descendente.

Para correlacionar los datos del gráfico Latencia promedio (por transacción) con el datos de la tabla, selecciona una línea del gráfico. La fila correspondiente de la tabla aparecerá destacada.

Para filtrar los datos en la tabla, haz lo siguiente:

  1. Haz clic junto a Filtro.

  2. Selecciona una propiedad, un operador y especifica un valor.

La tabla muestra los datos que coinciden con el filtro.

La tabla Estadísticas de transacciones

Visualiza información detallada sobre una transacción

Para ver información detallada sobre una transacción, como la que muestra la latencia más alta, haz clic en el vínculo Fingerprint en la fila correspondiente de la tabla.

Se abrirá la página Detalles de la transacción. Además de la tabla de detalles en la parte superior, en él se muestra la siguiente información:

  • Una barra que muestra valores numéricos para cada una de estas métricas:

    • Bytes promedio: Es la cantidad promedio de bytes que escribió la transacción.
    • Latencia promedio: Es el promedio de segundos que tarda la primera operación de la transacción en confirmarse o abortarse.
    • Latencia de confirmación promedio: Promedio de segundos que se tarda en realizar la operación de confirmación.
    • Recuento total de intentos: Es la cantidad total de intentos de transacción.
    • Recuento total de anulaciones: Es la cantidad total de intentos de transacción que anuladas, incluidas aquellas que se anulan antes de llamar al método de confirmación.
  • Gráficos que representan estos valores.

    Además, el gráfico Participantes promedio muestra la cantidad promedio de participantes en cada intento de confirmación.

Página de detalles de las estadísticas de transacciones

Investiga si se puede optimizar la forma de la transacción para reducir las latencias. Considera aplicar las prácticas recomendadas para reducir la contención de bloqueo.

Pasos siguientes