Tablas de estadísticas de consultas

Cloud Spanner proporciona tablas integradas que conservan muchas estadísticas de las consultas que usaron más CPU y todas las consultas en conjunto. Google Cloud Console usa los datos de estas tablas SPANNER_SYS.QUERY_STATS* para generar la vista de estadísticas de consultas. También puedes recuperar estadísticas de las tablas mediante las instrucciones de SQL.

Uso

Los datos SPANNER_SYS solo están disponibles a través de interfaces de SQL (por ejemplo, executeQuery y gcloud spanner databases execute-sql); otros métodos de lectura únicos que proporciona Cloud Spanner no son compatibles con SPANNER_SYS.

Uso de CPU agrupado por consulta

Con las siguientes tablas, se realiza un seguimiento de las consultas con el uso más alto de CPU durante un período específico:

  • SPANNER_SYS.QUERY_STATS_TOP_MINUTE: Consultas en intervalos de 1 minuto
  • SPANNER_SYS.QUERY_STATS_TOP_10MINUTE: Consultas en intervalos de 10 minutos
  • SPANNER_SYS.QUERY_STATS_TOP_HOUR: Consultas en intervalos de 1 hora

Estas tablas tienen las siguientes propiedades:

  • Cada tabla contiene datos de intervalos de tiempo no superpuestos de la longitud que se especifica en el nombre de la tabla.

  • Los intervalos se basan en tiempos de reloj. Los intervalos de 1 minuto finalizan en el minuto, los intervalos de 10 minutos finalizan cada 10 minutos a partir de la hora y los intervalos de 1 hora finalizan en la hora.

    Por ejemplo, a las 11:59:30 a.m., los intervalos más recientes disponibles para las consultas de SQL son los siguientes:

    • 1 minuto: De 11:58:01 a 11:59:00 a.m.
    • 10 minutos: De 11:40:01 a 11:50:00 a.m.
    • 1 hora: De 10:00:01 a 11:00:00 a.m.
  • Cloud Spanner agrupa las estadísticas según el texto de la consulta de SQL. Si una consulta usa parámetros de búsqueda, Cloud Spanner agrupa todas las ejecuciones de esa consulta en una fila. Si la consulta usa literales de string, Cloud Spanner solo agrupa las estadísticas si el texto completo de la consulta es idéntico; cuando algún texto difiere, cada consulta aparece como una fila separada.

  • Cada fila contiene estadísticas de todas las ejecuciones de una consulta de SQL en particular en las que Cloud Spanner captura estadísticas durante el intervalo especificado.

  • Si Cloud Spanner no puede almacenar todas las consultas que se ejecutan durante el intervalo, el sistema prioriza las consultas con el mayor uso de CPU durante el intervalo especificado.

Esquema de la tabla

Nombre de la columna Tipo Descripción
INTERVAL_END TIMESTAMP Fin del intervalo en el que se produjeron las ejecuciones de consultas incluidas
TEXT STRING Texto de consulta de SQL, truncado a aproximadamente 64 KB
TEXT_TRUNCATED BOOL Indica si el texto de la consulta se truncó o no
TEXT_FINGERPRINT INT64 Hash del texto de la consulta
EXECUTION_COUNT INT64 Cantidad de veces que Cloud Spanner hizo la consulta durante el intervalo.
AVG_LATENCY_SECONDS FLOAT64 Promedio de tiempo, en segundos, para cada ejecución de consulta dentro de la base de datos. Este promedio excluye la codificación y el tiempo de transmisión del conjunto de resultados, así como la sobrecarga.
AVG_ROWS FLOAT64 Promedio de filas que mostró la consulta.
AVG_BYTES FLOAT64 Promedio de bytes de datos que mostró la consulta, sin incluir la sobrecarga de codificación de transmisión.
AVG_ROWS_SCANNED FLOAT64 Promedio de filas que analizó la consulta, sin incluir los valores borrados.
AVG_CPU_SECONDS FLOAT64 Promedio de segundos de tiempo de CPU que Cloud Spanner invirtió en todas las operaciones para ejecutar la consulta.

Tablas para estadísticas adicionales

También hay tablas que realizan un seguimiento de los datos adicionales de todas las consultas para las que Cloud Spanner capturó las estadísticas en un período específico:

  • SPANNER_SYS.QUERY_STATS_TOTAL_MINUTE: Consultas en intervalos de 1 minuto
  • SPANNER_SYS.QUERY_STATS_TOTAL_10MINUTE: Consultas en intervalos de 10 minutos
  • SPANNER_SYS.QUERY_STATS_TOTAL_HOUR: Consultas en intervalos de 1 hora

Estas tablas tienen las siguientes propiedades:

  • Cada tabla contiene datos de intervalos de tiempo no superpuestos de la longitud que se especifica en el nombre de la tabla.

  • Los intervalos se basan en tiempos de reloj. Los intervalos de 1 minuto finalizan en el minuto, los intervalos de 10 minutos finalizan cada 10 minutos a partir de la hora y los intervalos de 1 hora finalizan en la hora.

    Por ejemplo, a las 11:59:30 a.m., los intervalos más recientes disponibles para las consultas de SQL son los siguientes:

    • 1 minuto: De 11:58:01 a 11:59:00 a.m.
    • 10 minutos: De 11:40:01 a 11:50:00 a.m.
    • 1 hora: De 10:00:01 a 11:00:00 a.m.
  • Cada fila contiene estadísticas de todas las consultas que se ejecutaron en la base de datos durante el intervalo especificado, combinadas. Solo hay una fila por intervalo de tiempo.

  • Las estadísticas capturadas en las tablas TOTAL pueden incluir consultas que Cloud Spanner no capturó en las tablas TOP.

Esquema de la tabla

Nombre de la columna Tipo Descripción
INTERVAL_END TIMESTAMP Fin del intervalo en el que se produjeron las ejecuciones de consultas incluidas
EXECUTION_COUNT INT64 Cantidad de veces que Cloud Spanner hizo la consulta durante el intervalo.
AVG_LATENCY_SECONDS FLOAT64 Promedio de tiempo, en segundos, para cada ejecución de consulta dentro de la base de datos. Este promedio excluye la codificación y el tiempo de transmisión del conjunto de resultados, así como la sobrecarga.
AVG_ROWS FLOAT64 Promedio de filas que mostró la consulta.
AVG_BYTES FLOAT64 Promedio de bytes de datos que mostró la consulta, sin incluir la sobrecarga de codificación de transmisión.
AVG_ROWS_SCANNED FLOAT64 Promedio de filas que analizó la consulta, sin incluir los valores borrados.
AVG_CPU_SECONDS FLOAT64 Promedio de segundos de tiempo de CPU que Cloud Spanner invirtió en todas las operaciones para ejecutar la consulta.

Retención de datos

Como mínimo, Cloud Spanner conserva los datos para cada tabla durante los siguientes períodos:

  • SPANNER_SYS.QUERY_STATS_TOP_MINUTE y SPANNER_SYS.QUERY_STATS_TOTAL_MINUTE: Intervalos que abarcan las 6 horas anteriores.

  • SPANNER_SYS.QUERY_STATS_TOP_10MINUTE y SPANNER_SYS.QUERY_STATS_TOTAL_10MINUTE: Intervalos que abarcan los 4 días anteriores.

  • SPANNER_SYS.QUERY_STATS_TOP_HOUR y SPANNER_SYS.QUERY_STATS_TOTAL_HOUR: Intervalos que abarcan los 30 días anteriores.

Ejemplos de consultas

En esta sección, se incluyen varias instrucciones de SQL de ejemplo que recuperan estadísticas de consultas. Puedes ejecutar estas instrucciones de SQL con las bibliotecas cliente, la herramienta de línea de comandos de gcloud o Cloud Console.

Genera una lista de las estadísticas básicas de cada consulta en un período determinado

La siguiente consulta muestra los datos sin procesar de las consultas principales en el minuto anterior:

SELECT text,
       interval_end,
       execution_count,
       avg_latency_seconds,
       avg_rows,
       avg_bytes,
       avg_rows_scanned,
       avg_cpu_seconds
FROM spanner_sys.query_stats_top_minute
ORDER BY interval_end;

Genera una lista de las consultas con el mayor uso de CPU

La siguiente consulta muestra las consultas con el uso de CPU más alto en la hora anterior:

SELECT text,
       execution_count AS count,
       avg_latency_seconds AS latency,
       avg_cpu_seconds AS cpu,
       execution_count * avg_cpu_seconds AS total_cpu
FROM spanner_sys.query_stats_top_hour
WHERE interval_end =
  (SELECT MAX(interval_end)
   FROM spanner_sys.query_stats_top_hour)
ORDER BY total_cpu DESC;

Encuentra el recuento total de ejecuciones en un período determinado

La siguiente consulta muestra la cantidad total de consultas ejecutadas en el intervalo completo de 1 minuto más reciente:

SELECT interval_end,
       execution_count
FROM spanner_sys.query_stats_total_minute
WHERE interval_end =
  (SELECT MAX(interval_end)
   FROM spanner_sys.query_stats_top_minute)
ORDER BY interval_end;

Encuentra la latencia promedio de una consulta

La siguiente consulta muestra la información de latencia promedio de una consulta específica:

SELECT avg_latency_seconds
FROM spanner_sys.query_stats_top_hour
WHERE text LIKE "SELECT x FROM table WHERE x=@foo;";

Encuentra las consultas que analizan la mayor cantidad de datos

Puedes usar la cantidad de filas analizadas por una consulta como una medida de la cantidad de datos que analizó la consulta. La siguiente consulta muestra el número de filas analizadas por consultas ejecutadas en la hora anterior:

SELECT text,
       execution_count,
       avg_rows_scanned
FROM spanner_sys.query_stats_top_hour
WHERE interval_end =
  (SELECT MAX(interval_end)
   FROM spanner_sys.query_stats_top_hour)
ORDER BY avg_rows_scanned DESC;

Calcular el total de uso de la CPU en todas las consultas

La siguiente consulta muestra el número de horas de CPU usadas en la hora anterior:

SELECT (avg_cpu_seconds * execution_count / 60 / 60)
  AS total_cpu_hours
FROM spanner_sys.query_stats_total_hour
WHERE interval_end =
  (SELECT MAX(interval_end)
   FROM spanner_sys.query_stats_total_hour);

Próximos pasos