En esta página, se describe cómo usar el panel Estadísticas de consultas para para detectar y analizar problemas de rendimiento de Spanner.
Descripción general de las estadísticas de consultas
Las estadísticas de consultas te ayudan a detectar y diagnosticar problemas de rendimiento de las consultas y las declaraciones DML (INSERT
, UPDATE
y DELETE
) de una base de datos de Spanner. Admite la supervisión intuitiva y proporciona información de diagnóstico que te ayuda a ir más allá de la detección para identificar la causa raíz de los problemas de rendimiento.
Estadísticas de consultas te ayuda a mejorar el rendimiento de las consultas de Spanner mediante la orientación a través de los siguientes pasos:
- Confirma si las consultas ineficientes son responsables de un alto uso de CPU.
- Identifica una búsqueda o etiqueta que podría ser problemática.
- Analiza la consulta o la etiqueta de solicitud para identificar problemas.
Las estadísticas de consultas están disponibles en configuraciones regionales y multirregionales.
Precios
Las Estadísticas de consultas no tienen costo adicional.
Retención de datos
La retención máxima de datos para las estadísticas de consultas es de 30 días.
En el gráfico Uso de CPU total (por etiqueta de consulta o solicitud), los datos se toman de las tablas SPANNER_SYS.QUERY_STATS_TOP_*
, que tienen una retención máxima de 30 días. Consulta Retención de datos.
para obtener más información.
Roles obligatorios
Necesitas diferentes roles y permisos de IAM según si eres un usuario de IAM o un usuario de control de acceso detallado.
Usuario de Identity and Access Management (IAM)
A fin de obtener los permisos necesarios para ver la página Estadísticas de consultas, solicita a tu administrador que te otorgue el los siguientes roles de IAM en la instancia:
-
Visualizador de Cloud Spanner (
roles/spanner.viewer
) -
Lector de base de datos de Cloud Spanner (
roles/spanner.databaseReader
)
Para ver la página Información sobre consultas, se requieren los siguientes permisos en el rol de Lector de bases de datos de Cloud Spanner (
roles/spanner.databaseReader
):
spanner.databases.beginReadOnlyTransaction
spanner.databases.select
spanner.sessions.create
Usuario con control de acceso detallado
Si eres un usuario del control de acceso detallado, asegúrate de hacer lo siguiente:
- Tener el Visualizador de Cloud Spanner(
roles/spanner.viewer
) - Tener privilegios de control de acceso detallados y tener
spanner_sys_reader
rol de sistema o uno de sus roles miembros. - Selecciona
spanner_sys_reader
o un rol de miembro como tu rol de sistema actual en la página de descripción general de la base de datos.
Para obtener más información, consulta Información sobre el control de acceso detallado y Roles del sistema de control de acceso detallado.
El panel de Estadísticas de consultas
El panel Estadísticas de consultas muestra la carga de consultas según la base de datos y el intervalo de tiempo que selecciones. La carga de consultas es una medición de la uso de CPU total para todas las consultas en la instancia en el tiempo seleccionado del rango de destino de la ruta. El panel proporciona una serie de filtros que te ayudan a ver la consulta de carga de trabajo.
Para ver el panel Estadísticas de consultas de una base de datos, haz lo siguiente:
- Selecciona Estadísticas de consultas en el panel de navegación izquierdo. Se abrirá el panel de estadísticas de consultas.
- Selecciona una base de datos de la lista Bases de datos. El panel muestra la información de carga de consultas de la base de datos.
Las áreas del panel incluyen:
- Lista de bases de datos: Filtra la carga de consultas en una base de datos específica o en todas las bases de datos.
- Filtro de intervalo de tiempo: Filtra la carga de consultas por intervalos de tiempo, como horas, días o un intervalo personalizado.
- Gráfico de Uso total de CPU (todas las consultas): Muestra la carga agregada. de todas las consultas.
- Gráfico del uso total de CPU (por etiqueta de consulta o solicitud): Muestra la CPU. el uso por parte de cada etiqueta de consulta o solicitud.
- Tabla de consultas y etiquetas principales: Muestra la lista de las principales búsquedas y solicitudes. y las etiquetas se ordenan según el uso de CPU. Consulta Identifica una búsqueda o etiqueta que podría ser problemática.
Rendimiento del panel
Usa parámetros de consulta o etiqueta tus consultas para optimizar el rendimiento de las Estadísticas de consultas. Si no parametrizas ni etiquetas tus consultas, es posible que se muestren demasiados resultados, lo que podría provocar que la tabla de consultas y etiquetas TopN no se cargue correctamente.
Confirma si las consultas ineficientes son responsables del alto uso de CPU
El uso total de CPU es una medida del trabajo (en segundos de CPU) que la las consultas ejecutadas en la base de datos seleccionada a lo largo del tiempo.
Revisa el gráfico para explorar estas preguntas:
¿Qué base de datos experimenta la carga? Selecciona bases de datos diferentes en la lista Bases de datos para encontrar las bases de datos con las cargas más altas. Para saber qué base de datos tiene la carga más alta, también puedes revisar el Gráfico Uso de CPU: total para las bases de datos en el Consola de Google Cloud.
¿El uso de CPU es alto? ¿El grafo aumenta o se incrementa con el tiempo? Si no ves un uso alto de CPU, entonces el problema no está en tus consultas.
¿Cuánto tiempo lleva el uso de CPU alto? ¿Hubo un aumento repentino recientemente o tuvo ha permanecido alta de forma constante durante un tiempo? Usa el selector de intervalo de tiempo para seleccionar varios períodos a fin de averiguar cuánto tiempo ha durado el problema. Acerca la vista para ver un período en el que se observan los aumentos repentinos de la carga de consultas. Aléjate para ver hasta una semana del cronograma.
Si ves un alza o una elevación en el gráfico que corresponda al valor uso de CPU de una instancia de Compute Engine, probablemente se deba a una o más consultas costosas. Luego, puedes profundizar en el proceso de depuración identificando un búsqueda o etiqueta de solicitud potencialmente problemáticas.
Identifica una búsqueda o etiqueta de solicitud potencialmente problemática
Para identificar una etiqueta de solicitud o búsqueda potencialmente problemática, observa TopN a la sección de consultas:
Aquí vemos que la consulta con FPRINT 6815864236081503267
tiene una capacidad de CPU
su uso
y podrían ser problemáticos.
La tabla Consultas TopN proporciona una descripción general de las consultas que usan más CPU durante el período elegido, ordenadas de mayor a menor. La cantidad de consultas TopN se limita a 100.
Para los gráficos, recuperamos los datos de la tabla de estadísticas de consultas de TopN, que tiene tres niveles de detalle diferentes: 1 min, 10 min y 1 hora. El valor de cada dato en los gráficos representa el valor promedio durante un intervalo de un minuto.
Como práctica recomendada, puedes agregar etiquetas a tus consultas en SQL. El etiquetado de consultas te ayuda a encontrar problemas en construcciones de nivel superior, como con el la lógica empresarial o un microservicio.
En la tabla, se muestran las siguientes propiedades:
- FPRINT: Es el hash de la etiqueta de solicitud, si está presente. De lo contrario, es el hash de la consulta.
Etiqueta de consulta o solicitud: si la consulta tiene una etiqueta asociada, el Se muestra la etiqueta de solicitud. Las estadísticas de varias consultas que tienen la misma cadena de etiquetas se agrupan en una sola fila con el valor
REQUEST_TAG
que coincide con la cadena de etiquetas. Para obtener más información sobre el uso de etiquetas de solicitud, consulta Solución de problemas con etiquetas de solicitud y de transacción.Si la consulta no tiene una etiqueta asociada, la consulta en SQL se trunca a aproximadamente 64 KB. En el caso de la DML por lotes, las instrucciones de SQL se unen en una sola fila y se concatenan con un delimitador de punto y coma. Los textos de SQL idénticos consecutivos se eliminan antes de truncarlos.
Tipo de consulta: Indica si una consulta es
PARTITIONED_QUERY
oQUERY
. UnPARTITIONED_QUERY
es una consulta con unpartitionToken
obtenido de la API de PartitionQuery. Todas las demás consultas y declaraciones DML se indican con la consultaQUERY
. el tipo de letra.Uso de CPU: consumo de recursos de CPU por consulta, como porcentaje de el total de recursos de CPU usados por todas las consultas que se ejecutaron en las bases de datos en ese intervalo de tiempo, que se muestra en una barra horizontal que tiene un rango de 0 a 100.
CPU (%): consumo de recursos de CPU por consulta, como un porcentaje de la recursos de CPU totales usados por todas las consultas que se ejecutan en las bases de datos de esa durante un intervalo de tiempo.
Recuento de ejecuciones: Cantidad de veces que Spanner hizo la consulta. durante el intervalo.
Latencia promedio (ms): Duración promedio de tiempo, en microsegundos, para cada consulta. ejecución dentro de la base de datos. Este promedio excluye la codificación y de transmisión del conjunto de resultados, así como la sobrecarga.
Promedio de filas analizadas: Es la cantidad promedio de filas que analizó la consulta, sin incluir los valores borrados.
Promedio de filas mostradas: Es la cantidad promedio de filas que mostró la consulta.
Bytes devueltos: Cantidad de bytes de datos que mostró la consulta, sin incluir la sobrecarga de codificación de transmisión.
Posible variación entre los gráficos
Es posible que notes alguna variación entre el gráfico Uso total de CPU (todas las consultas) y el gráfico Uso total de CPU (por etiqueta de consulta o solicitud). Hay dos cosas que podría conducir a esta situación:
Diferentes fuentes de datos: Los datos de Cloud Monitoring, que alimentan las El gráfico de Uso total de CPU (todas las consultas) suele ser más preciso porque se envía cada minuto y tiene un período de retención de 45 días. Del otro los datos de la tabla del sistema, que alimentan el uso total de CPU (por consulta o Etiqueta de solicitud) podría tener un promedio de 10 min (o 1 hora), en cuyo caso es posible que perdemos los datos de alto nivel de detalle que vemos en la sección Uso total de CPU (todas las consultas).
Diferentes períodos de agregación: Ambos gráficos tienen diferentes períodos de agregación. Por ejemplo, cuando inspeccionamos un evento de más de 6 horas, consultamos la tabla
SPANNER_SYS.QUERY_STATS_TOTAL_10MINUTE
. En este caso, un un evento que ocurra a las 10:01 se sumará en más de 10 minutos y se presente en la tabla del sistema correspondiente a la marca de tiempo 10:10.
En la siguiente captura de pantalla, se muestra un ejemplo de esa variación.
Cómo analizar una etiqueta de consulta o solicitud específica
Para determinar si una consulta o etiqueta de solicitud es la causa raíz del problema, haz clic en la consulta o etiqueta de solicitud que parece que tiene la carga más alta o tarda más tiempo que las otras. Puedes seleccionar varias consultas y solicitar etiquetas a la vez.
Puedes mantener el puntero del mouse sobre el gráfico de las consultas en el cronograma para conocer su uso de CPU (en segundos).
Revisa la siguiente información para tratar de reducir el problema:
- ¿Cuánto tiempo ha estado alta la carga? ¿Es solo alta ahora? ¿Ha estado alta por mucho tiempo? Cambia los intervalos de tiempo para buscar la fecha y la hora en las que la consulta comenzó a tener un rendimiento deficiente.
- ¿Hubo aumentos repentinos en el uso de CPU? Puedes cambiar el período a y estudiar el uso de CPU histórico de la consulta.
- ¿Cuál es el consumo de recursos? ¿Qué relación tiene con otras consultas? Observa la tabla y compara los datos de otras consultas con la seleccionada. ¿Hay alguna diferencia importante?
Para confirmar que la consulta seleccionada contribuye al alto uso de la CPU, puedes desglosar los detalles de la forma de consulta específica (o etiqueta de solicitud) y analizarla en la página Detalles de la consulta.
Consulta la página Detalles de la consulta
Para ver los detalles de una forma de consulta o etiqueta de solicitud específica en un gráfico haz clic en el FPRINT asociado con la consulta o etiqueta de solicitud. Se abrirá la página Detalles de la consulta.
En la página Detalles de la consulta, se muestra la siguiente información:
- Texto de los detalles de la consulta: Texto de la consulta en SQL, truncado a aproximadamente 64 KB. Las estadísticas de las consultas múltiples que tienen la misma cadena de etiqueta se agrupan en una sola fila con REQUEST_TAG que coincida con esa cadena de etiqueta. Solo el texto de una de esas consultas se muestra en este campo. En el caso de la DML por lotes, el conjunto de instrucciones SQL se aplana en una sola fila y se concatena con un delimitador de punto y coma. Se anulan los duplicados de textos SQL idénticos consecutivos antes de truncando.
- Los valores de los siguientes campos:
- Recuento de ejecuciones: Cantidad de veces que Spanner vio la consulta durante el intervalo.
- Duración CPU (ms): Consumo promedio de recursos de CPU, en milisegundos, por parte de un de los recursos de CPU de la instancia en un intervalo de tiempo.
- Duración Latencia (ms): Duración promedio de tiempo, en milisegundos, para cada la ejecución de consultas en la base de datos. Este promedio excluye la codificación y el tiempo de transmisión para el conjunto de resultados y la sobrecarga.
- Promedio de filas mostradas: Es la cantidad promedio de filas que mostró la consulta.
- Promedio de filas analizadas: Es la cantidad promedio de filas que analizó la consulta, sin incluir los valores borrados.
- Prom. bytes: Cantidad de bytes de datos que mostró la consulta, sin incluir la sobrecarga de codificación de transmisión.
- Gráfico de muestras de planes de consultas: Cada punto del gráfico representa un plan de consultas muestreado en un momento específico y su latencia de consulta específica. Haz clic en uno de los puntos en el gráfico para ver el plan de consultas y los pasos dados durante la ejecución de la consulta. Nota: Los planes de consulta no son compatibles con las consultas que tienen partitionTokens obtenidos de la API de PartitionQuery y las consultas de DML particionado.
- Visualizador del plan de consultas: Muestra el plan de consultas de muestra seleccionado. Cada nodo o tarjeta del gráfico representa un iterador que consume filas de sus entradas y produce filas para su elemento superior. Puedes hacer clic en cada iterador para obtener información expandida.
- Gráfico de latencia de la consulta: Muestra el valor de la latencia de la consulta para una consulta seleccionada durante un período. También muestra la latencia promedio.
- Gráfico de uso de CPU: Muestra el uso de CPU por una consulta, en porcentaje, durante un período. También muestra el uso promedio de la CPU.
- Cantidad de ejecuciones o gráfico de errores: Muestra la cantidad de ejecuciones de una consulta durante un período y la cantidad de veces que falló la ejecución de la consulta.
- Gráfico de filas analizadas: Muestra la cantidad de filas que que la consulta analizó durante un período.
- Gráfico de filas mostradas: Muestra la cantidad de filas que mostró la consulta durante un período.
- Filtro de intervalo de tiempo: Filtra los detalles de las consultas por intervalos de tiempo, como hora, día o un intervalo personalizado.
Para los gráficos, recuperamos los datos de la tabla de estadísticas de consultas TopN, que tiene tres niveles de detalle diferentes: 1 min, 10 min y 1 hora. El valor de cada dato en los gráficos representa el valor promedio durante un intervalo de un minuto.
Busca todas las ejecuciones de una consulta en el registro de auditoría
Para buscar todas las ejecuciones de una huella digital de consulta en
Cloud Audit Logs,
consulta el registro de auditoría y busca cualquier
query_fingerprint
que coincida con el campo FPRINT
en la tabla de estadísticas de la consulta TopN. Para obtener más información, consulta la Descripción general de consultas y visualización de registros. Usa este método para identificar al usuario que inició la consulta.