Cómo analizar el rendimiento de las consultas

En esta página, se describe cómo usar el panel de Estadísticas de consultas para detectar y analizar problemas de rendimiento de Spanner.

Descripción general de las estadísticas de consultas

Las estadísticas de consultas te ayudan a detectar y diagnosticar problemas de rendimiento de las consultas y las declaraciones DML (INSERT, UPDATE y DELETE) para una base de datos de Spanner. Admite la supervisión intuitiva y proporciona información de diagnóstico que te ayuda a ir más allá de la detección para identificar la causa raíz de los problemas de rendimiento.

Las estadísticas de consultas te ayudan a mejorar el rendimiento de las consultas de Spanner a través de los siguientes pasos:

  1. Determina si las consultas ineficientes están causando un uso de CPU elevado.
  2. Identifica una búsqueda o etiqueta que podría ser problemática.
  3. Analiza la búsqueda o la etiqueta de solicitud para identificar problemas.

Las estadísticas de consultas están disponibles en configuraciones regionales y multirregionales.

Precios

No hay costos adicionales por usar Estadísticas de consultas.

Retención de datos

Las estadísticas de la búsqueda retienen los datos durante un máximo de 30 días. En el gráfico Uso total de CPU (por etiqueta de consulta o solicitud), Spanner recupera datos de las tablas SPANNER_SYS.QUERY_STATS_TOP_*. Estas tablas tienen un período de retención máximo de 30 días. Consulta Retención de datos para obtener más información.

Roles obligatorios

Necesitas diferentes roles y permisos de IAM según si eres un usuario de IAM o un usuario de control de acceso específico.

Usuario de Identity and Access Management (IAM)

Para obtener los permisos que necesitas para ver la página Estadísticas de las búsquedas, pídele a tu administrador que te otorgue los siguientes roles de IAM en la instancia:

Se requieren los siguientes permisos en el rol de lector de bases de datos de Cloud Spanner(roles/spanner.databaseReader) para ver la página de Query insights:

  • spanner.databases.beginReadOnlyTransaction
  • spanner.databases.select
  • spanner.sessions.create

Usuario con control de acceso detallado

Si eres usuario del control de acceso detallado, verifica lo siguiente:

  • Tener el rol de Visualizador de Cloud Spanner(roles/spanner.viewer)
  • Tener privilegios de control de acceso detallado y tener asignado el rol del sistema spanner_sys_reader o uno de sus roles miembros
  • Selecciona el rol de spanner_sys_reader o de miembro como tu rol actual del sistema en la página de descripción general de la base de datos.

Para obtener más información, consulta Información sobre el control de acceso detallado y Roles del sistema de control de acceso detallado.

El panel de estadísticas de consultas

En el panel de Estadísticas de consultas, se muestra la carga de consultas según la base de datos y el período que selecciones. La carga de consultas es una medición del uso total de CPU para todas las consultas en la instancia del intervalo de tiempo seleccionado. El panel proporciona una serie de filtros que te ayudan a ver la carga de consultas.

Para ver el panel de Estadísticas de consultas de una base de datos, haz lo siguiente:

  1. Selecciona Estadísticas de consultas en el panel de navegación izquierdo. Se abrirá el panel de Estadísticas de consultas.
  2. Selecciona una base de datos de la lista Bases de datos. El panel muestra la información de carga de consultas de la base de datos.

Las áreas del panel incluyen:

  1. Lista de bases de datos: Filtra la carga de consultas en una base de datos específica o en todas las bases de datos.
  2. Filtro de intervalo de tiempo: Filtra la carga de consultas por intervalos de tiempo, como horas, días o un intervalo personalizado.
  3. Gráfico de uso total de CPU (todas las consultas): Muestra la carga agregada de todas las consultas.
  4. Gráfico de uso de CPU total (por etiqueta de consulta o solicitud): Muestra el uso de CPU por cada etiqueta de consulta o solicitud.
  5. Tabla de consultas y etiquetas de TopN: Muestra la lista de las principales consultas y etiquetas de solicitud ordenadas por uso de CPU. Consulta Cómo identificar una búsqueda o etiqueta que podría ser problemática.

Panel de estadísticas de consultas

Rendimiento del panel

Usa parámetros de búsqueda o etiqueta tus búsquedas para optimizar el rendimiento de las Estadísticas de consultas. Si no parametrizas ni etiquetas tus consultas, es posible que se muestren demasiados resultados, lo que podría provocar que la tabla de consultas y etiquetas TopN no se cargue correctamente.

Confirma si las consultas ineficientes son responsables del uso alto de CPU

El uso total de CPU es una medida del trabajo (en segundos de CPU) que realizan con el tiempo las consultas ejecutadas en la base de datos seleccionada.

Uso total de CPU para todas las consultas

Revisa el gráfico para explorar estas preguntas:

  • ¿Qué base de datos experimenta la carga? Selecciona bases de datos diferentes en la lista Bases de datos para encontrar las bases de datos con las cargas más altas. Para saber qué base de datos tiene la carga más alta, también puedes revisar el gráfico Uso de CPU: Total de las bases de datos en la consola deGoogle Cloud .

    Cargar base de datos

  • ¿El uso de CPU es alto? ¿El grafo aumenta o se incrementa con el tiempo? Si no ves un uso de CPU alto, el problema no está en tus consultas.

  • ¿Cuánto tiempo ha sido alto el uso de CPU? ¿Aumentó recientemente o se ha mantenido alto durante un tiempo? Usa el selector de intervalo de tiempo para seleccionar varios períodos y averiguar cuánto tiempo ha durado el problema. Acerca la vista para ver un período en el que se observan los aumentos repentinos de la carga de consultas. Aléjate para ver hasta una semana del cronograma.

Si ves un aumento repentino o una elevación en el gráfico correspondiente al uso general de la CPU de la instancia, es muy probable que se deba a una o más consultas costosas. A continuación, puedes profundizar en el proceso de depuración identificando una etiqueta de solicitud o consulta potencialmente problemática.

Identifica una búsqueda o etiqueta de solicitud que podría ser problemática

Para identificar una consulta o etiqueta de solicitud que podría ser problemática, observa la sección TopN queries:

Consultas de TopN

Aquí vemos que la consulta con la huella digital 3216067328234137024 tiene un uso de CPU alto y puede ser problemática.

La tabla TopN queries proporciona una descripción general de las consultas que usan la mayor cantidad de CPU durante el período elegido, ordenadas de mayor a menor. La cantidad de consultas TopN se limita a 100.

Para los gráficos, recuperamos los datos de la tabla de estadísticas de consultas de TopN, que tiene tres granularidades diferentes: 1 min, 10 min y 1 hora. El valor de cada punto de datos en los gráficos representa el valor promedio durante un intervalo de un minuto.

Te recomendamos que agregues etiquetas a tus consultas de SQL. El etiquetado de consultas te ayuda a encontrar problemas en construcciones de nivel superior, como la lógica empresarial o un microservicio.

Tabla de consultas de TopN

En la tabla, se muestran las siguientes propiedades:

  • Huella digital: Hash de la etiqueta de la solicitud, si está presente; de lo contrario, es el hash de la búsqueda.
  • Etiqueta de consulta o solicitud: Si la búsqueda tiene una etiqueta asociada, se muestra la etiqueta de solicitud. Las estadísticas de varias búsquedas que tienen la misma cadena de etiquetas se agrupan en una sola fila con el valor de REQUEST_TAG que coincide con la cadena de etiquetas. Para obtener más información sobre el uso de etiquetas de solicitud, consulta Solución de problemas con etiquetas de solicitud y etiquetas de transacción.

    Si la consulta no tiene una etiqueta asociada, se muestra la consulta en SQL, truncada a aproximadamente 64 KB. En el caso del DML por lotes, las instrucciones SQL se aplanan en una sola fila y se concatenan con un punto y coma como delimitador. Los textos de SQL idénticos consecutivos se eliminan antes de truncarse.

  • Tipo de búsqueda: Indica si una búsqueda es de tipo PARTITIONED_QUERY o QUERY. Un PARTITIONED_QUERY es una consulta con un partitionToken obtenido de la API de PartitionQuery. Todas las demás consultas y sentencias DML se indican con el tipo de consulta QUERY.

  • Uso de CPU: Es el consumo de recursos de CPU por parte de una consulta, expresado como un porcentaje de los recursos de CPU totales que usan todas las consultas que se ejecutan en las bases de datos en ese intervalo de tiempo. Se muestra en una barra horizontal que tiene un rango de 0 a 100.

  • Recomendación: Spanner analiza tus consultas para determinar si pueden beneficiarse de índices mejorados. Si es así, recomienda índices nuevos o modificados que pueden mejorar el rendimiento de la consulta. Para obtener más información, consulta Usa el asesor de índices de Spanner.

  • CPU (%): Consumo de recursos de CPU por parte de una consulta, como porcentaje de los recursos de CPU totales que usan todas las consultas que se ejecutan en las bases de datos en ese intervalo de tiempo.

  • Recuento de ejecuciones: Cantidad de veces que Spanner vio la consulta durante el intervalo.

  • Latencia promedio (ms): Es la duración promedio, en microsegundos, de cada ejecución de consulta en la base de datos. Este promedio excluye la codificación y el tiempo de transmisión del conjunto de resultados, así como la sobrecarga.

  • Promedio de filas analizadas: Es la cantidad promedio de filas que analizó la consulta, sin incluir los valores borrados.

  • Promedio de filas mostradas: Es la cantidad promedio de filas que mostró la consulta.

  • Bytes devueltos: Es la cantidad de bytes de datos que devolvió la consulta, sin incluir la sobrecarga de codificación de transmisión.

Posible variación entre los gráficos

Es posible que notes alguna variación entre el gráfico de Uso total de CPU (todas las consultas) y el gráfico de Uso total de CPU (por etiqueta de consulta o solicitud). Hay dos cosas que podrían llevar a esta situación:

  • Diferentes fuentes de datos: Los datos de Cloud Monitoring, que alimentan el gráfico de utilización total de la CPU (todas las consultas), suelen ser más precisos porque se envían cada minuto y tienen un período de retención de 45 días. Por otro lado, los datos de la tabla del sistema, que alimentan el gráfico de uso de CPU total (por etiqueta de consulta o solicitud), se pueden promediar durante 10 minutos (o 1 hora), en cuyo caso podríamos perder datos de alta granularidad que vemos en el gráfico de uso de CPU total (todas las consultas).

  • Diferentes períodos de agregación: Ambos gráficos tienen diferentes períodos de agregación. Por ejemplo, cuando inspeccionamos un evento de más de 6 horas, consultamos la tabla SPANNER_SYS.QUERY_STATS_TOTAL_10MINUTE. En este caso, un evento que ocurre a las 10:01 se agregaría durante 10 minutos y estaría presente en la tabla del sistema correspondiente a la marca de tiempo de las 10:10.

En la siguiente captura de pantalla, se muestra un ejemplo de esta varianza.

Varianza entre gráficos

Analiza una etiqueta de consulta o solicitud específica

Para determinar si una consulta o una etiqueta de solicitud es la causa raíz del problema, haz clic en la consulta o la etiqueta de solicitud que parezca tener la carga más alta o que tarde más tiempo que las otras. Puedes seleccionar varias búsquedas y etiquetas de solicitud a la vez.

Puedes mantener el puntero del mouse sobre el gráfico de las consultas a lo largo del cronograma para conocer su uso de CPU (en segundos).

Revisa la siguiente información para tratar de reducir el problema:

  • ¿Cuánto tiempo ha estado alta la carga? ¿Es solo alta ahora? ¿Ha estado alta por mucho tiempo? Cambia los intervalos de tiempo para encontrar la fecha y la hora en que la búsqueda comenzó a tener un rendimiento deficiente.
  • ¿Hubo aumentos repentinos en el uso de CPU? Puedes cambiar el período para estudiar el uso histórico de la CPU de la búsqueda.
  • ¿Cuál es el consumo de recursos? ¿Qué relación tiene con otras búsquedas? Observa la tabla y compara los datos de otras búsquedas con la seleccionada. ¿Hay una diferencia importante?

Para confirmar que la consulta seleccionada contribuye al uso elevado de la CPU, puedes profundizar en los detalles de la forma de consulta específica (o etiqueta de solicitud) y analizarla más a fondo en la página Detalles de la consulta.

Cómo ver la página Detalles de la consulta

Para ver los detalles de una forma de consulta o etiqueta de solicitud específica en formato gráfico, haz clic en la huella digital asociada a la consulta o etiqueta de solicitud. Se abrirá la página Detalles de la consulta.

Página de detalles de la búsqueda

En la página Detalles de la consulta, se muestra la siguiente información:

  1. Texto de detalles de la consulta: Texto de la consulta en SQL, truncado a aproximadamente 64 KB. Las estadísticas de varias búsquedas que tienen la misma cadena de etiquetas se agrupan en una sola fila con la etiqueta REQUEST_TAG que coincide con esa cadena de etiquetas. Solo el texto de una de esas búsquedas se muestra en este campo. En el caso del DML por lotes, el conjunto de instrucciones SQL se aplana en una sola fila, concatenada con un delimitador de punto y coma. Los textos de SQL idénticos consecutivos se anulan antes de truncarse.
  2. Los valores de los siguientes campos:
    • Recuento de ejecuciones: Cantidad de veces que Spanner vio la consulta durante el intervalo.
    • CPU prom. (ms): Es el consumo promedio de recursos de CPU, en milisegundos, por una consulta de los recursos de CPU de la instancia en un intervalo de tiempo.
    • Latencia prom. (ms): Es el tiempo promedio, en milisegundos, para cada ejecución de consulta dentro de la base de datos. Este promedio excluye la codificación y el tiempo de transmisión del conjunto de resultados y la sobrecarga.
    • Promedio de filas mostradas: Es la cantidad promedio de filas que mostró la consulta.
    • Promedio de filas analizadas: Es la cantidad promedio de filas que analizó la consulta, sin incluir los valores borrados.
    • Promedio de bytes: Es la cantidad de bytes de datos que mostró la consulta, sin incluir la sobrecarga de codificación de transmisión.
  3. Gráfico de muestras de planes de consultas: Cada punto del gráfico representa un plan de consultas muestreado en un momento específico y su latencia de consulta específica. Haz clic en uno de los puntos del gráfico para ver el plan de consulta y conocer los pasos que se realizaron durante la ejecución de la consulta. Nota: Los planes de consultas no son compatibles con las consultas que incluyen partitionTokens obtenidos de la API de PartitionQuery ni con las consultas de DML particionado.
  4. Visualizador del plan de consultas: Muestra el plan de consultas seleccionado para la muestra. Cada nodo o tarjeta del gráfico representa un iterador que consume filas de sus entradas y produce filas para su elemento superior. Puedes hacer clic en cada iterador para obtener información expandida.
  5. Gráfico de latencia de las consultas: Muestra el valor de la latencia de las consultas para una consulta seleccionada durante un período. También muestra la latencia promedio.
  6. Gráfico de uso de CPU: Muestra el uso de CPU de una consulta, en porcentaje, durante un período. También muestra el uso promedio de la CPU.
  7. Gráfico de recuento de ejecuciones/fallidas: Muestra el recuento de ejecuciones de una consulta durante un período y la cantidad de veces que falló la ejecución de la consulta.
  8. Gráfico de filas analizadas: Muestra la cantidad de filas que analizó la consulta durante un período.
  9. Gráfico de filas devueltas: Muestra la cantidad de filas que devolvió la consulta durante un período.
  10. Filtro de intervalo de tiempo: Filtra los detalles de la consulta por intervalos de tiempo, como hora, día o un intervalo personalizado.

Para los gráficos, recuperamos los datos de la tabla de estadísticas de consultas de TopN, que tiene tres granularidades diferentes: 1 min, 10 min y 1 hora. El valor de cada punto de datos en los gráficos representa el valor promedio durante un intervalo de un minuto.

Cómo buscar todas las ejecuciones de una consulta en el registro de auditoría

Para buscar todas las ejecuciones de una huella digital de consulta en particular en los Registros de auditoría de Cloud, consulta el registro de auditoría y busca cualquier query_fingerprint que coincida con el campo Fingerprint en la tabla de estadísticas de las consultas TopN. Para obtener más información, consulta la Descripción general de consultas y visualización de registros. Usa este método para identificar al usuario que inició la búsqueda.

¿Qué sigue?