Ajusta una consulta con el visualizador del plan de consultas

El visualizador del plan de consultas te permite comprender con rapidez la estructura del plan de consultas que eligió Spanner para evaluar una consulta. En esta guía, se describe cómo puedes usar un plan de consultas para comprender la ejecución de tus consultas.

Antes de comenzar

Para familiarizarte con las partes de la interfaz de usuario de la consola de Google Cloud que se mencionan en esta guía, lee lo siguiente:

Ejecuta una consulta en la consola de Google Cloud

  1. Ve a la página Instancias de Spanner en la consola de Google Cloud.

    Ir a la página Instancias

  2. Selecciona el nombre de la instancia que contiene la base de datos que deseas consultar.

    La consola de Google Cloud muestra la página Descripción general de la instancia.

  3. Selecciona el nombre de la base de datos que deseas consultar.

    La consola de Google Cloud muestra la página Descripción general de la base de datos.

  4. En el menú lateral, haz clic en Spanner Studio.

    La consola de Google Cloud muestra la página Spanner Studio de la base de datos.

  5. Ingresa la consulta en SQL en el panel del editor.
  6. Haz clic en Ejecutar.

    Spanner ejecuta la consulta.

  7. Haz clic en la pestaña Explicación para ver la visualización del plan de consulta.

Un recorrido por el Editor de consultas

En la página de Spanner Studio, se proporcionan pestañas de consulta que te permiten escribir o pegar consulta en SQL y declaraciones DML, ejecutarlas en tu base de datos y ver sus resultados y planes de ejecución de consultas. Los componentes clave de la página Spanner Studio están numerados en la siguiente captura de pantalla.

Página de consultas anotadas
Figura 7. Página Consulta anotada.
  1. En la barra de pestañas, se muestran las pestañas de consultas que tienes abiertas. Para crear una pestaña nueva, haz clic en Nueva pestaña.

    La barra de pestañas también proporciona una lista de Plantillas de consulta puedes usar la información para pegar consultas que proporcionen estadísticas sobre consultas de bases de datos, transacciones, lecturas y mucho más, como se describe en Descripción general de las herramientas de introspección.

  2. La barra de comandos del editor proporciona las siguientes opciones:
    • El comando Ejecutar ejecuta las instrucciones ingresadas en el panel de edición, lo que genera resultados de consultas en la pestaña Resultados y planes de ejecución de consultas en la pestaña Explicación. Cambia el comportamiento predeterminado en el menú desplegable para generar Solo resultados o Solo explicación.

      Cuando se destaca algo en el editor, se cambia el comando Run a Run selected, lo que te permite ejecutar solo lo que seleccionaste.

    • El comando Clear query borra todo el texto del editor y las pestañas secundarias Resultados y Explicación.
    • El comando Formatear consulta formatea las declaraciones en el editor para que sean más fáciles de leer.
    • El comando Combinaciones de teclas muestra el conjunto de combinaciones de teclas que puedes usar en el editor.
    • El vínculo Ayuda de consulta de SQL abre una pestaña del navegador que dirige a la documentación sobre la sintaxis de las consulta en SQL.

    Las consultas se validan automáticamente cada vez que se actualizan en el editor. Si las sentencias son válidas, la barra de comandos del editor mostrará una marca de verificación de confirmación y el mensaje Valid. Si hay algún problema, se mostrará un mensaje de error con los detalles.

  3. En el editor, puedes ingresar una consulta en SQL y las declaraciones DML. Están codificados por colores y los números de línea se agregan automáticamente para las declaraciones de varias líneas.

    Si ingresas más de una declaración en el editor, debes usar un punto y coma final después de cada instrucción, excepto la última.

  4. El panel inferior de la pestaña de consulta proporciona tres pestañas secundarias:
    • En la pestaña secundaria Esquema, se muestran las tablas en la base de datos y sus esquemas. Úsalo como una referencia rápida cuando redactes declaraciones en el editor.
    • En la pestaña secundaria Resultados, se muestran los resultados cuando ejecutas las instrucciones en el editor. Para las consultas, muestra una tabla de resultados y, para las declaraciones DML, como INSERT y >UPDATE, muestra un mensaje sobre cuántas filas se vieron afectadas.
    • En la pestaña secundaria Explicación, se muestran gráficos visuales de los planes de consulta creados cuando ejecutas las instrucciones en el editor.
  5. Las pestañas secundarias Resultados y Explicación proporcionan un selector de declaraciones que usas para elegir los resultados o el plan de consulta de la declaración que deseas.

Ver planes de consultas de muestra

    En algunos casos, es posible que desees ver los planes de consultas de muestra y comparar el rendimiento de una consulta a lo largo del tiempo. Para las consultas que consumen más CPU, Spanner conserva los planes de consulta de muestra durante 30 días en la página Estadísticas de consultas de la consola de Google Cloud. Sigue estos pasos para ver los planes de consultas de muestra:

  1. Ve a la página Instancias de Spanner en la consola de Google Cloud.

    Ir a la página Instancias

  2. Haz clic en el nombre de la instancia con las consultas que quieres investigar.

    La consola de Google Cloud muestra la página Descripción general de la instancia.

  3. En el menú Navegación y debajo del encabezado Observabilidad, haz clic en Estadísticas de consultas.

    La consola de Google Cloud muestra la página Estadísticas de consultas de la instancia.

  4. En el menú desplegable Base de datos, selecciona la base de datos con las consultas que quieres investigar.

    La consola de Google Cloud muestra la información de carga de consultas de la base de datos. En la tabla Consultas y etiquetas de TopN, se muestra la lista de las principales consultas y etiquetas de solicitud ordenadas por uso de CPU.

  5. Busca la consulta con un uso de CPU elevado en el que quieres ver los planes de consulta de muestra. Haz clic en el valor FPRINT de esa consulta.

    En la página Detalles de la consulta, se muestra un gráfico de muestras de planes de consulta para tu consulta a lo largo del tiempo. Puedes alejar la imagen hasta un máximo de siete días antes de la hora actual. Nota: Los planes de consulta no son compatibles con las consultas con PartitionTokens obtenidos de la API de PartitionQuery y las consultas de DML particionado.

  6. Haz clic en uno de los puntos del gráfico para ver un plan de consultas anterior y visualizar los pasos realizados durante la ejecución de la consulta. También puedes hacer clic en cualquier operador para ver información expandida sobre él.

    Gráfico de muestras del plan de consultas.
    Figure 8. Gráfico de muestras del plan de consultas.

Haz un recorrido por el visualizador del plan de consultas

Los componentes clave del visualizador se anotan en la siguiente captura de pantalla y se describen con más detalle. Después de ejecutar una consulta en una pestaña de consultas, selecciona la pestaña EXPLICACIÓN debajo del editor de consultas para abrir el visualizador del plan de ejecución de consultas.

El flujo de datos del siguiente diagrama es ascendente, es decir, todos los índices y tablas se encuentran en la parte inferior del diagrama y el resultado final, en la parte superior.

Visualizador del plan de consultas anotadas
Figura 9: Visualizador del plan de consultas anotadas.
  • La visualización de tu plan puede ser grande, según la consulta que hayas ejecutado. Para ocultar y mostrar los detalles, activa el selector de vista EXPANDED/COMPACT. Puedes usar el control de zoom para personalizar cuánto del plan ves a la vez.
  • El álgebra que explica cómo Spanner ejecuta la consulta se dibuja como un grafo acíclico, en el que cada nodo corresponde a un iterador que consume filas de sus entradas y produce filas en su superior. En la figura 9, se muestra un plan de ejemplo. Haz clic en el diagrama para consultar una vista expandida de algunos de los detalles del plan.

    Miniatura de la captura de pantalla del plan visual
    Figura 9: Plan visual de muestra (haz clic para acercar).
    Captura de pantalla con acercamiento del plan visual

    Cada nodo, o tarjeta, del gráfico representa un iterador y contiene la siguiente información:

    • El nombre del iterador. Un iterador consume filas de su entrada y produce filas.
    • Estadísticas del entorno de ejecución que te indican cuántas filas se mostraron, cuál era la latencia y cuánta CPU se consumió.
    • Proporcionamos los siguientes indicadores visuales para ayudarte a identificar problemas potenciales dentro del plan de ejecución de consultas.
    • Las barras rojas en un nodo son indicadores visuales del porcentaje de latencia o de tiempo de CPU de este iterador en comparación con el total de la consulta.
    • El grosor de las líneas que conectan cada nodo representa el recuento de filas. Cuanto más gruesa sea la línea, mayor será la cantidad de filas que se pasan al siguiente nodo. El número real de filas se muestra en cada tarjeta y cuando mantienes el puntero sobre un conector.
    • Se muestra un triángulo de advertencia en un nodo en el que se realizó un análisis completo de la tabla. En el panel de información, puedes incluir recomendaciones como agregar un índice o revisar la consulta o el esquema de otras maneras, si es posible, para evitar un análisis completo.
    • Selecciona una tarjeta del plan para ver los detalles en el panel de información de la derecha (5).

  • El minimapa del plan de ejecución muestra una vista alejada del plan completo y es útil para determinar la forma general del plan de ejecución y navegar rápidamente a las diferentes partes del plan. Arrastra directamente el minimapa o haz clic donde te gustaría enfocar para ir a otra parte del plan visual.
  • Selecciona DESCARGAR JSON para descargar una versión JSON del plan de ejecución, lo cual es útil cuando te comunicas con el equipo de Spanner para obtener asistencia.
  • En el panel de información, se muestra información contextual detallada sobre el nodo seleccionado en el diagrama del plan de consultas. La información se organiza en las siguientes categorías.
    • La información del iterador proporciona detalles, así como estadísticas del tiempo de ejecución, para la tarjeta del iterador que seleccionaste en el gráfico.
    • En Resumen de la consulta, se proporcionan detalles sobre la cantidad de filas que se muestran y el tiempo que se tardó en ejecutar la consulta. Los operadores destacados son aquellos que exhiben una latencia significativa, consumen una cantidad significativa de CPU en relación con otros operadores y muestran una cantidad significativa de filas de datos.
    • El cronograma de ejecución de consultas es un grafo basado en el tiempo que muestra por cuánto tiempo cada grupo de máquinas ejecutó su parte de la consulta. Es posible que un grupo de máquinas no esté en ejecución por completo el tiempo de ejecución de la consulta. También es posible que un grupo de máquinas se haya ejecutado varias veces durante la ejecución de la consulta, pero el cronograma solo representa el inicio de la primera vez que se ejecutó y el final de la última vez que se ejecutó.
  • Ajusta una consulta que muestra un rendimiento deficiente

    Imagina que tu empresa ejecuta una base de datos de películas en línea que contiene información sobre películas, como elenco, empresas de producción, detalles de películas, etcétera. El servicio se ejecuta en Spanner, pero experimenta algunos problemas de rendimiento últimamente.

    Como desarrollador principal del servicio, se te solicita que investigues estos problemas de rendimiento, ya que generan calificaciones deficientes para el servicio. Abre la consola de Google Cloud, ve a tu instancia de base de datos y, luego, abre el Editor de consultas. Ingresa la siguiente consulta en el editor y ejecútala.

    SELECT
      t.title,
      MIN(t.production_year) AS year,
      ANY_VALUE(mc.note HAVING MIN t.production_year) AS note
    FROM
      title AS t
    JOIN
      movie_companies AS mc
    ON
      t.id = mc.movie_id
    WHERE
      t.title LIKE '% the %'
    GROUP BY
      title;
    

    El resultado de ejecutar esta consulta se muestra en la siguiente captura de pantalla. Seleccionamos FORMAT QUERY para formatear la consulta en el editor. También hay una nota en la parte superior derecha de la pantalla que indica que la consulta es válida.

    El editor de consultas muestra la consulta original
    Figure 1. El editor de consultas en el que se muestra la consulta original.

    En la pestaña RESULTADOS debajo del editor de consultas, se muestra que la consulta se completó en poco más de dos minutos. Decides mirar más de cerca la consulta para ver si es eficiente.

    Analiza una consulta lenta con el visualizador del plan de consultas

    En este punto, sabemos que la consulta del paso anterior tarda más de dos minutos, pero no sabemos si es lo más eficiente posible y, por lo tanto, si esta duración es la esperada.

    Selecciona la pestaña EXPLICACIÓN (EXPLANATION) justo debajo del editor de consultas para ver una representación visual del plan de ejecución que creó Spanner para ejecutar la consulta y mostrar resultados.

    El plan que se muestra en la siguiente captura de pantalla es relativamente grande, pero, incluso con este nivel de zoom, puedes realizar las siguientes observaciones.

    • Con base en el Resumen de consultas en el panel de información de la derecha, descubrimos que se analizaron casi 3 millones de filas y, al final, se mostraron menos de 64,000.

    • En el panel Cronograma de ejecución de consultas, también podemos ver que 4 grupos de máquinas participaron en la consulta. Un grupo de máquinas es responsable de ejecutar una parte de la consulta. Los operadores pueden ejecutarse en una o más máquinas. La selección de un grupo de máquinas en el cronograma destaca en el plan visual qué parte de la consulta se ejecutó en ese grupo.

    Visualizador del plan de consultas en el que se muestra una explicación visual de la consulta original
    Figura 2: Visualizador del plan de consultas que muestra el plan visual de la consulta original.

    Debido a estos factores, decides que es posible mejorar el rendimiento si cambias la unión de una unión de aplicación, que Spanner eligió de forma predeterminada, a una unión hash.

    Mejora la consulta

    Para mejorar el rendimiento de la consulta, usa una sugerencia de unión para cambiar el método de unión a una unión hash. Esta implementación de unión ejecuta el procesamiento basado en conjuntos.

    Esta es la consulta actualizada:

    SELECT
      t.title,
      MIN(t.production_year) AS year,
      ANY_VALUE(mc.note HAVING MIN t.production_year) AS note
    FROM
      title AS t
    JOIN
      @{join_method=hash_join} movie_companies AS mc
    ON
      t.id = mc.movie_id
    WHERE
      t.title LIKE '% the %'
    GROUP BY
      title;
    

    En la siguiente captura de pantalla, se muestra la consulta actualizada. Como se muestra en la captura de pantalla, la consulta se completó en menos de 5 segundos, una mejora significativa en el tiempo de ejecución de 120 segundos antes de este cambio.

    Editor de consultas que muestra consultas mejoradas
    Figura 3: Editor de consultas en el que se muestra la consulta mejorada.

    Examina el nuevo plan visual, que se muestra en el siguiente diagrama, para ver qué nos dice sobre esta mejora.

    Visualización de consultas en la IU de la consola de Cloud
    Figura 4: Visualización del plan de consultas después de las mejoras de la consulta (haz clic para acercar).

    Captura de pantalla con acercamiento del plan visual

    De inmediato, notarás algunas diferencias:

    • Solo un grupo de máquinas estuvo involucrado en la ejecución de esta consulta.

    • La cantidad de agregaciones se redujo drásticamente.

    Conclusión

    En esta situación, ejecutamos una consulta lenta y analizamos su plan visual para detectar ineficiencias. A continuación, se presenta un resumen de las consultas y los planes antes y después de que se realizaran cambios. Cada pestaña muestra la consulta que se ejecutó y una vista compacta de la visualización completa del plan de ejecución de consultas.

    Antes

    SELECT
      t.title,
      MIN(t.production_year) AS year,
      ANY_VALUE(mc.note
      HAVING
        MIN t.production_year) AS note
    FROM
      title AS t
    JOIN
      movie_companies AS mc
    ON
      t.id = mc.movie_id
    WHERE
      t.title LIKE '% the %'
    GROUP BY
      title;
    
    Vista compacta del plan visual antes de las mejoras.
    Figura 5: Vista compacta del plan visual antes de las mejoras.

    Después

    SELECT
      t.title,
      MIN(t.production_year) AS year,
      ANY_VALUE(mc.note
      HAVING
        MIN t.production_year) AS note
    FROM
      title AS t
    JOIN
      @{join_method=hash_join} movie_companies AS mc
    ON
      t.id = mc.movie_id
    WHERE
      t.title LIKE '% the %'
    GROUP BY
      title;
    
    Vista compacta del plan visual después de las mejoras.
    Figura 6: Vista compacta del plan visual después de las mejoras.

    Un indicador de que se podría mejorar en esta situación es que una gran proporción de las filas del title de la tabla calificó el filtro LIKE '% the %'. Buscar en otra tabla con tantas filas puede ser costoso. Cambiar nuestra implementación de unión a una unión hash mejoró significativamente el rendimiento.

    ¿Qué sigue?