Cómo ajustar una consulta con el visualizador del plan de consultas

El visualizador del plan de consultas te permite comprender rápidamente la estructura del plan de consultas que eligió Spanner para evaluar una consulta. En esta guía, se describe cómo puedes usar un plan de consulta para ayudarte a comprender la ejecución de tus consultas.

Antes de comenzar

Para familiarizarte con las partes de la interfaz de usuario de la consola de Google Cloud que se mencionan en esta guía, lee lo siguiente:

Ejecuta una consulta en la consola de Google Cloud

  1. Ve a la página Instancias de Spanner en la consola de Google Cloud .

    Ir a la página Instancias

  2. Selecciona el nombre de la instancia que contiene la base de datos que deseas consultar.

    La consola deGoogle Cloud muestra la página Descripción general de la instancia.

  3. Selecciona el nombre de la base de datos que deseas consultar.

    La consola deGoogle Cloud muestra la página Descripción general de la base de datos.

  4. En el menú lateral, haz clic en Spanner Studio.

    La consola deGoogle Cloud muestra la página Spanner Studio de la base de datos.

  5. Ingresa la consulta en SQL en el panel del editor.
  6. Haz clic en Ejecutar.

    Spanner ejecuta la consulta.

  7. Haz clic en la pestaña Explicación para ver la visualización del plan de consultas.

Visita guiada por el editor de consultas

La página de Spanner Studio proporciona pestañas de consulta que te permiten escribir o pegar instrucciones de DML y consultas de SQL, ejecutarlas en tu base de datos y ver sus resultados y planes de ejecución de consultas. Los componentes clave de la página de Spanner Studio se numeran en la siguiente captura de pantalla.

Página de consulta con anotaciones.
Figura 7. Página de consulta con anotaciones.
  1. En la barra de pestañas, se muestran las pestañas de búsqueda que tienes abiertas. Para crear una pestaña nueva, haz clic en Nueva pestaña.

    La barra de pestañas también proporciona una lista de Plantillas de consulta puedes usar la información para pegar consultas que proporcionen estadísticas sobre consultas de bases de datos, transacciones, lecturas y mucho más, como se describe en Descripción general de las herramientas de introspección.

  2. La barra de comandos del editor proporciona las siguientes opciones:
    • El comando Run ejecuta las instrucciones ingresadas en el panel de edición, lo que genera resultados de la consulta en la pestaña Results y planes de ejecución de consultas en la pestaña Explanation. Cambia el comportamiento predeterminado con el menú desplegable para generar Solo resultados o Solo explicación.

      Si destacas algo en el editor, el comando Run se cambia a Run selected, lo que te permite ejecutar solo lo que seleccionaste.

    • El comando Clear query borra todo el texto del editor y las subpestañas Results y Explanation.
    • El comando Formatear consulta formatea las declaraciones en el editor para que sean más fáciles de leer.
    • El comando Combinaciones de teclas muestra el conjunto de combinaciones de teclas que puedes usar en el editor.
    • El vínculo Ayuda de consulta de SQL abre una pestaña del navegador para mostrar la documentación sobre la sintaxis de las consulta en SQL.

    Las consultas se validan automáticamente cada vez que se actualizan en el editor. Si las instrucciones son válidas, la barra de comandos del editor mostrará una marca de verificación de confirmación y el mensaje Valid. Si hay algún problema, se mostrará un mensaje de error con los detalles.

  3. En el editor, ingresas las consulta en SQL y las instrucciones DML. Están codificados por colores y los números de línea se agregan automáticamente para las instrucciones de varias líneas.

    Si ingresas más de una sentencia en el editor, debes usar un punto y coma de terminación después de cada sentencia, excepto la última.

  4. El panel inferior de una pestaña de consulta proporciona tres subpestañas:
    • En la subpestaña Esquema, se muestran las tablas de la base de datos y sus esquemas. Úsala como referencia rápida cuando redactes sentencias en el editor.
    • La subpestaña Resultados muestra los resultados cuando ejecutas las instrucciones en el editor. Para las consultas, muestra una tabla de resultados y, para las sentencias DML, como INSERT y >UPDATE, muestra un mensaje sobre cuántas filas se vieron afectadas.
    • En la subpestaña Explicación, se muestran gráficos visuales de los planes de consulta creados cuando ejecutas las instrucciones en el editor.
  5. Las pestañas secundarias Resultados y Explicación proporcionan un selector de declaraciones que usas para elegir los resultados o el plan de consulta de la declaración que deseas.

Cómo ver planes de consultas de muestra

    En algunos casos, es posible que desees ver planes de consulta de muestra y comparar el rendimiento de una consulta a lo largo del tiempo. En el caso de las consultas que consumen más CPU, Spanner retiene los planes de consulta muestreados durante 30 días en la página Estadísticas de consultas de la consola de Google Cloud . Para ver los planes de consulta muestreados, sigue estos pasos:

  1. Ve a la página Instancias de Spanner en la consola de Google Cloud .

    Ir a la página Instancias

  2. Haz clic en el nombre de la instancia con las consultas que deseas investigar.

    La consola deGoogle Cloud muestra la página Descripción general de la instancia.

  3. En el menú Navigation y, debajo del encabezado Observability, haz clic en Query insights.

    La consola deGoogle Cloud muestra la página Estadísticas de consultas de la instancia.

  4. En el menú desplegable Base de datos, selecciona la base de datos con las consultas que deseas investigar.

    La consola deGoogle Cloud muestra la información de carga de consultas de la base de datos. La tabla Consultas y etiquetas de TopN muestra la lista de las consultas y etiquetas de solicitud principales, ordenadas por uso de CPU.

  5. Busca la consulta con un alto uso de CPU para la que deseas ver los planes de consulta muestreados. Haz clic en el valor FPRINT de esa consulta.

    En la página Detalles de la consulta, se muestra un gráfico Muestras de planes de consulta de tu consulta a lo largo del tiempo. Puedes alejarte hasta un máximo de siete días antes de la hora actual. Nota: Los planes de consulta no son compatibles con las consultas que tienen partitionTokens obtenidos de la API de PartitionQuery y las consultas de DML particionado.

  6. Haz clic en uno de los puntos del gráfico para ver un plan de consulta anterior y visualizar los pasos que se realizaron durante la ejecución de la consulta. También puedes hacer clic en cualquier operador para ver información expandida sobre él.

    Gráfico de muestras de planes de consultas
    Figure 8. Gráfico de muestras de planes de consultas.

Haz un recorrido por el visualizador del plan de consultas

Los componentes clave del visualizador se anotan en la siguiente captura de pantalla y se describen con más detalle. Después de ejecutar una consulta en una pestaña de consulta, selecciona la pestaña EXPLANATION debajo del editor de consultas para abrir el visualizador del plan de ejecución de consultas.

El flujo de datos en el siguiente diagrama es ascendente, es decir, todas las tablas y los índices están en la parte inferior del diagrama y el resultado final está en la parte superior.

Visualizador del plan de consultas con anotaciones
Figura 9: Visualizador del plan de consultas con anotaciones
  • La visualización de tu plan puede ser grande, según la consulta que hayas ejecutado. Para ocultar y mostrar los detalles, activa o desactiva el selector de vista EXPANDIDA/COMPACTA. Puedes personalizar la cantidad de plan que ves en cada momento con el control de zoom.
  • El álgebra que explica cómo Spanner ejecuta la consulta se dibuja como un gráfico acíclico, en el que cada nodo corresponde a un iterador que consume filas de sus entradas y produce filas para su elemento superior. En la Figura 9, se muestra un plan de ejemplo. Haz clic en el diagrama para ver una vista expandida de algunos de los detalles del plan.

    Miniatura de la captura de pantalla del plan visual
    Figura 9: Ejemplo de plan visual (haz clic para acercar).
    Captura de pantalla ampliada del plan visual

    Cada nodo, o tarjeta, del gráfico representa un iterador y contiene la siguiente información:

    • Es el nombre del iterador. Un iterador consume filas de su entrada y produce filas.
    • Estadísticas del tiempo de ejecución que indican cuántas filas se devolvieron, cuál fue la latencia y cuánta CPU se consumió.
    • Proporcionamos las siguientes indicaciones visuales para ayudarte a identificar posibles problemas dentro del plan de ejecución de consultas.
    • Las barras rojas en un nodo son indicadores visuales del porcentaje de latencia o tiempo de CPU de este iterador en comparación con el total de la consulta.
    • El grosor de las líneas que conectan cada nodo representa el recuento de filas. Cuanto más gruesa sea la línea, mayor será la cantidad de filas que se pasen al siguiente nodo. La cantidad real de filas se muestra en cada tarjeta y cuando colocas el puntero sobre un conector.
    • Se muestra un triángulo de advertencia en un nodo en el que se realizó un análisis completo de la tabla. En el panel de información, se incluyen más detalles, como recomendaciones para agregar un índice o revisar la consulta o el esquema de otras maneras, si es posible, para evitar un análisis completo.
    • Selecciona una tarjeta del plan para ver los detalles en el panel de información a la derecha (5).

  • El minimapa del plan de ejecución muestra una vista del plan completo en un zoom reducido y es útil para determinar la forma general del plan de ejecución y para navegar rápidamente a diferentes partes del plan. Arrastra directamente en el mapa en miniatura o haz clic en el lugar en el que deseas enfocarte para ir a otra parte del plan visual.
  • Selecciona DOWNLOAD JSON para descargar una versión JSON del plan de ejecución, que es útil cuando te comunicas con el equipo de Spanner para obtener asistencia.
  • El panel de información muestra información contextual detallada sobre el nodo seleccionado en el diagrama del plan de consulta. La información se organiza en las siguientes categorías.
    • La información del iterador proporciona detalles, así como estadísticas del tiempo de ejecución, de la tarjeta del iterador que seleccionaste en el gráfico.
    • El Resumen de consultas proporciona detalles sobre la cantidad de filas que se muestran y el tiempo que tardó en ejecutarse la consulta. Los operadores prominentes son aquellos que muestran una latencia significativa, consumen CPU significativa en relación con otros operadores y muestran una cantidad significativa de filas de datos.
    • El cronograma de ejecución de consultas es un gráfico basado en el tiempo que muestra durante cuánto tiempo cada grupo de máquinas ejecutó su parte de la consulta. Es posible que un grupo de máquinas no se ejecute durante todo el tiempo de ejecución de la consulta. También es posible que un grupo de máquinas se haya ejecutado varias veces durante la ejecución de la consulta, pero el cronograma aquí solo representa el inicio de la primera vez que se ejecutó y el final de la última vez que se ejecutó.
  • Cómo ajustar una consulta que tiene un rendimiento bajo

    Imagina que tu empresa administra una base de datos de películas en línea que contiene información sobre las películas, como el elenco, las productoras, los detalles de las películas y mucho más. El servicio se ejecuta en Spanner, pero últimamente ha tenido algunos problemas de rendimiento.

    Como desarrollador principal del servicio, se te pide que investigues estos problemas de rendimiento porque están causando calificaciones bajas para el servicio. Abre la consola de Google Cloud , ve a la instancia de tu base de datos y, luego, abre el editor de consultas. Ingresa la siguiente consulta en el editor y ejecútala.

    SELECT
      t.title,
      MIN(t.production_year) AS year,
      ANY_VALUE(mc.note HAVING MIN t.production_year) AS note
    FROM
      title AS t
    JOIN
      movie_companies AS mc
    ON
      t.id = mc.movie_id
    WHERE
      t.title LIKE '% the %'
    GROUP BY
      title;
    

    El resultado de ejecutar esta consulta se muestra en la siguiente captura de pantalla. Para dar formato a la consulta en el editor, seleccionamos FORMAT QUERY. También hay una nota en la parte superior derecha de la pantalla que nos indica que la consulta es válida.

    Editor de consultas que muestra la consulta original
    Figure 1. Editor de consultas que muestra la consulta original.

    La pestaña RESULTADOS debajo del editor de consultas muestra que la consulta se completó en poco más de dos minutos. Decides analizar la consulta con más detalle para ver si es eficiente.

    Cómo analizar una consulta lenta con el visualizador del plan de consultas

    En este punto, sabemos que la consulta del paso anterior tarda más de dos minutos, pero no sabemos si es lo más eficiente posible y, por lo tanto, si se espera esta duración.

    Selecciona la pestaña EXPLANATION justo debajo del editor de consultas para ver una representación visual del plan de ejecución que Spanner creó para ejecutar la consulta y mostrar los resultados.

    El plan que se muestra en la siguiente captura de pantalla es relativamente grande, pero, incluso con este nivel de zoom, puedes hacer las siguientes observaciones.

    • Según el Resumen de la consulta en el panel de información de la derecha, se analizaron casi 3 millones de filas y, en última instancia, se mostraron menos de 64,000.

    • También podemos ver en el panel Cronograma de ejecución de la consulta que 4 grupos de máquinas participaron en la consulta. Un grupo de máquinas es responsable de la ejecución de una parte de la consulta. Es posible que los operadores se ejecuten en una o más máquinas. Si seleccionas un grupo de máquinas en el cronograma, se destacará en el plan visual qué parte de la consulta se ejecutó en ese grupo.

    Visualizador del plan de consultas que muestra una explicación visual de la consulta original
    Figura 2: Visualizador del plan de consultas que muestra el plan visual de la consulta original.

    Debido a estos factores, decides que es posible mejorar el rendimiento si cambias la unión de una unión de aplicación, que Spanner eligió de forma predeterminada, a una unión hash.

    Mejora la consulta

    Para mejorar el rendimiento de la consulta, usa una sugerencia de unión para cambiar el método de unión a una unión hash. Esta implementación de unión ejecuta el procesamiento basado en conjuntos.

    Esta es la consulta actualizada:

    SELECT
      t.title,
      MIN(t.production_year) AS year,
      ANY_VALUE(mc.note HAVING MIN t.production_year) AS note
    FROM
      title AS t
    JOIN
      @{join_method=hash_join} movie_companies AS mc
    ON
      t.id = mc.movie_id
    WHERE
      t.title LIKE '% the %'
    GROUP BY
      title;
    

    En la siguiente captura de pantalla, se muestra la consulta actualizada. Como se muestra en la captura de pantalla, la consulta se completó en menos de 5 segundos, una mejora significativa en comparación con el tiempo de ejecución de 120 segundos antes de este cambio.

    Editor de consultas que muestra una consulta mejorada
    Figura 3: Editor de consultas que muestra la consulta mejorada

    Examina el nuevo plan visual, que se muestra en el siguiente diagrama, para ver qué nos dice sobre esta mejora.

    Visualización de consultas en la IU de la consola de Cloud
    Figura 4: Visualización del plan de consulta después de las mejoras de la consulta (haz clic para acercar).

    Captura de pantalla ampliada del plan visual

    De inmediato, notarás algunas diferencias:

    • Solo un grupo de máquinas participó en esta ejecución de consulta.

    • La cantidad de agregaciones se redujo de forma significativa.

    Conclusión

    En esta situación, ejecutamos una consulta lenta y observamos su plan visual para buscar ineficiencias. A continuación, se incluye un resumen de las consultas y los planes antes y después de realizar los cambios. Cada pestaña muestra la consulta que se ejecutó y una vista compacta de la visualización completa del plan de ejecución de la consulta.

    Antes

    SELECT
      t.title,
      MIN(t.production_year) AS year,
      ANY_VALUE(mc.note
      HAVING
        MIN t.production_year) AS note
    FROM
      title AS t
    JOIN
      movie_companies AS mc
    ON
      t.id = mc.movie_id
    WHERE
      t.title LIKE '% the %'
    GROUP BY
      title;
    
    Vista compacta del plan visual antes de las mejoras.
    Figura 5: Vista compacta del plan visual antes de las mejoras.

    Después

    SELECT
      t.title,
      MIN(t.production_year) AS year,
      ANY_VALUE(mc.note
      HAVING
        MIN t.production_year) AS note
    FROM
      title AS t
    JOIN
      @{join_method=hash_join} movie_companies AS mc
    ON
      t.id = mc.movie_id
    WHERE
      t.title LIKE '% the %'
    GROUP BY
      title;
    
    Vista compacta del plan visual después de las mejoras.
    Figura 6: Vista compacta del plan visual después de las mejoras.

    Un indicador de que se podría mejorar algo en esta situación es que una gran proporción de las filas de la tabla título calificó el filtro LIKE '% the %'. Es probable que sea costoso buscar en otra tabla con tantas filas. Cambiar nuestra implementación de unión a una unión de hash mejoró el rendimiento de manera significativa.

    ¿Qué sigue?