El optimizador de consultas de Spanner determina la forma más eficiente de ejecución de una consulta en SQL. Sin embargo, el plan de consulta que determina el optimizador puede cambiar un poco cuando el optimizador de consultas evoluciona o cuando se actualizan las estadísticas de la base de datos. Para minimizar cualquier posibilidad de regresión de rendimiento cuando cambian las estadísticas o el optimizador de consultas, Spanner proporciona las siguientes opciones de consulta.
optimizer_version: Los cambios en el optimizador de consultas se agrupan y se lanzan como versiones del optimizador. Spanner comienza a usar la versión más reciente del optimizador como la predeterminada al menos 30 días después de que se publica esa versión. Puedes usar la opción de versión del optimizador de consultas para ejecutar consultas en una versión anterior del optimizador.
optimizer_statistics_package: Spanner actualiza las estadísticas del optimizador con regularidad. Las estadísticas nuevas están disponibles como un paquete. Esta opción de consulta especifica un paquete de estadísticas para que el optimizador de consultas use cuando compila una consulta en SQL. El paquete especificado debe tener inhabilitada la recolección de elementos no utilizados:
GoogleSQL
ALTER STATISTICS <package_name> SET OPTIONS (allow_gc=false)
PostgreSQL
ALTER STATISTICS spanner."<package_name>" SET OPTIONS (allow_gc = true)
En esta guía, se muestra cómo configurar estas opciones individuales en diferentes ámbitos en Spanner.
Enumera las opciones del optimizador de consultas
Spanner almacena información sobre las versiones de optimizador disponibles y los paquetes de estadísticas que puedes seleccionar.
Versiones del optimizador
La versión del optimizador de consultas es un valor de número entero, que aumenta en 1 con cada actualización. La versión más reciente del optimizador de consultas es 8.
Ejecuta la siguiente instrucción de SQL para mostrar una lista de todas las versiones del optimizador compatibles, junto con sus fechas de lanzamiento correspondientes y si esa versión es la predeterminada. El número de versión más grande que se muestra es la versión compatible del optimizador más reciente.
SELECT * FROM SPANNER_SYS.SUPPORTED_OPTIMIZER_VERSIONS;
Versión predeterminada
De forma predeterminada, Spanner comienza a usar la versión más reciente del optimizador al menos 30 días después de que se publica. Durante el período de más de 30 días entre una versión nueva y su paso a ser la predeterminada, se recomienda que pruebes las consultas en la versión nueva para detectar cualquier regresión.
Para encontrar la versión predeterminada, ejecuta la siguiente instrucción de SQL:
SELECT * FROM SPANNER_SYS.SUPPORTED_OPTIMIZER_VERSIONS;
La consulta muestra una lista de todas las versiones del optimizador compatibles. La columna IS_DEFAULT
especifica qué versión es la predeterminada actual.
Para obtener detalles sobre cada versión, consulta Historial de versiones del optimizador de consultas.
Paquetes de estadísticas del optimizador
A cada paquete de estadísticas del optimizador nuevo que crea Spanner se le asigna un nombre de paquete que se garantiza que es único dentro de la base de datos determinada.
El formato del nombre del paquete es auto_{PACKAGE_TIMESTAMP}UTC
.
En GoogleSQL, la sentencia ANALYZE
activa la creación del nombre del paquete de estadísticas. En
PostgreSQL, la
sentencia ANALYZE
realiza esta tarea. El formato del nombre del paquete de estadísticas es analyze_{PACKAGE_TIMESTAMP}UTC
, en el que {PACKAGE_TIMESTAMP}
es la marca de tiempo, en la zona horaria UTC, de cuándo comenzó la compilación de estadísticas. Ejecuta la siguiente instrucción de SQL para mostrar una lista de todos los paquetes de estadísticas del optimizador disponibles.
SELECT * FROM INFORMATION_SCHEMA.SPANNER_STATISTICS;
De forma predeterminada, Spanner usa el paquete de estadísticas del optimizador más reciente, a menos que la base de datos o la consulta esté fijada a un paquete anterior con uno de los métodos que se describen en esta página.
Prioridad de anulación de opciones
Si usas una base de datos de dialecto GoogleSQL, Spanner ofrece varias formas de cambiar las opciones del optimizador. Por ejemplo, puedes configurar las opciones para una consulta específica o configurarlas en la biblioteca cliente a nivel de proceso o de consulta. Cuando una opción se configura de varias maneras, se aplica el siguiente orden de prioridad. (Selecciona un vínculo para ir a esa sección en este documento).
Predeterminado de Spanner ← opción de base de datos ← app cliente ← variable de entorno ← consulta del cliente ← sugerencia de sentencia
Por ejemplo, aquí se muestra cómo interpretar el orden de prioridad cuando se establece la versión del optimizador de consultas:
Cuando creas una base de datos, esta usa la versión predeterminada del optimizador de Spanner. Configura la versión del optimizador con uno de los métodos mencionados antes, que tiene prioridad sobre cualquier elemento que se encuentre a la izquierda. Por ejemplo, configurar el optimizador para una app mediante una variable de entorno tiene prioridad sobre cualquier valor que establezcas para la base de datos con la opción de base de datos. La configuración de la versión del optimizador a través de una sugerencia de instrucción tiene la prioridad más alta para la consulta determinada y tiene prioridad sobre el valor establecido mediante cualquier otro método.
Ahora analicemos cada método con más detalle.
Cómo establecer opciones del optimizador a nivel de la base de datos
Puedes configurar la versión del optimizador predeterminada en una base de datos mediante el siguiente comando de DDL ALTER DATABASE
.
GoogleSQL
ALTER DATABASE MyDatabase
SET OPTIONS (optimizer_version = 8);
PostgreSQL
ALTER DATABASE MyDatabase SET spanner.optimizer_version = 5;
Puedes configurar el paquete de estadísticas de manera similar, como se muestra en el siguiente ejemplo.
GoogleSQL
ALTER DATABASE MyDatabase
SET OPTIONS (optimizer_statistics_package = "auto_20191128_14_47_22UTC");
PostgreSQL
ALTER DATABASE MyDatabase
SET spanner.optimizer_statistics_package = "auto_20191128_14_47_22UTC";
También puedes configurar más de una opción a la vez, como se muestra en el siguiente comando de DDL.
GoogleSQL
ALTER DATABASE MyDatabase
SET OPTIONS (optimizer_version = 8,
optimizer_statistics_package = "auto_20191128_14_47_22UTC");
Puedes ejecutar ALTER DATABASE
en gcloud CLI con el comando gcloud CLI databases ddl update
de la siguiente manera.
GoogleSQL
gcloud spanner databases ddl update MyDatabase --instance=test-instance \
--ddl='ALTER DATABASE MyDatabase SET OPTIONS ( optimizer_version = 8 )'
PostgreSQL
gcloud spanner databases ddl update MyDatabase --instance=test-instance \
--ddl='ALTER DATABASE MyDatabase SET spanner.optimizer_version = 8'
Si configuras una opción de base de datos en NULL
(en GoogleSQL) o DEFAULT
(en PostgreSQL), se borra para que se use el valor predeterminado.
Para ver el valor actual de estas opciones para una base de datos, consulta la vista INFORMATION_SCHEMA.DATABASE_OPTIONS
para GoogleSQL o la tabla information_schema database_options
para PostgreSQL, como se indica a continuación.
GoogleSQL
SELECT
s.OPTION_NAME,
s.OPTION_VALUE
FROM
INFORMATION_SCHEMA.DATABASE_OPTIONS s
WHERE
s.SCHEMA_NAME=""
AND s.OPTION_NAME IN ('optimizer_version', 'optimizer_statistics_package')
PostgreSQL
SELECT
s.option_name,
s.option_value
FROM
information_schema.database_options s
WHERE
s.schema_name='public'
AND s.option_name IN ('optimizer_version',
'optimizer_statistics_package')
Configura las opciones del optimizador con bibliotecas cliente
Cuando interactúas de manera programática con Spanner a través de bibliotecas cliente, existen varias formas de cambiar las opciones de consulta para tu aplicación cliente.
Debes usar las versiones más recientes de las bibliotecas cliente para configurar las opciones del optimizador.
Configura las opciones del optimizador para un cliente de base de datos
Una aplicación puede configurar opciones de optimizador de forma global en la biblioteca cliente mediante la configuración de la propiedad de opciones de consulta como se muestra en los siguientes fragmentos de código. La configuración del optimizador se almacena en la instancia del cliente y se aplica a todas las consultas que se ejecutan durante toda la vida útil del cliente. Aunque las opciones se aplican a nivel de base de datos en el backend, cuando se configuran a nivel de cliente, se aplican a todas las bases de datos conectadas a través de ese cliente.
C++
C#
Go
Java
Node.js
PHP
Python
Ruby
Configura las opciones del optimizador con variables de entorno
Para que sea más fácil probar diferentes parámetros de configuración del optimizador sin tener que volver a compilar tu app, puedes configurar las variables de entorno SPANNER_OPTIMIZER_VERSION
y SPANNER_OPTIMIZER_STATISTICS_PACKAGE
y ejecutarla, como se muestra en el siguiente fragmento.
Linux/macOS
export SPANNER_OPTIMIZER_VERSION="8"
export SPANNER_OPTIMIZER_STATISTICS_PACKAGE="auto_20191128_14_47_22UTC"
Windows
set SPANNER_OPTIMIZER_VERSION="8"
set SPANNER_OPTIMIZER_STATISTICS_PACKAGE="auto_20191128_14_47_22UTC"
Los valores de las opciones del optimizador de consultas especificados se leen y se almacenan en la instancia del cliente en el momento de la inicialización y se aplican a todas las consultas que se ejecutan durante toda la vida útil del cliente.
Configura las opciones del optimizador para una consulta del cliente
Puedes especificar un valor para la versión del optimizador o la versión del paquete de estadísticas a nivel de la consulta en tu aplicación cliente si especificas una propiedad de opciones de consulta cuando compilas tu consulta.
C++
C#
Go
Java
Node.js
PHP
Python
Ruby
Configura las opciones del optimizador para una consulta mediante una sugerencia de instrucción
Una sugerencia de instrucción es una sugerencia en una declaración de consulta que cambia la ejecución de la consulta desde el comportamiento predeterminado. Configurar la sugerencia OPTIMIZER_VERSION
en una declaración obliga la ejecución de esa consulta mediante la versión del optimizador de consultas especificada.
La sugerencia OPTIMIZER_VERSION
tiene la prioridad de versión más alta del optimizador. Si se especifica la sugerencia de la declaración, se usará independientemente de todas las demás configuraciones de la versión del optimizador.
GoogleSQL
@{OPTIMIZER_VERSION=8} SELECT * FROM MyTable;
PostgreSQL
/*@OPTIMIZER_VERSION=8*/ SELECT * FROM MyTable;
También puedes usar el literal latest_version para establecer la versión del optimizador de una consulta en la versión más reciente, como se muestra aquí.
GoogleSQL
@{OPTIMIZER_VERSION=latest_version} SELECT * FROM MyTable;
PostgreSQL
/*@OPTIMIZER_VERSION=latest_version*/ SELECT * FROM MyTable;
Configurar la sugerencia OPTIMIZER_STATISTICS_PACKAGE
en una declaración obliga la ejecución de esa consulta mediante la versión del paquete de estadísticas del optimizador de consultas especificada. El paquete especificado debe tener inhabilitada la recolección de elementos no utilizados:
GoogleSQL
ALTER STATISTICS <package_name> SET OPTIONS (allow_gc=false)
PostgreSQL
ALTER STATISTICS spanner."package_name" SET OPTIONS (allow_gc=false)
La sugerencia OPTIMIZER_STATISTICS_PACKAGE
tiene la prioridad de configuración del paquete del optimizador más alta. Si se especifica la sugerencia de la declaración, se usará independientemente de todas las demás configuraciones de la versión del paquete del optimizador.
@{OPTIMIZER_STATISTICS_PACKAGE=auto_20191128_14_47_22UTC} SELECT * FROM MyTable;
También puedes usar el literal latest para usar el paquete de estadísticas más reciente.
@{OPTIMIZER_STATISTICS_PACKAGE=latest} SELECT * FROM MyTable;
Ambas sugerencias se pueden establecer en una sola sentencia, como se muestra en el siguiente ejemplo.
El literal default_version establece la versión del optimizador de una consulta en la versión predeterminada, que puede ser diferente de la versión más reciente. Consulta Versión predeterminada para obtener más información.
GoogleSQL
@{OPTIMIZER_VERSION=default_version, OPTIMIZER_STATISTICS_PACKAGE=auto_20191128_14_47_22UTC} SELECT * FROM MyTable;
PostgreSQL
/*@OPTIMIZER_VERSION=default_version, OPTIMIZER_STATISTICS_PACKAGE=auto_20191128_14_47_22UTC*/ SELECT * FROM KeyValue;
Configura las opciones del optimizador cuando usas el controlador de JDBC de Spanner
Puedes anular el valor predeterminado de la versión del optimizador y el paquete de estadísticas si especificas opciones en la cadena de conexión JDBC, como se muestra en el siguiente ejemplo.
Estas opciones solo son compatibles con las versiones más recientes del controlador JDBC de Spanner.
También puedes configurar la versión del optimizador de consultas con la sentencia SET OPTIMIZER_VERSION
, como se muestra en el siguiente ejemplo.
Para obtener más detalles sobre el uso del controlador de código abierto, consulta Usa el controlador JDBC de código abierto.
Cómo se controlan las versiones del optimizador no válidas
Spanner admite un rango de versiones de optimizador.
Este rango cambia con el tiempo cuando se actualiza el optimizador de consultas. Si la versión
que especificas está fuera de rango, la consulta falla. Por ejemplo, si intentas ejecutar una consulta con la sugerencia de sentencia @{OPTIMIZER_VERSION=9}
, pero el número de versión más reciente del optimizador es solo 8
, Spanner responde con este mensaje de error:
Query optimizer version: 9 is not
supported
Controla un parámetro de configuración de paquete de estadísticas del optimizador no válido
Puedes fijar tu base de datos o consulta a cualquier paquete de estadísticas disponible mediante uno de los métodos que se describieron anteriormente en esta página. Una consulta falla si se proporciona un nombre de paquete de estadísticas no válido. Un paquete de estadísticas que especifica una consulta debe ser uno de los siguientes:
Determina la versión del optimizador de consultas que se usa para ejecutar una consulta
La versión del optimizador que se usa para una consulta es visible en la consola de Google Cloud y en Google Cloud CLI.
consola de
Para ver la versión del optimizador que se usó en una consulta, ejecútala en la página Spanner Studio de la consola de Google Cloud y, luego, selecciona la pestaña Explicación. Deberías ver un mensaje similar al siguiente:
Versión del optimizador de consultas: 8
gcloud CLI
Para ver la versión que se usa cuando se ejecuta una consulta en gcloud CLI, configura la marca --query-mode
como PROFILE
, como se muestra en el siguiente fragmento.
gcloud spanner databases execute-sql MyDatabase --instance=test-instance \
--query-mode=PROFILE --sql='SELECT * FROM MyTable'
Visualiza la versión del optimizador de consultas en el Explorador de métricas
Cloud Monitoring recopila medidas para ayudarte a comprender el rendimiento de las aplicaciones y los servicios del sistema. Una de las métricas recopiladas para Spanner es el registro de consultas, que mide la cantidad de consultas en una instancia, muestreada a lo largo del tiempo. Si bien esta métrica es muy útil para ver las consultas agrupadas por código de error, también podemos usarla para ver qué versión del optimizador se usó para ejecutar cada consulta.
Puedes usar el Explorador de métricas en la consola de Google Cloud para visualizar el Recuento de consultas de tu instancia de base de datos. En la Figura 1, se muestra el recuento de consultas de tres bases de datos. Puedes ver qué versión del optimizador se usa en cada base de datos.
En la tabla debajo del gráfico de esta figura, se muestra que my-db-1
intentó ejecutar una consulta con una versión de optimizador no válida, lo que muestra el estado Bad usage y genera un recuento de consultas de 0. Las otras bases de datos ejecutaron consultas con las versiones 1 y 2 del optimizador, respectivamente.
Figura 1. Recuento de consultas que se muestra en el Explorador de métricas con consultas agrupadas por versión del optimizador.
Para configurar un gráfico similar para tu instancia, sigue estos pasos:
- Navega al Explorador de métricas en la consola de Google Cloud .
- En el campo Tipo de recurso, selecciona
Cloud Spanner Instance
. - En el campo Métrica, selecciona
Count of queries
. - En el campo Agrupar por, selecciona
database
,optimizer_version
ystatus
.
En este ejemplo, no se muestra el caso en el que se usa una versión diferente del optimizador para diferentes consultas en la misma base de datos. En ese caso, el gráfico mostraría un segmento de barra para cada combinación de base de datos y versión del optimizador.
Si deseas obtener información sobre cómo usar Cloud Monitoring para supervisar tus instancias de Spanner, consulta Supervisa con Cloud Monitoring.