En esta página, se describe cómo administrar el optimizador de consultas en Spanner para las bases de datos con dialecto de GoogleSQL y las bases de datos con dialecto de PostgreSQL.
El optimizador de consultas de Spanner determina la forma más eficiente de ejecutar una consulta en SQL. Sin embargo, el plan de consultas que determina el optimizador puede cambiar ligeramente cuando el optimizador de consultas evoluciona o cuando se actualizan las estadísticas de la base de datos. Para minimizar cualquier potencial de regresión de rendimiento cuando cambian el optimizador de consultas o las estadísticas, Spanner proporciona las siguientes opciones de consulta.
optimizer_version: Los cambios en el optimizador de consultas se agrupan y se lanzan como versiones del optimizador. Spanner comienza a usar la versión más reciente del optimizador como predeterminada al menos 30 días después de que se lanza esa versión. Puedes usar la opción de versión del optimizador de consultas para ejecutar consultas en una versión anterior del optimizador.
optimizer_statistics_package: Spanner actualiza las estadísticas del optimizador con regularidad. Las estadísticas nuevas están disponibles como paquete. Esta opción de consulta especifica un paquete de estadísticas para que el optimizador de consultas lo use cuando compile una consulta en SQL. El paquete especificado debe tener inhabilitada la recolección de basura:
GoogleSQL
ALTER STATISTICS <package_name> SET OPTIONS (allow_gc=false)
PostgreSQL
ALTER STATISTICS spanner."<package_name>" SET OPTIONS (allow_gc = true)
En esta guía, se muestra cómo configurar estas opciones individuales en diferentes alcances de Spanner.
Enumera las opciones del optimizador de consultas
Spanner almacena información sobre las versiones del optimizador y los paquetes de estadísticas disponibles que puedes seleccionar.
Versiones del optimizador
La versión del optimizador de consultas es un valor de número entero, que aumenta en 1 con cada actualización. La versión más reciente del optimizador de consultas es 8.
Ejecuta la siguiente instrucción de SQL para devolver una lista de todas las versiones del optimizador compatibles, junto con sus fechas de lanzamiento correspondientes y si esa versión es la predeterminada. El número de versión más grande que se muestra es la versión compatible del optimizador más reciente.
SELECT * FROM SPANNER_SYS.SUPPORTED_OPTIMIZER_VERSIONS;
Versión predeterminada
De forma predeterminada, Spanner comienza a usar la versión más reciente del optimizador al menos 30 días después de que se lanza esa versión. Durante el período de más de 30 días entre el lanzamiento de una versión nueva y su paso a ser la predeterminada, se recomienda que pruebes las consultas en la versión nueva para detectar cualquier regresión.
Para encontrar la versión predeterminada, ejecuta la siguiente instrucción de SQL:
SELECT * FROM SPANNER_SYS.SUPPORTED_OPTIMIZER_VERSIONS;
La consulta devuelve una lista de todas las versiones del optimizador compatibles. La columna IS_DEFAULT
especifica qué versión es la predeterminada actual.
Para obtener detalles sobre cada versión, consulta Historial de versiones del optimizador de consultas.
Paquetes de estadísticas del optimizador
A cada paquete de estadísticas del optimizador nuevo que crea Spanner se le asigna un nombre de paquete que se garantiza que es único dentro de la base de datos determinada.
El formato del nombre del paquete es auto_{PACKAGE_TIMESTAMP}UTC
.
En GoogleSQL, la instrucción ANALYZE
activa la creación del nombre del paquete de estadísticas. En PostgreSQL, la instrucción ANALYZE
realiza esta tarea. El formato del nombre del paquete de estadísticas es analyze_{PACKAGE_TIMESTAMP}UTC
, donde {PACKAGE_TIMESTAMP}
es la marca de tiempo, en la zona horaria UTC, del momento en que comenzó la construcción de las estadísticas. Ejecuta la siguiente instrucción de SQL para mostrar una lista de todos los paquetes de estadísticas del optimizador disponibles.
SELECT * FROM INFORMATION_SCHEMA.SPANNER_STATISTICS;
De forma predeterminada, Spanner usa el paquete de estadísticas del optimizador más reciente, a menos que la base de datos o la consulta estén fijadas a un paquete anterior con uno de los métodos que se describen en esta página.
Prioridad de anulación de opción
Si usas una base de datos con dialecto de GoogleSQL, Spanner ofrece varias formas de cambiar las opciones del optimizador. Por ejemplo, puedes establecer las opciones para una consulta específica o configurar la opción en la biblioteca cliente a nivel de proceso o de consulta. Cuando una opción se configura de muchas formas, se aplica el siguiente orden de prioridad. (Selecciona un vínculo para ir a esa sección en este documento).
Predeterminado de Spanner ← opción de base de datos ← app cliente ← variable de entorno ← consulta del cliente ← sugerencia de instrucción
Por ejemplo, así se interpreta el orden de prioridad cuando se establece la versión del optimizador de consultas:
Cuando creas una base de datos, se usa la versión predeterminada del optimizador de Spanner. Configurar la versión del optimizador con uno de los métodos mencionados anteriormente tiene prioridad sobre cualquier elemento que se encuentre a la izquierda. Por ejemplo, configurar el optimizador para una app con una variable de entorno tiene prioridad sobre cualquier valor que establezcas para la base de datos con la opción de base de datos. La configuración de la versión del optimizador a través de una sugerencia de instrucción tiene la prioridad más alta para la consulta determinada y tiene prioridad sobre el valor establecido con cualquier otro método.
En las siguientes secciones, se proporcionan más detalles sobre cada método.
Cómo establecer opciones del optimizador a nivel de la base de datos
Puedes configurar la versión del optimizador predeterminada en una base de datos con el siguiente comando de DDL ALTER DATABASE
.
GoogleSQL
ALTER DATABASE MyDatabase
SET OPTIONS (optimizer_version = 8);
PostgreSQL
ALTER DATABASE MyDatabase SET spanner.optimizer_version = 5;
Puedes configurar el paquete de estadísticas de manera similar, como se muestra en el siguiente ejemplo.
GoogleSQL
ALTER DATABASE MyDatabase
SET OPTIONS (optimizer_statistics_package = "auto_20191128_14_47_22UTC");
PostgreSQL
ALTER DATABASE MyDatabase
SET spanner.optimizer_statistics_package = "auto_20191128_14_47_22UTC";
También puedes configurar más de una opción al mismo tiempo, como se muestra en el siguiente comando de DDL.
GoogleSQL
ALTER DATABASE MyDatabase
SET OPTIONS (optimizer_version = 8,
optimizer_statistics_package = "auto_20191128_14_47_22UTC");
Puedes ejecutar ALTER DATABASE
en gcloud CLI con el comando gcloud CLI databases ddl update
de la siguiente manera.
GoogleSQL
gcloud spanner databases ddl update MyDatabase --instance=test-instance \
--ddl='ALTER DATABASE MyDatabase SET OPTIONS ( optimizer_version = 8 )'
PostgreSQL
gcloud spanner databases ddl update MyDatabase --instance=test-instance \
--ddl='ALTER DATABASE MyDatabase SET spanner.optimizer_version = 8'
Si configuras una opción de base de datos en NULL
(en GoogleSQL) o DEFAULT
(en PostgreSQL), se borrará para que se use el valor predeterminado.
Para ver el valor actual de estas opciones para una base de datos, consulta la vista INFORMATION_SCHEMA.DATABASE_OPTIONS
para GoogleSQL o la tabla information_schema database_options
para PostgreSQL, como se indica a continuación.
GoogleSQL
SELECT
s.OPTION_NAME,
s.OPTION_VALUE
FROM
INFORMATION_SCHEMA.DATABASE_OPTIONS s
WHERE
s.SCHEMA_NAME=""
AND s.OPTION_NAME IN ('optimizer_version', 'optimizer_statistics_package')
PostgreSQL
SELECT
s.option_name,
s.option_value
FROM
information_schema.database_options s
WHERE
s.schema_name='public'
AND s.option_name IN ('optimizer_version',
'optimizer_statistics_package')
Configura opciones del optimizador con bibliotecas cliente
Cuando interactúas de manera programática con Spanner a través de bibliotecas cliente, existen varias formas de cambiar las opciones de consulta para tu aplicación cliente.
Debes usar las versiones más recientes de las bibliotecas cliente para establecer las opciones del optimizador.
Configura las opciones del optimizador para un cliente de base de datos
Una aplicación puede configurar opciones del optimizador de forma global en la biblioteca cliente configurando la propiedad de opciones de consulta, como se muestra en los siguientes fragmentos de código. La configuración del optimizador se almacena en la instancia del cliente y se aplica a todas las consultas que se ejecutan durante toda la vida útil del cliente. Aunque las opciones se aplican a nivel de base de datos en el backend, cuando se configuran a nivel de cliente, se aplican a todas las bases de datos conectadas a ese cliente.
C++
C#
Go
Java
Node.js
PHP
Python
Ruby
Configura opciones del optimizador con variables de entorno
Para que sea más fácil probar diferentes parámetros de configuración del optimizador sin tener que volver a compilar tu app, puedes configurar las variables de entorno SPANNER_OPTIMIZER_VERSION
y SPANNER_OPTIMIZER_STATISTICS_PACKAGE
, y ejecutar tu app, como se muestra en el siguiente fragmento.
Linux/macOS
export SPANNER_OPTIMIZER_VERSION="8"
export SPANNER_OPTIMIZER_STATISTICS_PACKAGE="auto_20191128_14_47_22UTC"
Windows
set SPANNER_OPTIMIZER_VERSION="8"
set SPANNER_OPTIMIZER_STATISTICS_PACKAGE="auto_20191128_14_47_22UTC"
Los valores de las opciones del optimizador de consultas que se especificaron se leen y se almacenan en la instancia del cliente en el momento de la inicialización y se aplican a todas las consultas que se ejecutan durante toda la vida útil del cliente.
Configura las opciones del optimizador para una consulta del cliente
Puedes especificar un valor para la versión del optimizador o la versión del paquete de estadísticas a nivel de la consulta en tu aplicación cliente si especificas una propiedad de opciones de consulta cuando compiles tu consulta.
C++
C#
Go
Java
Node.js
PHP
Python
Ruby
Configura las opciones del optimizador para una consulta con una sugerencia de instrucción
Una sugerencia de instrucción es una sugerencia en una declaración de consulta que cambia la ejecución de la consulta desde el comportamiento predeterminado. Configurar la sugerencia OPTIMIZER_VERSION
en una declaración obliga la ejecución de esa consulta mediante la versión del optimizador de consultas especificada.
La sugerencia OPTIMIZER_VERSION
tiene la prioridad de versión más alta del optimizador. Si se especifica la sugerencia de la instrucción, se usará independientemente de todos los demás parámetros de configuración de la versión del optimizador.
GoogleSQL
@{OPTIMIZER_VERSION=8} SELECT * FROM MyTable;
PostgreSQL
/*@OPTIMIZER_VERSION=8*/ SELECT * FROM MyTable;
También puedes usar el literal latest_version para establecer la versión del optimizador de una consulta en la versión más reciente, como se muestra aquí.
GoogleSQL
@{OPTIMIZER_VERSION=latest_version} SELECT * FROM MyTable;
PostgreSQL
/*@OPTIMIZER_VERSION=latest_version*/ SELECT * FROM MyTable;
Configurar la sugerencia OPTIMIZER_STATISTICS_PACKAGE
en una declaración obliga la ejecución de esa consulta con la versión del paquete de estadísticas del optimizador de consultas especificada. El paquete especificado debe tener inhabilitada la recolección de elementos no utilizados:
GoogleSQL
ALTER STATISTICS <package_name> SET OPTIONS (allow_gc=false)
PostgreSQL
ALTER STATISTICS spanner."package_name" SET OPTIONS (allow_gc=false)
La sugerencia OPTIMIZER_STATISTICS_PACKAGE
tiene la prioridad más alta en la configuración del paquete del optimizador. Si se especifica la sugerencia de la instrucción, se usa independientemente de todos los demás parámetros de configuración de la versión del paquete del optimizador.
@{OPTIMIZER_STATISTICS_PACKAGE=auto_20191128_14_47_22UTC} SELECT * FROM MyTable;
También puedes usar el literal latest para usar el paquete de estadísticas más reciente.
@{OPTIMIZER_STATISTICS_PACKAGE=latest} SELECT * FROM MyTable;
Ambas sugerencias se pueden establecer en una sola instrucción, como se muestra en el siguiente ejemplo.
El literal default_version establece la versión del optimizador de una consulta en la versión predeterminada, que puede ser diferente de la versión más reciente. Consulta Versión predeterminada para obtener más detalles.
GoogleSQL
@{OPTIMIZER_VERSION=default_version, OPTIMIZER_STATISTICS_PACKAGE=auto_20191128_14_47_22UTC} SELECT * FROM MyTable;
PostgreSQL
/*@OPTIMIZER_VERSION=default_version, OPTIMIZER_STATISTICS_PACKAGE=auto_20191128_14_47_22UTC*/ SELECT * FROM KeyValue;
Configura las opciones del optimizador cuando usas el controlador JDBC de Spanner
Puedes anular el valor predeterminado de la versión del optimizador y el paquete de estadísticas si especificas opciones en la cadena de conexión JDBC, como se muestra en el siguiente ejemplo.
Estas opciones solo se admiten en las versiones más recientes del controlador JDBC de Spanner.
También puedes configurar la versión del optimizador de consultas con la declaración SET OPTIMIZER_VERSION
, como se muestra en el siguiente ejemplo.
Para obtener más detalles sobre el uso del controlador de código abierto, consulta Usa el controlador JDBC de código abierto.
Cómo se controlan las versiones del optimizador no válidas
Spanner admite un rango de versiones de optimizador.
Este rango cambia con el tiempo cuando se actualiza el optimizador de consultas. Si la versión que especificas está fuera del rango, la consulta falla. Por ejemplo, si intentas ejecutar una consulta con la sugerencia de instrucción @{OPTIMIZER_VERSION=9}
, pero el número de versión del optimizador más reciente es solo 8
, Spanner responderá con este mensaje de error:
Query optimizer version: 9 is not
supported
Cómo controlar un parámetro de configuración no válido del paquete de estadísticas del optimizador
Puedes fijar tu base de datos o consulta a cualquier paquete de estadísticas disponible con uno de los métodos que se describieron anteriormente en esta página. La consulta falla si se proporciona un nombre de paquete de estadísticas no válido. Un paquete de estadísticas especificado por una consulta debe ser uno de los siguientes:
Determina la versión del optimizador de consultas que se usa para ejecutar una consulta
La versión del optimizador que se usa para una consulta se puede ver a través de la Google Cloud consola y en Google Cloud CLI.
Google Cloud console
Para ver la versión del optimizador que se usó en una consulta, ejecútala en la página Spanner Studio de la consola de Google Cloud y, luego, selecciona la pestaña Explicación. Deberías ver un mensaje similar al siguiente:
Versión del optimizador de consultas: 8
gcloud CLI
Para ver la versión que se usa cuando se ejecuta una consulta en gcloud CLI, configura la marca --query-mode
como PROFILE
, como se muestra en el siguiente fragmento.
gcloud spanner databases execute-sql MyDatabase --instance=test-instance \
--query-mode=PROFILE --sql='SELECT * FROM MyTable'
Visualiza la versión del optimizador de consultas en el Explorador de métricas
Cloud Monitoring recopila medidas para ayudarte a comprender el rendimiento de las aplicaciones y los servicios del sistema. Una de las métricas recopiladas para Spanner es el recuento de consultas, que mide la cantidad de consultas en una instancia, muestreadas a lo largo del tiempo. Si bien esta métrica es muy útil para ver las consultas agrupadas por código de error, también podemos usarla para ver qué versión del optimizador se usó para ejecutar cada consulta.
Puedes usar el Explorador de métricas en la consola deGoogle Cloud para visualizar el recuento de consultas de tu instancia de base de datos. En la figura 1, se muestra el recuento de consultas para tres bases de datos. Puedes ver qué versión del optimizador se usa en cada base de datos.
En la tabla que se encuentra debajo del gráfico de esta figura, se muestra que my-db-1
intentó ejecutar una consulta con una versión del optimizador no válida, lo que generó el estado Uso incorrecto y un recuento de consultas de 0. Las otras bases de datos ejecutaron consultas con las versiones 1 y 2 del optimizador, respectivamente.
Figura 1. Recuento de consultas que se muestra en el Explorador de métricas con consultas agrupadas por versión del optimizador.
Para configurar un gráfico similar para tu instancia, haz lo siguiente:
- Navega al Explorador de métricas en la consola de Google Cloud .
- En el campo Tipo de recurso, selecciona
Cloud Spanner Instance
. - En el campo Métrica, selecciona
Count of queries
. - En el campo Agrupar por, selecciona
database
,optimizer_version
ystatus
.
En este ejemplo, no se muestra el caso en el que se usa una versión diferente del optimizador para diferentes consultas en la misma base de datos. En ese caso, el gráfico mostraría un segmento de barra para cada combinación de base de datos y versión del optimizador.
Si deseas obtener información para usar Cloud Monitoring y supervisar tus instancias de Spanner, consulta Supervisa con Cloud Monitoring.