El optimizador de consultas de Spanner determina la forma más eficiente de ejecutar una consulta en SQL. Sin embargo, el plan de consultas determinado por el optimizador puede cambiar un poco cuando este evoluciona o cuando se actualizan las estadísticas de la base de datos. Para minimizar cualquier potencial de regresión de rendimiento cuando el optimizador de consultas o las estadísticas cambian, Spanner proporciona las siguientes opciones de consulta.
optimizer_version: los cambios en el optimizador de consultas se agrupan y lanzan como versiones del optimizador. Spanner comienza a usar la versión más reciente del optimizador de forma predeterminada al menos 30 días después del lanzamiento de esa versión. Puedes usar la opción de versión del optimizador de consultas para ejecutar consultas en una versión anterior del optimizador.
optimizer_statistics_package: Spanner actualiza las estadísticas del optimizador con regularidad. Las nuevas estadísticas están disponibles como un paquete. Esta opción de consulta especifica un paquete de estadísticas para que el optimizador de consultas use cuando compile una consulta en SQL. El paquete especificado debe tener inhabilitada la recolección de elementos no utilizados:
GoogleSQL
ALTER STATISTICSSET OPTIONS (allow_gc=false)
PostgreSQL
ALTER STATISTICS spanner."" SET OPTIONS (allow_gc = true)
En esta guía, se muestra cómo configurar estas opciones individuales en diferentes permisos en Spanner.
Enumerar opciones del optimizador de consultas
Spanner almacena información sobre las versiones del optimizador disponibles y los paquetes de estadísticas que puedes seleccionar.
Versiones del optimizador
La versión del optimizador de consultas es un valor de número entero, que se incrementa en 1 con cada actualización. La versión más reciente del optimizador de consultas es 6.
Ejecuta la siguiente instrucción de SQL para mostrar una lista de todas las versiones del optimizador compatibles, junto con sus fechas de lanzamiento correspondientes y si esa versión es la predeterminada. El número de versión más alto que se muestra es la última versión compatible del optimizador.
SELECT * FROM SPANNER_SYS.SUPPORTED_OPTIMIZER_VERSIONS;
Versión predeterminada
De forma predeterminada, Spanner comienza a usar la versión más reciente del optimizador al menos 30 días después del lanzamiento de esa versión. Durante el período de más de 30 días entre que una nueva versión se convierte en la predeterminada, te recomendamos que pruebes las consultas en la versión nueva para detectar cualquier regresión.
Para encontrar la versión predeterminada, ejecuta la siguiente instrucción de SQL:
SELECT * FROM SPANNER_SYS.SUPPORTED_OPTIMIZER_VERSIONS;
La consulta muestra una lista de todas las versiones compatibles del optimizador. En la columna IS_DEFAULT
, se especifica qué versión es la predeterminada actual.
Para obtener detalles sobre cada versión, consulta Historial de versiones del optimizador de consultas.
Paquetes de estadísticas del optimizador
A cada nuevo paquete de estadísticas del optimizador que crea Spanner se le asigna un nombre de paquete que se garantiza que será único dentro de la base de datos determinada.
El formato del nombre del paquete es auto_{PACKAGE_TIMESTAMP}UTC
.
En GoogleSQL, la instrucción ANALYZE
activa la creación del nombre del paquete de estadísticas. En PostgreSQL, la declaración ANALYZE
realiza esta tarea. El formato del nombre del paquete de estadísticas es analyze_{PACKAGE_TIMESTAMP}UTC
, en el que {PACKAGE_TIMESTAMP}
es la marca de tiempo, en la zona horaria UTC, de cuándo comenzó la construcción de las estadísticas. Ejecuta la siguiente instrucción de SQL para mostrar una lista de todos los paquetes de estadísticas del optimizador disponibles.
SELECT * FROM INFORMATION_SCHEMA.SPANNER_STATISTICS;
De forma predeterminada, Spanner usa el paquete de estadísticas del optimizador más reciente, a menos que la base de datos o la consulta estén fijadas a un paquete más antiguo mediante uno de los métodos descritos en esta página.
Prioridad de anulación de la opción
Si usas una base de datos con dialectos de Google SQL, Spanner ofrece varias formas de cambiar las opciones del optimizador. Por ejemplo, puedes configurar las opciones para una consulta específica o configurar la opción en la biblioteca cliente a nivel de proceso o consulta. Cuando una opción se configura de varias maneras, se aplica el siguiente orden de prioridad. (Selecciona un vínculo para pasar a esa sección del documento).
Configuración predeterminada de Spanner ← opción de base de datos ← app cliente ← variable de entorno ← consulta del cliente ← Sugerencia de declaración
Por ejemplo, aquí se muestra cómo interpretar el orden de prioridad cuando se configura la versión del optimizador de consultas:
Cuando creas una base de datos, esta usa la versión predeterminada del optimizador de Spanner. Configurar la versión del optimizador con uno de los métodos mencionados anteriormente tiene prioridad sobre todo lo que esté a la izquierda. Por ejemplo, configurar el optimizador para una app con una variable de entorno tiene prioridad sobre cualquier valor que definas para la base de datos con la opción base de datos. Configurar la versión del optimizador a través de una sugerencia de instrucción tiene la prioridad más alta para la consulta determinada y tiene prioridad sobre el valor establecido con cualquier otro método.
Ahora analicemos cada método con más detalle.
Configura las opciones del optimizador a nivel de la base de datos
Puedes configurar la versión predeterminada del optimizador en una base de datos con el siguiente comando de DDL ALTER DATABASE
.
GoogleSQL
ALTER DATABASE MyDatabase
SET OPTIONS (optimizer_version = 6);
PostgreSQL
ALTER DATABASE MyDatabase SET spanner.optimizer_version = 5;
Puedes configurar el paquete de estadísticas de manera similar, como se muestra en el siguiente ejemplo.
GoogleSQL
ALTER DATABASE MyDatabase
SET OPTIONS (optimizer_statistics_package = "auto_20191128_14_47_22UTC");
PostgreSQL
ALTER DATABASE MyDatabase
SET spanner.optimizer_statistics_package = "auto_20191128_14_47_22UTC";
También puedes configurar más de una opción al mismo tiempo, como se muestra en el siguiente comando de DDL.
GoogleSQL
ALTER DATABASE MyDatabase
SET OPTIONS (optimizer_version = 6,
optimizer_statistics_package = "auto_20191128_14_47_22UTC");
Puedes ejecutar ALTER DATABASE
en gcloud CLI con el comando gcloud CLI databases ddl update
como se indica a continuación.
GoogleSQL
gcloud spanner databases ddl update MyDatabase --instance=test-instance \
--ddl='ALTER DATABASE MyDatabase SET OPTIONS ( optimizer_version = 6 )'
PostgreSQL
gcloud spanner databases ddl update MyDatabase --instance=test-instance \
--ddl='ALTER DATABASE MyDatabase SET spanner.optimizer_version = 6'
Establecer una opción de base de datos en NULL
la borra para que se use el valor predeterminado.
Si deseas ver el valor actual de estas opciones para una base de datos, consulta la vista INFORMATION_SCHEMA.DATABASE_OPTIONS
de GoogleSQL o la tabla information_schema database_options
para PostgreSQL de la siguiente manera.
GoogleSQL
SELECT
s.OPTION_NAME,
s.OPTION_VALUE
FROM
INFORMATION_SCHEMA.DATABASE_OPTIONS s
WHERE
s.SCHEMA_NAME=""
AND s.OPTION_NAME IN ('optimizer_version', 'optimizer_statistics_package')
PostgreSQL
SELECT
s.option_name,
s.option_value
FROM
information_schema.database_options s
WHERE
s.schema_name='public'
AND s.option_name IN ('optimizer_version',
'optimizer_statistics_package')
Cómo configurar las opciones del optimizador con bibliotecas cliente
Cuando interactúas de manera programática con Spanner a través de las bibliotecas cliente, hay varias formas de cambiar las opciones de consulta para la aplicación cliente.
Debes usar las versiones más recientes de las bibliotecas cliente para configurar las opciones del optimizador.
Cómo configurar opciones de optimizador para un cliente de base de datos
Una aplicación puede establecer las opciones del optimizador de manera global en la biblioteca cliente configurando la propiedad de opciones de consulta, como se muestra en los siguientes fragmentos de código. La configuración del optimizador se almacena en la instancia del cliente y se aplica a todas las consultas que se ejecutan durante el ciclo de vida del cliente. Aunque las opciones se aplican a nivel de la base de datos en el backend, cuando las opciones se establecen en el nivel del cliente, se aplican a todas las bases de datos conectadas a ese cliente.
C++
C#
Go
Java
Node.js
PHP
Python
Rita
Configura las opciones del optimizador con variables de entorno
Para facilitar la prueba de diferentes configuraciones del optimizador sin tener que volver a compilar tu app, puedes configurar las variables de entorno SPANNER_OPTIMIZER_VERSION
y SPANNER_OPTIMIZER_STATISTICS_PACKAGE
, y ejecutar tu app, como se muestra en el siguiente fragmento.
Linux/macOS
export SPANNER_OPTIMIZER_VERSION="6"
export SPANNER_OPTIMIZER_STATISTICS_PACKAGE="auto_20191128_14_47_22UTC"
Windows
set SPANNER_OPTIMIZER_VERSION="6"
set SPANNER_OPTIMIZER_STATISTICS_PACKAGE="auto_20191128_14_47_22UTC"
Los valores especificados de las opciones del optimizador de consultas se leen y almacenan en la instancia del cliente en el momento de la inicialización del cliente y se aplican a todas las consultas que se ejecutan durante todo el ciclo de vida del cliente.
Configurar las opciones del optimizador para una consulta de cliente
Puedes especificar un valor para la versión del optimizador o la versión del paquete de estadísticas en el nivel de la consulta en tu aplicación cliente si especificas una propiedad de opciones de consulta cuando compilas tu consulta.
C++
C#
Go
Java
Node.js
PHP
Python
Rita
Cómo configurar las opciones del optimizador para una consulta con una sugerencia de instrucción
Una sugerencia de instrucción es una sugerencia en una declaración de consulta que cambia la ejecución de la consulta desde el comportamiento predeterminado. Configurar la sugerencia OPTIMIZER_VERSION
en una declaración obliga la ejecución de esa consulta mediante la versión del optimizador de consultas especificada.
La sugerencia OPTIMIZER_VERSION
tiene la prioridad de versión más alta del optimizador. Si se especifica la sugerencia de la instrucción, se utilizará sin importar la configuración de la otra versión del optimizador.
GoogleSQL
@{OPTIMIZER_VERSION=6} SELECT * FROM MyTable;
PostgreSQL
/*@OPTIMIZER_VERSION=6*/ SELECT * FROM MyTable;
También puedes usar el literal latest_version para establecer la versión del optimizador en una consulta a la versión más reciente, como se muestra aquí.
GoogleSQL
@{OPTIMIZER_VERSION=latest_version} SELECT * FROM MyTable;
PostgreSQL
/*@OPTIMIZER_VERSION=latest_version*/ SELECT * FROM MyTable;
Configurar la sugerencia OPTIMIZER_STATISTICS_PACKAGE
en una instrucción fuerza a esa consulta a ejecutarse con la versión especificada del paquete de estadísticas del optimizador de consultas. El paquete especificado debe tener inhabilitada la recolección de elementos no utilizados:
GoogleSQL
ALTER STATISTICS <package_name> SET OPTIONS (allow_gc=false)
PostgreSQL
ALTER STATISTICS spanner."package_name" SET OPTIONS (allow_gc=false)
La sugerencia OPTIMIZER_STATISTICS_PACKAGE
tiene la mayor precedencia de configuración de paquetes del optimizador. Si se especifica la sugerencia de instrucción, se utilizará independientemente de todas las demás configuraciones de versiones del paquete del optimizador.
@{OPTIMIZER_STATISTICS_PACKAGE=auto_20191128_14_47_22UTC} SELECT * FROM MyTable;
También puedes usar el literal latest para usar el paquete de estadísticas más reciente.
@{OPTIMIZER_STATISTICS_PACKAGE=latest} SELECT * FROM MyTable;
Ambas sugerencias se pueden configurar en una sola sentencia, como se muestra en el siguiente ejemplo.
El literal default_version establece la versión del optimizador para una consulta en la versión predeterminada, que puede ser diferente de la versión más reciente. Consulta Versión predeterminada para obtener más detalles.
GoogleSQL
@{OPTIMIZER_VERSION=default_version, OPTIMIZER_STATISTICS_PACKAGE=auto_20191128_14_47_22UTC} SELECT * FROM MyTable;
PostgreSQL
/*@OPTIMIZER_VERSION=default_version, OPTIMIZER_STATISTICS_PACKAGE=auto_20191128_14_47_22UTC*/ SELECT * FROM KeyValue;
Configura las opciones del optimizador cuando se usa el controlador JDBC de Spanner
Puedes anular el valor predeterminado de la versión del optimizador y el paquete de estadísticas si especificas opciones en la string de conexión de JDBC como se muestra en el siguiente ejemplo.
Estas opciones solo son compatibles con las versiones más recientes del controlador JDBC de Spanner.
También puedes configurar la versión del optimizador de consultas con la declaración SET OPTIMIZER_VERSION
como se muestra en el siguiente ejemplo.
Para obtener más detalles sobre cómo usar el controlador de código abierto, consulta Usa el controlador JDBC de código abierto.
Cómo se controlan las versiones del optimizador no válidas
Spanner admite un rango de versiones del optimizador.
Este rango cambia con el tiempo cuando se actualiza el optimizador de consultas. Si la versión que especificas está fuera del rango, la consulta falla. Por ejemplo, si intentas ejecutar una consulta con la sugerencia @{OPTIMIZER_VERSION=7}
, pero el número de versión más reciente del optimizador es solo 6
, Spanner responde con este mensaje de error:
Query optimizer version: 7 is not
supported
Controla una configuración del paquete de estadísticas del optimizador no válida
Puedes fijar tu base de datos o consulta en cualquier paquete de estadísticas disponible mediante uno de los métodos descritos anteriormente en esta página. Una consulta falla si se proporciona un nombre de paquete de estadísticas no válido. Un paquete de estadísticas especificado por una consulta debe ser uno de los siguientes:
Determina la versión del optimizador de consultas que se usa para ejecutar una consulta
La versión del optimizador que se usa para una consulta se puede ver a través de la consola de Google Cloud y en Google Cloud CLI.
Consola de Google Cloud
Para ver la versión del optimizador que se usa en una consulta, ejecuta tu consulta en la página de Spanner Studio de la consola de Google Cloud y, luego, selecciona la pestaña Explicación. Deberías ver un mensaje similar al siguiente:
Versión del optimizador de consultas: 6
gcloud CLI
Para ver la versión que se usa cuando se ejecuta una consulta en gcloud CLI, establece
la marca --query-mode
en PROFILE
, como se muestra en el siguiente fragmento.
gcloud spanner databases execute-sql MyDatabase --instance=test-instance \
--query-mode=PROFILE --sql='SELECT * FROM MyTable'
Visualiza la versión del optimizador de consultas en el Explorador de métricas
Cloud Monitoring recopila medidas para ayudarte a comprender el rendimiento de las aplicaciones y los servicios del sistema. Una de las métricas recopiladas para Spanner es el recuento de consultas, que mide la cantidad de consultas en una instancia, que se muestrea a lo largo del tiempo. Si bien esta métrica es muy útil para ver las consultas agrupadas por código de error, también podemos usarla para ver qué versión del optimizador se usó para ejecutar cada consulta.
Puedes usar el Explorador de métricas en la consola de Google Cloud para visualizar el Recuento de consultas de tu instancia de base de datos. En la figura 1, se muestra el recuento de consultas para tres bases de datos. Puedes ver qué versión del optimizador se usa en cada base de datos.
En la tabla debajo del gráfico de esta figura, se muestra que my-db-1
intentó ejecutar una consulta con una versión de optimizador no válida, lo que mostró el estado Uso inadecuado y dio como resultado un recuento de consultas de 0. Las otras bases de datos ejecutaban consultas con las versiones 1 y 2 del optimizador, respectivamente.
Figura 1. Recuento de consultas que se muestra en el Explorador de métricas con consultas agrupadas por versión del optimizador.
Si deseas configurar un gráfico similar para tu instancia, sigue estos pasos:
- Navega al Explorador de métricas en la consola de Google Cloud.
- En el campo Tipo de recurso, selecciona
Cloud Spanner Instance
. - En el campo Métrica, selecciona
Count of queries
. - En el campo Agrupar por, selecciona
database
,optimizer_version
ystatus
.
En este ejemplo, no se muestra el caso en el que se utiliza una versión diferente del optimizador para diferentes consultas en la misma base de datos. En ese caso, el gráfico mostraría un segmento de barras para cada combinación de versión de base de datos y optimizador.
Si quieres aprender a usar Cloud Monitoring para supervisar las instancias de Spanner, consulta Supervisa con Cloud Monitoring.