El optimizador de consultas de Spanner determina la forma más eficiente de ejecutar una consulta en SQL. Sin embargo, el plan de consulta determinado por el optimizador puede cambiar un poco cuando el optimizador de consultas evoluciona o cuando se actualizan las estadísticas de la base de datos. Para minimizar cualquier potencial de regresión de rendimiento cuando cambian el optimizador de consultas o las estadísticas, Spanner proporciona las siguientes opciones de consulta.
optimizer_version: los cambios en el optimizador de consultas se agrupan y lanzan como versiones del optimizador. Spanner comienza a usar la versión más reciente del optimizador como predeterminada al menos 30 días después del lanzamiento de esa versión. Puedes usar la opción de versión del optimizador de consultas para ejecutar consultas en una versión anterior del optimizador.
optimizer_statistics_package: Spanner actualiza las estadísticas del optimizador con regularidad. Las nuevas estadísticas están disponibles como un paquete. Esta opción de consulta especifica un paquete de estadísticas para que el optimizador de consultas lo utilice cuando compile una consulta en SQL. El paquete especificado debe tener inhabilitada la recolección de elementos no utilizados:
GoogleSQL
ALTER STATISTICSSET OPTIONS (allow_gc=false)
PostgreSQL
ALTER STATISTICS spanner."" SET OPTIONS (allow_gc = true)
En esta guía, se muestra cómo configurar estas opciones individuales en diferentes permisos en Spanner.
Mostrar opciones del optimizador de consultas
Spanner almacena información sobre las versiones disponibles del optimizador y los paquetes de estadísticas que puedes seleccionar.
Versiones del optimizador
La versión del optimizador de consultas es un valor de número entero, que se incrementa en 1 con cada actualización. La versión más reciente del optimizador de consultas es la 7.
Ejecuta la siguiente instrucción de SQL para mostrar una lista de todas las versiones compatibles del optimizador, junto con sus fechas de lanzamiento correspondientes y si esa versión es la predeterminada. El número de versión más grande que se muestra es la última versión compatible del optimizador.
SELECT * FROM SPANNER_SYS.SUPPORTED_OPTIMIZER_VERSIONS;
Versión predeterminada
De forma predeterminada, Spanner comienza a usar la versión más reciente del optimizador al menos 30 días después del lanzamiento de esa versión. Durante el período de más de 30 días entre el momento en que una actualización nueva se convierte en la predeterminada y esta se convierte en la predeterminada, te recomendamos que pruebes las consultas en la versión nueva para detectar cualquier regresión.
Para encontrar la versión predeterminada, ejecuta la siguiente instrucción de SQL:
SELECT * FROM SPANNER_SYS.SUPPORTED_OPTIMIZER_VERSIONS;
La consulta muestra una lista de todas las versiones compatibles del optimizador. En la columna IS_DEFAULT
, se especifica qué versión es la predeterminada actual.
Para obtener detalles sobre cada versión, consulta Historial de versiones del optimizador de consultas.
Paquetes de estadísticas del optimizador
A cada paquete de estadísticas del optimizador nuevo que crea Spanner se le asigna un nombre de paquete que garantiza que es único dentro de la base de datos determinada.
El formato del nombre del paquete es auto_{PACKAGE_TIMESTAMP}UTC
.
En GoogleSQL, la instrucción ANALYZE
activa la creación del nombre del paquete de estadísticas. En PostgreSQL, la declaración ANALYZE
realiza esta tarea. El formato del nombre del paquete de estadísticas es analyze_{PACKAGE_TIMESTAMP}UTC
, en el que {PACKAGE_TIMESTAMP}
es la marca de tiempo, en zona horaria UTC, del momento en que comenzó la construcción de las estadísticas. Ejecuta la siguiente instrucción de SQL para mostrar una lista de todos los paquetes de estadísticas del optimizador disponibles.
SELECT * FROM INFORMATION_SCHEMA.SPANNER_STATISTICS;
De forma predeterminada, Spanner usa el paquete de estadísticas más reciente del optimizador, a menos que la base de datos o la consulta se fije a un paquete anterior mediante uno de los métodos descritos en esta página.
Prioridad de anulación de la opción
Si usas una base de datos de dialectos de GoogleSQL, Spanner ofrece varias formas de cambiar las opciones del optimizador. Por ejemplo, puedes establecer las opciones para una consulta específica o configurar la opción en la biblioteca cliente a nivel del proceso o de la consulta. Cuando una opción se configura de varias maneras, se aplica el siguiente orden de prioridad. (Selecciona un vínculo para pasar a esa sección de este documento).
Spanner predeterminado ← opción de base de datos ← app cliente ← variable de entorno ← consulta de cliente ← sugerencia de declaración
Por ejemplo, a continuación, se muestra cómo interpretar el orden de prioridad cuando se configura la versión del optimizador de consultas:
Cuando creas una base de datos, usa la versión del optimizador predeterminada de Spanner. La configuración de la versión del optimizador con uno de los métodos mencionados anteriormente tiene prioridad sobre cualquier elemento a la izquierda. Por ejemplo, configurar el optimizador para una app con una variable de entorno tiene prioridad sobre cualquier valor que configures para la base de datos con la opción de base de datos. La configuración de la versión del optimizador a través de una sugerencia de instrucción tiene la prioridad más alta para la consulta determinada, ya que tiene prioridad sobre el valor establecido con cualquier otro método.
Ahora analicemos cada método con más detalle.
Establece las opciones del optimizador a nivel de la base de datos
Puedes configurar la versión predeterminada del optimizador en una base de datos con el siguiente comando de DDL ALTER DATABASE
.
GoogleSQL
ALTER DATABASE MyDatabase
SET OPTIONS (optimizer_version = 7);
PostgreSQL
ALTER DATABASE MyDatabase SET spanner.optimizer_version = 5;
Puedes configurar el paquete de estadísticas de manera similar, como se muestra en el siguiente ejemplo.
GoogleSQL
ALTER DATABASE MyDatabase
SET OPTIONS (optimizer_statistics_package = "auto_20191128_14_47_22UTC");
PostgreSQL
ALTER DATABASE MyDatabase
SET spanner.optimizer_statistics_package = "auto_20191128_14_47_22UTC";
También puedes configurar más de una opción al mismo tiempo, como se muestra en el siguiente comando de DDL.
GoogleSQL
ALTER DATABASE MyDatabase
SET OPTIONS (optimizer_version = 7,
optimizer_statistics_package = "auto_20191128_14_47_22UTC");
Puedes ejecutar ALTER DATABASE
en gcloud CLI con el comando gcloud CLI databases ddl update
de la siguiente manera.
GoogleSQL
gcloud spanner databases ddl update MyDatabase --instance=test-instance \
--ddl='ALTER DATABASE MyDatabase SET OPTIONS ( optimizer_version = 7 )'
PostgreSQL
gcloud spanner databases ddl update MyDatabase --instance=test-instance \
--ddl='ALTER DATABASE MyDatabase SET spanner.optimizer_version = 7'
Si configuras una opción de base de datos como NULL
(en GoogleSQL) o DEFAULT
(en PostgreSQL), se borra para que se use el valor predeterminado.
Si deseas ver el valor actual de estas opciones para una base de datos, consulta la vista INFORMATION_SCHEMA.DATABASE_OPTIONS
para GoogleSQL o la tabla information_schema database_options
para PostgreSQL, de la siguiente manera.
GoogleSQL
SELECT
s.OPTION_NAME,
s.OPTION_VALUE
FROM
INFORMATION_SCHEMA.DATABASE_OPTIONS s
WHERE
s.SCHEMA_NAME=""
AND s.OPTION_NAME IN ('optimizer_version', 'optimizer_statistics_package')
PostgreSQL
SELECT
s.option_name,
s.option_value
FROM
information_schema.database_options s
WHERE
s.schema_name='public'
AND s.option_name IN ('optimizer_version',
'optimizer_statistics_package')
Establece opciones del optimizador con bibliotecas cliente
Cuando interactúas de manera programática con Spanner a través de bibliotecas cliente, hay varias formas de cambiar las opciones de consulta de la aplicación cliente.
Debes usar las versiones más recientes de las bibliotecas cliente para configurar las opciones del optimizador.
Establece opciones de optimizador para un cliente de base de datos
Una aplicación puede establecer las opciones del optimizador de forma global en la biblioteca cliente configurando la propiedad de opciones de consulta como se muestra en los siguientes fragmentos de código. La configuración del optimizador se almacena en la instancia del cliente y se aplica a todas las consultas ejecutadas durante el ciclo de vida del cliente. Si bien las opciones se aplican a nivel de base de datos en el backend, cuando se establecen a nivel de cliente, se aplican a todas las bases de datos conectadas a ese cliente.
C++
C#
Go
Java
Node.js
PHP
Python
Rita
Establece las opciones del optimizador con variables de entorno
Para que te resulte más fácil probar diferentes configuraciones del optimizador sin tener que volver a compilar tu app, puedes configurar las variables de entorno SPANNER_OPTIMIZER_VERSION
y SPANNER_OPTIMIZER_STATISTICS_PACKAGE
, y ejecutar tu app, como se muestra en el siguiente fragmento.
Linux/macOS
export SPANNER_OPTIMIZER_VERSION="7"
export SPANNER_OPTIMIZER_STATISTICS_PACKAGE="auto_20191128_14_47_22UTC"
Windows
set SPANNER_OPTIMIZER_VERSION="7"
set SPANNER_OPTIMIZER_STATISTICS_PACKAGE="auto_20191128_14_47_22UTC"
Los valores especificados de las opciones del optimizador de consultas se leen y almacenan en la instancia del cliente en el momento de la inicialización y se aplican a todas las consultas ejecutadas durante el ciclo de vida del cliente.
Establece opciones de optimizador para una consulta de cliente
Puedes especificar un valor para la versión del optimizador o la versión del paquete de estadísticas a nivel de la consulta en tu aplicación cliente. Para ello, especifica una propiedad de opciones de consulta cuando compilas tu consulta.
C++
C#
Go
Java
Node.js
PHP
Python
Rita
Establece opciones de optimizador para una consulta con una sugerencia de instrucción
Una sugerencia de instrucción es una sugerencia en una declaración de consulta que cambia la ejecución de la consulta desde el comportamiento predeterminado. Configurar la sugerencia OPTIMIZER_VERSION
en una declaración obliga la ejecución de esa consulta mediante la versión del optimizador de consultas especificada.
La sugerencia OPTIMIZER_VERSION
tiene la prioridad de versión más alta del optimizador. Si se especifica la sugerencia de instrucción, se utilizará independientemente de todas las demás configuraciones de la versión del optimizador.
GoogleSQL
@{OPTIMIZER_VERSION=7} SELECT * FROM MyTable;
PostgreSQL
/*@OPTIMIZER_VERSION=7*/ SELECT * FROM MyTable;
También puedes usar el literal latest_version para configurar la versión del optimizador para una consulta en la versión más reciente, como se muestra aquí.
GoogleSQL
@{OPTIMIZER_VERSION=latest_version} SELECT * FROM MyTable;
PostgreSQL
/*@OPTIMIZER_VERSION=latest_version*/ SELECT * FROM MyTable;
Configurar la sugerencia OPTIMIZER_STATISTICS_PACKAGE
en una declaración obliga a esa consulta a ejecutarse mediante la versión especificada del paquete de estadísticas del optimizador de consultas. El paquete especificado debe tener inhabilitada la recolección de elementos no utilizados:
GoogleSQL
ALTER STATISTICS <package_name> SET OPTIONS (allow_gc=false)
PostgreSQL
ALTER STATISTICS spanner."package_name" SET OPTIONS (allow_gc=false)
La sugerencia OPTIMIZER_STATISTICS_PACKAGE
tiene la prioridad más alta de configuración del paquete del optimizador. Si se especifica la sugerencia de instrucción, se usará independientemente de todas las demás opciones de configuración de la versión del paquete del optimizador.
@{OPTIMIZER_STATISTICS_PACKAGE=auto_20191128_14_47_22UTC} SELECT * FROM MyTable;
También puedes usar el literal latest para usar el paquete de estadísticas más reciente.
@{OPTIMIZER_STATISTICS_PACKAGE=latest} SELECT * FROM MyTable;
Ambas sugerencias se pueden configurar en una sola sentencia, como se muestra en el siguiente ejemplo.
El literal default_version configura la versión del optimizador para una consulta como la versión predeterminada, que puede ser diferente de la última versión. Consulta Versión predeterminada para obtener más detalles.
GoogleSQL
@{OPTIMIZER_VERSION=default_version, OPTIMIZER_STATISTICS_PACKAGE=auto_20191128_14_47_22UTC} SELECT * FROM MyTable;
PostgreSQL
/*@OPTIMIZER_VERSION=default_version, OPTIMIZER_STATISTICS_PACKAGE=auto_20191128_14_47_22UTC*/ SELECT * FROM KeyValue;
Establecer las opciones del optimizador cuando se usa el controlador JDBC de Spanner
Puedes anular el valor predeterminado de la versión del optimizador y el paquete de estadísticas si especificas opciones en la string de conexión de JDBC, como se muestra en el siguiente ejemplo.
Estas opciones solo son compatibles con las últimas versiones del controlador JDBC de Spanner.
También puedes configurar la versión del optimizador de consultas con la declaración SET OPTIMIZER_VERSION
, como se muestra en el siguiente ejemplo.
Para obtener más detalles sobre el uso del controlador de código abierto, consulta Usa el controlador JDBC de código abierto.
Cómo se controlan las versiones del optimizador no válidas
Spanner admite un rango de versiones del optimizador.
Este rango cambia con el tiempo cuando se actualiza el optimizador de consultas. Si la versión que especificas está fuera del rango, la consulta falla. Por ejemplo, si intentas ejecutar una consulta con la sugerencia de instrucción @{OPTIMIZER_VERSION=8}
, pero el número de versión más reciente del optimizador es solo 7
, Spanner responde con este mensaje de error:
Query optimizer version: 8 is not
supported
Controla una configuración no válida del paquete de estadísticas del optimizador
Puedes fijar tu base de datos o consulta a cualquier paquete de estadísticas disponible mediante uno de los métodos descritos anteriormente en esta página. Una consulta falla si se proporciona un nombre de paquete de estadísticas no válido. Un paquete de estadísticas especificado por una consulta debe tener alguno de los siguientes estados:
Determina la versión del optimizador de consultas que se usa para ejecutar una consulta
La versión del optimizador que se usa para una consulta es visible en la consola de Google Cloud y en Google Cloud CLI.
Consola de Google Cloud
Para ver la versión del optimizador que se usó para una consulta, ejecuta tu consulta en la página de Spanner Studio de la consola de Google Cloud y, luego, selecciona la pestaña Explicación. Deberías ver un mensaje similar al siguiente:
Versión del optimizador de consultas: 7
gcloud CLI
Para ver la versión que se usa cuando se ejecuta una consulta en gcloud CLI, establece la marca --query-mode
en PROFILE
, como se muestra en el siguiente fragmento.
gcloud spanner databases execute-sql MyDatabase --instance=test-instance \
--query-mode=PROFILE --sql='SELECT * FROM MyTable'
Visualiza la versión del optimizador de consultas en el Explorador de métricas
Cloud Monitoring recopila medidas para ayudarte a comprender el rendimiento de las aplicaciones y los servicios del sistema. Una de las métricas recopiladas para Spanner es el recuento de consultas, que mide la cantidad de consultas en una instancia, que se muestrearon a lo largo del tiempo. Si bien esta métrica es muy útil para ver las consultas agrupadas por código de error, también podemos usarla para ver qué versión del optimizador se usó para ejecutar cada consulta.
Puedes usar el Explorador de métricas en la consola de Google Cloud para visualizar el Recuento de consultas de tu instancia de base de datos. En la Figura 1, se muestra el recuento de consultas para tres bases de datos. Puedes ver qué versión del optimizador se usa en cada base de datos.
En la tabla debajo del gráfico de esta figura, se muestra que my-db-1
intentó ejecutar una consulta con una versión del optimizador no válida, que mostró el estado Uso inadecuado y dio como resultado un recuento de consultas de 0. Las otras bases de datos ejecutaron consultas con las versiones 1 y 2 del optimizador, respectivamente.
Figura 1. Recuento de consultas que se muestra en el Explorador de métricas con consultas agrupadas por versión del optimizador.
Si deseas configurar un gráfico similar para tu instancia, sigue estos pasos:
- Navega al Explorador de métricas en la consola de Google Cloud.
- En el campo Tipo de recurso, selecciona
Cloud Spanner Instance
. - En el campo Métrica, selecciona
Count of queries
. - En el campo Agrupar por, selecciona
database
,optimizer_version
ystatus
.
No se muestra en este ejemplo cuando se usa una versión diferente del optimizador para distintas consultas en la misma base de datos. En ese caso, el gráfico mostraría un segmento de barra para cada combinación de base de datos y versión del optimizador.
Si deseas aprender a usar Cloud Monitoring para supervisar tus instancias de Spanner, consulta cómo supervisar con Cloud Monitoring.