Auf dieser Seite wird beschrieben, wie Sie den Abfrageoptimierer in Spanner für Datenbanken mit GoogleSQL-Dialekt und Datenbanken mit PostgreSQL-Dialekt verwalten.
Der Spanner-Abfrageoptimierer ermittelt die effizienteste Methode zum Ausführen einer SQL-Abfrage. Der vom Optimierungstool ermittelte Abfrageplan kann sich jedoch geringfügig ändern, wenn sich das Abfrageoptimierungstool weiterentwickelt oder die Datenbankstatistiken aktualisiert werden. Um das Risiko einer Leistungsregression zu minimieren, wenn sich das Abfrageoptimierungstool oder die Statistik ändern, bietet Spanner die folgenden Abfrageoptionen.
optimizer_version: Änderungen am Abfrageoptimierungstool werden gebündelt und als Optimierungstoolversionen veröffentlicht. Spanner verwendet die neueste Version des Optimierungstools mindestens 30 Tage nach der Veröffentlichung dieser Version als Standard. Mit der Option für die Version des Abfrageoptimierungstools können Sie Abfragen für eine ältere Version des Optimierungstools ausführen.
optimizer_statistics_package: Spanner aktualisiert die Statistiken des Optimierers regelmäßig. Neue Statistiken werden als Paket zur Verfügung gestellt. Mit dieser Abfrageoption wird ein Statistikpaket für das Abfrageoptimierungstool angegeben, das beim Kompilieren einer SQL-Abfrage verwendet werden soll. Für das angegebene Paket muss die automatische Speicherbereinigung deaktiviert sein:
GoogleSQL
ALTER STATISTICS <package_name> SET OPTIONS (allow_gc=false)
PostgreSQL
ALTER STATISTICS spanner."<package_name>" SET OPTIONS (allow_gc = true)
In dieser Anleitung wird gezeigt, wie Sie diese einzelnen Optionen in Spanner auf verschiedenen Bereichen festlegen.
Optionen für die Abfrageoptimierung auflisten
In Spanner werden Informationen zu den verfügbaren Optimizer-Versionen und Statistikpaketen gespeichert, die Sie auswählen können.
Optimierungsversionen
Die Version des Abfrageoptimierungstools ist ein ganzzahliger Wert, der bei jeder Aktualisierung um 1 erhöht wird. Die neueste Version des Abfrageoptimierungstools ist 8.
Führen Sie die folgende SQL-Anweisung aus, damit eine Liste aller unterstützten Versionen des Optimierungstools zusammen mit den entsprechenden Releasedaten und Informationen dazu zurückgegeben wird, ob die Version die Standardversion ist. Die größte zurückgegebene Versionsnummer ist die neueste unterstützte Version des Optimierungstools.
SELECT * FROM SPANNER_SYS.SUPPORTED_OPTIMIZER_VERSIONS;
Standardversion
Standardmäßig verwendet Spanner die neueste Version des Optimierungstools mindestens 30 Tage nach der Veröffentlichung dieser Version. Während dieses Zeitraums von mehr als 30 Tagen zwischen dem neuen Release und der Übernahme dieses Releases als Standard sollten Sie Abfragen mit der neuen Version testen, um eventuelle Regressionen zu erkennen.
Führen Sie die folgende SQL-Anweisung aus, um die Standardversion zu finden:
SELECT * FROM SPANNER_SYS.SUPPORTED_OPTIMIZER_VERSIONS;
Die Abfrage gibt eine Liste aller unterstützten Versionen des Optimierungstools zurück. In der Spalte IS_DEFAULT
wird angegeben, welche Version die aktuelle Standardversion ist.
Weitere Informationen zu den einzelnen Versionen finden Sie unter Versionsverlauf des Abfrageoptimierungstools.
Statistikpakete für das Optimierungstool
Jedes neue Statistikpaket des Optimierungstools, das von Spanner erstellt wird, erhält einen Paketnamen, der in der jeweiligen Datenbank garantiert eindeutig ist.
Das Format des Paketnamens ist auto_{PACKAGE_TIMESTAMP}UTC
.
In GoogleSQL wird mit der ANALYZE
-Anweisung die Erstellung des Statistikpaketnamens ausgelöst. In PostgreSQL wird diese Aufgabe mit der Anweisung ANALYZE
ausgeführt. Das Format des Statistikpaketnamens ist analyze_{PACKAGE_TIMESTAMP}UTC
, wobei {PACKAGE_TIMESTAMP}
der Zeitstempel in der UTC-Zeitzone ist, zu dem die Erstellung der Statistiken begonnen hat. Führen Sie die folgende SQL-Anweisung aus, damit eine Liste aller verfügbaren Statistikpakete des Optimierungstools zurückgegeben wird.
SELECT * FROM INFORMATION_SCHEMA.SPANNER_STATISTICS;
Standardmäßig verwendet Spanner das neueste Statistikpaket für das Abfrageoptimierungstool, sofern die Datenbank oder Abfrage nicht mit einer der auf dieser Seite beschriebenen Methoden an ein älteres Paket angepinnt ist.
Rangordnung der Optionsüberschreibung
Wenn Sie eine Datenbank mit GoogleSQL-Dialekt verwenden, bietet Spanner mehrere Möglichkeiten, die Optionen des Optimierungstools zu ändern. Sie können beispielsweise die Option(en) für eine bestimmte Abfrage festlegen oder die Option in der Clientbibliothek auf Prozess- oder Abfrageebene konfigurieren. Wenn eine Option auf mehrere Arten festgelegt wird, gilt die folgende Rangordnung. Wählen Sie einen Link aus, um zu diesem Abschnitt in diesem Dokument zu springen.
Spanner-Standardeinstellung ← Datenbankoption ← Client-App ← Umgebungsvariable ← Client-Abfrage ← Anweisungshinweis
So interpretieren Sie beispielsweise die Prioritätsreihenfolge beim Festlegen der Version des Abfrageoptimierers:
Wenn Sie eine Datenbank erstellen, wird die Standardversion des Optimierungstools von Spanner verwendet. Das Festlegen der Version des Optimierungstools mit einer der oben aufgeführten Methoden hat Vorrang vor allen links daneben stehenden Methoden. Beispielsweise hat das Festlegen des Optimierungstools für eine Anwendung mithilfe einer Umgebungsvariable Vorrang vor allen Werten, die Sie mit der Datenbankoption für die Datenbank festlegen. Das Festlegen der Version des Optimierungstools über einen Anweisungshinweis hat die höchste Priorität für die angegebene Abfrage, wobei der mit einer anderen Methode festgelegte Wert Vorrang hat.
In den folgenden Abschnitten finden Sie weitere Informationen zu den einzelnen Methoden.
Optimierungsoptionen auf Datenbankebene festlegen
Mit dem folgenden DDL-Befehl vom Typ ALTER DATABASE
können Sie die Standardversion des Optimierungstools für eine Datenbank festlegen.
GoogleSQL
ALTER DATABASE MyDatabase
SET OPTIONS (optimizer_version = 8);
PostgreSQL
ALTER DATABASE MyDatabase SET spanner.optimizer_version = 5;
Sie können das Statistikpaket ähnlich festlegen, wie im folgenden Beispiel gezeigt.
GoogleSQL
ALTER DATABASE MyDatabase
SET OPTIONS (optimizer_statistics_package = "auto_20191128_14_47_22UTC");
PostgreSQL
ALTER DATABASE MyDatabase
SET spanner.optimizer_statistics_package = "auto_20191128_14_47_22UTC";
Sie können auch mehrere Optionen gleichzeitig festlegen, wie im folgenden DDL-Befehl gezeigt.
GoogleSQL
ALTER DATABASE MyDatabase
SET OPTIONS (optimizer_version = 8,
optimizer_statistics_package = "auto_20191128_14_47_22UTC");
Sie können ALTER DATABASE
in der gcloud CLI mit dem Befehl gcloud CLI databases ddl update
folgendermaßen ausführen.
GoogleSQL
gcloud spanner databases ddl update MyDatabase --instance=test-instance \
--ddl='ALTER DATABASE MyDatabase SET OPTIONS ( optimizer_version = 8 )'
PostgreSQL
gcloud spanner databases ddl update MyDatabase --instance=test-instance \
--ddl='ALTER DATABASE MyDatabase SET spanner.optimizer_version = 8'
Wenn Sie eine Datenbankoption auf NULL
(in GoogleSQL) oder DEFAULT
(in PostgreSQL) festlegen, wird sie gelöscht und der Standardwert wird verwendet.
Wenn Sie den aktuellen Wert dieser Optionen für eine Datenbank sehen möchten, fragen Sie die Ansicht INFORMATION_SCHEMA.DATABASE_OPTIONS
für GoogleSQL oder die Tabelle information_schema database_options
für PostgreSQL ab.
GoogleSQL
SELECT
s.OPTION_NAME,
s.OPTION_VALUE
FROM
INFORMATION_SCHEMA.DATABASE_OPTIONS s
WHERE
s.SCHEMA_NAME=""
AND s.OPTION_NAME IN ('optimizer_version', 'optimizer_statistics_package')
PostgreSQL
SELECT
s.option_name,
s.option_value
FROM
information_schema.database_options s
WHERE
s.schema_name='public'
AND s.option_name IN ('optimizer_version',
'optimizer_statistics_package')
Optionen des Optimierungstools mit Clientbibliotheken festlegen
Wenn Sie programmgesteuert über Clientbibliotheken mit Spanner interagieren, gibt es mehrere Möglichkeiten, um die Abfrageoptionen für Ihre Clientanwendung zu ändern.
Sie müssen die neuesten Versionen der Clientbibliotheken verwenden, um Optimierungsoptionen festzulegen.
Optionen des Optimierungstools für einen Datenbankclient festlegen
Eine Anwendung kann Optimierungsoptionen global für die Clientbibliothek festlegen. Dazu wird die Eigenschaft der Abfrageoptionen wie in den folgenden Code-Snippets konfiguriert. Die Einstellungen des Optimierungstools werden in der Client-Instanz gespeichert und auf alle Abfragen angewendet, die während der Lebensdauer des Clients ausgeführt werden. Auch wenn die Optionen auf Datenbankebene im Back-End gelten, gelten die Optionen auf Client-Ebene für alle Datenbanken, die über diesen Client verbunden sind.
C++
C#
Go
Java
Node.js
PHP
Python
Ruby
Optimierungsoptionen mit Umgebungsvariablen festlegen
Damit Sie verschiedene Optimierungseinstellungen einfacher ausprobieren können, ohne die Anwendung neu kompilieren zu müssen, können Sie die Umgebungsvariablen SPANNER_OPTIMIZER_VERSION
und SPANNER_OPTIMIZER_STATISTICS_PACKAGE
festlegen und die Anwendung ausführen, wie im folgenden Snippet gezeigt.
Linux/macOS
export SPANNER_OPTIMIZER_VERSION="8"
export SPANNER_OPTIMIZER_STATISTICS_PACKAGE="auto_20191128_14_47_22UTC"
Windows
set SPANNER_OPTIMIZER_VERSION="8"
set SPANNER_OPTIMIZER_STATISTICS_PACKAGE="auto_20191128_14_47_22UTC"
Die angegebenen Werte für die Optionen des Abfrageoptimierungstools werden zum Zeitpunkt der Client-Initialisierung in der Client-Instanz gelesen und gespeichert und auf alle Abfragen angewendet, die während der Lebensdauer des Clients ausgeführt werden.
Optionen des Optimierungstools für eine Client-Abfrage festlegen
Sie können einen Wert für die Optimierungsversion oder die Version des Statistikpakets auf Abfrageebene in Ihrer Clientanwendung angeben, wenn Sie beim Erstellen der Abfrage eine Eigenschaft für die Abfrageoptionen angeben.
C++
C#
Go
Java
Node.js
PHP
Python
Ruby
Optimierungsoptionen für eine Abfrage mithilfe eines Anweisungshinweises festlegen
Ein Anweisungshinweis ist ein Hinweis auf eine Abfrageanweisung, durch den die Ausführung der Abfrage vom Standardverhalten abweicht. Wenn Sie den OPTIMIZER_VERSION
-Hinweis für eine Anweisung festlegen, wird die Ausführung der Abfrage mit der angegebenen Version des Abfrageoptimierungstools erzwungen.
Der OPTIMIZER_VERSION
-Hinweis hat die höchste Priorität in Bezug auf die Version des Optimierungstools. Wenn der Hinweis zur Anweisung angegeben ist, wird er unabhängig von allen anderen Einstellungen der Optimierungstoolversion verwendet.
GoogleSQL
@{OPTIMIZER_VERSION=8} SELECT * FROM MyTable;
PostgreSQL
/*@OPTIMIZER_VERSION=8*/ SELECT * FROM MyTable;
Sie können auch das Literal latest_version verwenden, um die Optimierungsversion für eine Abfrage wie hier gezeigt auf die neueste Version festzulegen.
GoogleSQL
@{OPTIMIZER_VERSION=latest_version} SELECT * FROM MyTable;
PostgreSQL
/*@OPTIMIZER_VERSION=latest_version*/ SELECT * FROM MyTable;
Wenn Sie den OPTIMIZER_STATISTICS_PACKAGE
-Hinweis für eine Anweisung festlegen, wird die Ausführung der Abfrage mit der angegebenen Version des Statistikpakets für das Abfrageoptimierungstool erzwungen. Für das angegebene Paket muss die automatische Speicherbereinigung deaktiviert sein:
GoogleSQL
ALTER STATISTICS <package_name> SET OPTIONS (allow_gc=false)
PostgreSQL
ALTER STATISTICS spanner."package_name" SET OPTIONS (allow_gc=false)
Der OPTIMIZER_STATISTICS_PACKAGE
-Hinweis hat die höchste Priorität in Bezug auf die Einstellung des Optimierungspakets. Wenn der Hinweis zur Anweisung angegeben ist, wird er unabhängig von allen anderen Einstellungen der Optimierungstoolpaketversion verwendet.
@{OPTIMIZER_STATISTICS_PACKAGE=auto_20191128_14_47_22UTC} SELECT * FROM MyTable;
Sie können auch das Literal latest verwenden, um das neueste Statistikpaket zu verwenden.
@{OPTIMIZER_STATISTICS_PACKAGE=latest} SELECT * FROM MyTable;
Beide Hinweise können in einer einzigen Anweisung festgelegt werden, wie im folgenden Beispiel gezeigt.
Mit dem Literal default_version wird die Optimierungsversion für eine Abfrage auf die Standardversion festgelegt, die sich von der neuesten Version unterscheiden kann. Weitere Informationen finden Sie unter Standardversion.
GoogleSQL
@{OPTIMIZER_VERSION=default_version, OPTIMIZER_STATISTICS_PACKAGE=auto_20191128_14_47_22UTC} SELECT * FROM MyTable;
PostgreSQL
/*@OPTIMIZER_VERSION=default_version, OPTIMIZER_STATISTICS_PACKAGE=auto_20191128_14_47_22UTC*/ SELECT * FROM KeyValue;
Optionen des Optimierungstools bei Verwendung des Spanner-JDBC-Treibers festlegen
Sie können den Standardwert der Optimierungstoolversion und des Statistikpakets überschreiben, wenn Sie wie im folgenden Beispiel gezeigt Optionen im JDBC-Verbindungsstring angeben.
Diese Optionen werden nur in den neuesten Versionen des Spanner-JDBC-Treibers unterstützt.
Sie können die Version des Abfrageoptimierungstools auch wie im folgenden Beispiel gezeigt mit der Anweisung SET OPTIMIZER_VERSION
festlegen.
Weitere Informationen zur Verwendung des Open-Source-Treibers finden Sie unter Open-Source-JDBC-Treiber verwenden.
Umgang mit ungültigen Optimierungstoolversionen
Spanner unterstützt mehrere Versionen des Optimierungstools.
Welche Versionen unterstützt werden, ändert sich von Zeit zu Zeit, wenn das Abfrageoptimierungstool aktualisiert wird. Wenn die angegebene Version außerhalb des zulässigen Bereichs liegt, schlägt die Abfrage fehl. Wenn Sie beispielsweise versuchen, eine Abfrage mit dem Anweisungshinweis @{OPTIMIZER_VERSION=9}
auszuführen, die aktuelle Optimierungstoolversion aber nur 8
ist, gibt Spanner die folgende Fehlermeldung zurück:
Query optimizer version: 9 is not
supported
Umgang mit einer ungültigen Einstellung für das Statistikpaket des Optimierungstools
Sie können Ihre Datenbank oder Abfrage an jedes verfügbare Statistikpaket anheften. Verwenden Sie dazu eine der oben auf dieser Seite beschriebenen Methoden. Eine Abfrage schlägt fehl, wenn ein ungültiger Name für das Statistikpaket angegeben wird. Ein Statistikpaket, das in einer Abfrage angegeben ist, muss entweder:
Version des Optimierungstools für Abfragen festlegen, die zum Ausführen einer Abfrage verwendet wird
Die für eine Abfrage verwendete Version des Optimierungstools ist über die Google Cloud Console und in der Google Cloud CLI sichtbar.
Google Cloud console
Führen Sie die Abfrage auf der Seite Spanner Studio der Google Cloud -Konsole aus und wählen Sie dann den Tab Erklärung aus, um die für eine Abfrage verwendete Version des Optimierungstools aufzurufen. Es wird eine Meldung ähnlich der folgenden angezeigt:
Version der Abfrageoptimierung: 8
gcloud-CLI
Wenn Sie die Version aufrufen möchten, die beim Ausführen einer Abfrage in der gcloud CLI verwendet wird, setzen Sie das Flag --query-mode
wie im folgenden Snippet gezeigt auf PROFILE
.
gcloud spanner databases execute-sql MyDatabase --instance=test-instance \
--query-mode=PROFILE --sql='SELECT * FROM MyTable'
Version der Abfrageoptimierung im Metrics Explorer visualisieren
Cloud Monitoring erfasst Messwerte, um die Leistung Ihrer Anwendungen und Systemdienste besser zu verstehen. Einer der für Spanner erfassten Messwerte ist die Anzahl der Abfragen. Damit wird die Anzahl der Abfragen in einer Instanz gemessen, die im Laufe der Zeit erfasst wurden. Dieser Messwert ist zwar sehr hilfreich, um Abfragen aufzurufen, die nach Fehlercode gruppiert sind, wir können ihn aber auch verwenden, um zu sehen, welche Version des Optimierungstools zur Ausführung der einzelnen Abfragen verwendet wurde.
Mit dem Metrics Explorer in derGoogle Cloud Console können Sie die Anzahl der Abfragen für Ihre Datenbankinstanz visualisieren. Abbildung 1 zeigt die Anzahl der Abfragen für drei Datenbanken. Sie können sehen, welche Version des Optimierungstools in den einzelnen Datenbanken verwendet wird.
Die Tabelle unter dem Diagramm in dieser Abbildung zeigt, dass my-db-1
versucht hat, eine Abfrage mit einer ungültigen Optimierungstoolversion auszuführen, was den Status Falsche Nutzung zurückgibt und zu einer Abfrageanzahl von 0 führt. Die anderen Datenbanken haben Abfragen mit den Versionen 1 und 2 des Optimierungstools ausgeführt.
Abbildung 1. Anzahl der Abfragen, die im Metrics Explorer zusammen mit Abfragen angezeigt werden, die nach der Optimierungsversion gruppiert sind.
So richten Sie ein ähnliches Diagramm für Ihre Instanz ein:
- Rufen Sie in der Google Cloud Console den Metrics Explorer auf.
- Wählen Sie im Feld Ressourcentyp
Cloud Spanner Instance
aus. - Wählen Sie im Feld Messwert die Option
Count of queries
aus. - Wählen Sie im Feld Gruppieren nach die Optionen
database
,optimizer_version
undstatus
aus.
In diesem Beispiel wird nicht der Fall gezeigt, bei dem für verschiedene Abfragen in derselben Datenbank eine andere Optimierungstoolversion verwendet wird. In diesem Fall würde das Diagramm ein Balkendiagramm für jede Kombination aus Datenbank- und Optimierungstoolversion zeigen.
Informationen zum Monitoring Ihrer Spanner-Instanzen mit Cloud Monitoring finden Sie unter Monitoring mit Cloud Monitoring.