Slots

Ein BigQuery-Slot ist eine Rechenkapazitätseinheit, die zum Ausführen von SQL-Abfragen erforderlich ist. BigQuery berechnet automatisch je nach Größe und Komplexität der Abfrage, wie viele Slots für jede Abfrage erforderlich sind.

Weitere Informationen zum Slotkontingent pro Projekt finden Sie unter Kontingentrichtlinie für Abfragen.

Für die meisten Nutzer ist die Standard-Slotkapazität mehr als ausreichend. Der Zugang zu mehr Slots gewährleistet keine Beschleunigung einzelner Abfragen. Bei sehr großen oder sehr komplexen Abfragen sowie bei hohen gleichzeitigen Arbeitslasten kann ein größerer Slotpool jedoch die Leistung verbessern. Informationen über die Anzahl der von Ihrem Konto genutzten Slots finden Sie unter BigQuery-Monitoring.

BigQuery verwaltet das Slotkontingent anhand von Verlauf, Nutzung und Ausgaben des Kunden automatisch. Für Kunden, die gleichbleibende monatliche Analysekosten wünschen, bietet BigQuery Pauschalpreise an.

Wenn Sie sich für ein Pauschalpreismodell entscheiden, erwerben Sie für die Abfrageverarbeitung eine bestimmte Anzahl an Slots. Die Zuteilung von Slots können Sie für alle Projekte, die mit dem jeweiligen Rechnungskonto verknüpft sind, nach Standort angeben. Wenden Sie sich an Ihren Vertriebsmitarbeiter, wenn Sie sich für Pauschalpreise interessieren.

Abfrage mit Slots ausführen

Bei der Ausführung eines Abfragejobs in BigQuery wird die deklarative SQL-Anweisung in einen Ausführungsgraphen umgewandelt. Dieser wird in mehrere Abfragephasen aufgeteilt, die sich wiederum aus detaillierten Ausführungsschritten zusammensetzen. BigQuery nutzt zum Ausführen dieser Abfragen eine stark verteilte parallele Architektur. In den Phasen werden dabei die Arbeitseinheiten modelliert, die viele potenzielle Worker parallel ausführen können. Über eine schnelle verteilte Shuffle-Architektur kommunizieren die Phasen miteinander. Diese wird an anderer Stelle ausführlicher erläutert.

Das Ausführen von Abfragen erfolgt in BigQuery dynamisch. Das bedeutet, der Abfrageplan kann sich während einer laufenden Abfrage ändern. Häufig werden bei der Ausführung einer Abfrage Phasen eingeführt, um die Datenverteilung auf die Worker der Abfrage zu verbessern.

BigQuery kann mehrere Phasen gleichzeitig ausführen. BigQuery kann eine spekulative Ausführung nutzen, um eine Abfrage zu beschleunigen, und eine Phase dynamisch neu partitionieren, um eine optimale Parallelisierung zu erzielen.

In jeder Phase der Abfrage werden die einzelnen Arbeitseinheiten von BigQuery-Slots ausgeführt. Wenn BigQuery beispielsweise feststellt, dass der optimale Parallelisierungsfaktor einer Phase 10 beträgt, fordert es 10 Slots an, um diese Phase zu verarbeiten.

Abfrageslots.

Eine BigQuery-SQL-Abfrage ist ein dynamischer DAG

Abfragen entsprechend der Slotressourcen ausführen

Wenn eine Abfrage mehr Slots benötigt als verfügbar sind, stellt BigQuery einzelne Arbeitseinheiten in die Warteschlange und wartet auf verfügbare Slots. Während der Ausführung der Abfragen werden diese zurückgestellten Arbeitseinheiten dynamisch für die Ausführung ausgewählt.

BigQuery kann für eine bestimmte Phase einer Abfrage eine beliebige Anzahl an Slots anfordern. Die Anzahl der angeforderten Slots hat nichts mit der Kapazität zu tun, die Sie erwerben, sondern weist eher auf den optimalen Parallelisierungsfaktor hin, den BigQuery für diese Phase ausgewählt hat. Arbeitseinheiten werden in die Warteschlange aufgenommen und ausgeführt, sobald Slots verfügbar werden.

Überschreiten Abfrageanforderungen die von Ihnen erworbenen Slots, werden Ihnen keine zusätzlichen Slots in Rechnung gestellt und Ihnen wird kein zusätzlicher On-Demand-Preis berechnet. Stattdessen werden Ihre Arbeitseinheiten einfach in die Warteschlange verschoben.

Beispiel:

  1. In einer Abfragephase werden 2.000 Slots angefordert, es sind jedoch nur 1.000 verfügbar.
  2. BigQuery nutzt alle 1.000 Slots, während die verbleibenden Arbeitseinheiten in der Warteschlange auf die übrigen 1.000 Slots warten.
  3. Wurde die Arbeit von 100 Slots ausgeführt, werden diese dynamisch an 100 Arbeitseinheiten von den 1.000 Arbeitseinheiten in der Warteschlange vergeben. 900 Arbeitseinheiten verbleiben in der Warteschlange.
  4. Ist dann die Arbeit von 500 weiteren Slots erledigt, werden 500 Arbeitseinheiten dieser 900 Arbeitseinheiten dynamisch aus der Warteschlange genommen. 400 Arbeitseinheiten verbleiben in der Warteschlange.
  5. Und so weiter.

Slotplanung.

BigQuery-Slots in der Warteschlange – der Bedarf übersteigt die Verfügbarkeit

Faire Planung in BigQuery

BigQuery nutzt faire Planung, um den verschiedenen Abfragen Ressourcen zuzuweisen. Das heißt, dass jede Abfrage jederzeit den gleichen Zugriff auf alle verfügbaren Slots hat und die Kapazität dynamisch und automatisch zwischen den aktiven Abfragen neu zugewiesen wird, wenn sich die Kapazitätsanforderungen der Abfragen ändert. Unter den folgenden Bedingungen werden Abfragen abgeschlossen und neue Abfragen zur Ausführung gesendet:

  • Wenn eine neue Abfrage gesendet wurde, wird die Kapazität automatisch neu an die ausgeführten Abfragen zugewiesen. Einzelne Arbeitseinheiten können unterbrochen, fortgesetzt und in die Warteschlange aufgenommen werden, je nachdem, wie viel Kapazität für die einzelnen Abfragen zur Verfügung steht.
  • Sobald eine Abfrage abgeschlossen wurde, wird die von dieser Abfrage genutzte Kapazität für alle anderen Abfragen verfügbar.
  • Wenn sich die Kapazitätsanforderungen einer Abfrage aufgrund von Änderungen im dynamischen DAG der Abfrage ändern, bewertet BigQuery die Kapazitätsverfügbarkeit für diese und alle anderen Abfragen automatisch neu. Wenn nötig, werden Slots neu zugewiesen oder unterbrochen.

Planung mehrerer Abfragen.

Faire Planung in BigQuery

Je nach Komplexität und Größe benötigt eine Abfrage eventuell nicht alle Slots, die ihr zustehen, oder sie benötigt mehr. BigQuery stellt unter Beachtung der fairen Planung dynamisch sicher, dass alle Slots jederzeit voll genutzt werden können.