Diese Seite wurde von der Cloud Translation API übersetzt.

Cloud Tasks-Warteschlangen konfigurieren

Sie können die Cloud Tasks-Warteschlange während ihrer Erstellung oder später konfigurieren. Die Konfiguration gilt für alle Aufgaben in dieser Warteschlange.

Beim Konfigurieren von Warteschlangen sind drei grundlegende Aspekte zu berücksichtigen:

E-Mail-Routing
Ratenlimits
Wiederholungsparameter

Routing auf Warteschlangenebene konfigurieren

Wenn Sie das Routing auf Warteschlangenebene konfigurieren, wird das Routing auf Aufgabenebene überschrieben. Das ist nützlich, wenn Sie Cloud Tasks als Puffer vor Ihrem Zieldienst verwenden möchten oder wenn Sie das Routing für alle Aufgaben in einer Warteschlange ändern müssen.

Routing auf Warteschlangenebene gilt für:

Aufgaben in der Warteschlange
Aufgaben, die der Warteschlange hinzugefügt werden, nachdem das Routing auf Warteschlangenebene festgelegt wurde

Beschränkungen

Die Weiterleitung auf Warteschlangenebene ist nicht mit vom Kunden verwalteten Verschlüsselungsschlüsseln (CMEK) von Cloud Key Management Service (Cloud KMS) kompatibel. Wenn CMEK aktiviert ist, können Sie Folgendes nicht tun:

Aufgaben in einer Warteschlange mit Routing auf Warteschlangenebene erstellen
Routing auf Warteschlangenebene anwenden

Routing auf Warteschlangenebene für HTTP-Aufgaben konfigurieren

Sie können eine Warteschlange so konfigurieren, dass das Routing auf Aufgabenebene überschrieben wird. Dies ist entweder beim Erstellen oder beim Aktualisieren der Warteschlange möglich. Wenn Sie das Routing auf Warteschlangenebene konfigurieren möchten, legen Sie den Parameter uriOverride der Warteschlange auf die gewünschte Route fest.

Wenn Sie das Routing auf Warteschlangenebene als Aktualisierung einer vorhandenen Warteschlange anwenden, pausieren Sie die Warteschlange, bevor Sie die Änderungen anwenden, und warten Sie eine Minute nach dem Anwenden der Änderungen, bevor Sie die Warteschlange fortsetzen.

Warteschlange pausieren Führen Sie den folgenden Befehl aus:
```
  gcloud tasks queues pause QUEUE_ID
  
```
Ersetzen Sie QUEUE_ID durch die ID Ihrer Warteschlange.
Warteschlangenbasiertes Routing aktualisieren oder entfernen
- Wenn Sie das Routing auf Warteschlangenebene aktualisieren möchten, legen Sie den Parameter uriOverride auf den aktualisierten Pfad fest.
- So entfernen Sie das Routing auf Warteschlangenebene mit der REST API oder RPC API:
  - REST API:Senden Sie eine patch-Anfrage für die Warteschlange mit einer leeren Nutzlast und dem Parameter updateMask, der auf httpTarget festgelegt ist.
  - RPC API:Senden Sie einen updateQueueRequest-Befehl für die Warteschlange mit einer leeren Nutzlast und dem Parameter update_mask auf http_target.
Im folgenden Beispiel wird die REST API verwendet, um den Host zu aktualisieren, an den Aufgaben weitergeleitet werden:
```
curl -X PATCH -d @- -i \
  -H "Authorization: Bearer ACCESS_TOKEN" \
  -H "Content-Type: application/json" \
  "https://cloudtasks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/queues/QUEUE_ID?updateMask=httpTarget.uriOverride" << EOF
{
  "httpTarget": {"uriOverride":{"host":"NEW_HOST"}}
}
EOF
```
Ersetzen Sie Folgendes:
- ACCESS_TOKEN: Ihr Zugriffstoken. Sie können sie abrufen, indem Sie im Terminal Folgendes ausführen:
```
gcloud auth application-default login
gcloud auth application-default print-access-token
```
- PROJECT_ID: die ID Ihres Google Cloud Projekts. Sie können sie abrufen, indem Sie im Terminal Folgendes ausführen:
```
gcloud config get-value project
```
- LOCATION: Der Standort Ihrer Warteschlange.
- NEW_HOST: Der neue Host, an den Ihre Warteschlange weitergeleitet werden soll.
Warte eine Minute.

Es kann bis zu einer Minute dauern, bis die neue Konfiguration wirksam wird. Wenn Sie warten, bis die Warteschlange fortgesetzt wird, wird verhindert, dass Aufgaben mit der alten Konfiguration gesendet werden.
Setzen Sie die Warteschlange mit dem folgenden Befehl fort:
```
gcloud tasks queues resume QUEUE_ID
```

Routing auf Warteschlangenebene für App Engine-Aufgaben konfigurieren

Wenn Sie das Routing auf Warteschlangenebene für App Engine-Aufgaben konfigurieren möchten, legen Sie den Parameter appEngineRoutingOverride der Warteschlange auf den gewünschten App Engine-Dienst und die gewünschte Version fest.

So richten Sie das Routing auf Warteschlangenebene ein und überschreiben das Routing auf Aufgabenebene:
```
gcloud tasks queues update QUEUE_ID \
    --routing-override=service:SERVICE,version:VERSION
```
Ersetzen Sie Folgendes:
- QUEUE_ID: Die Warteschlangen-ID (Kurzname).
- SERVICE: Der für die Aufgabenverarbeitung zuständige App Engine-Worker-Dienst.
- VERSION: Die App-Version.
Wenn Sie beispielsweise einen Worker-Dienst einrichten, um alle Aufgaben in einer Warteschlange zu verarbeiten, können Sie das Routing an diesen Dienst und die Standardversion so konfigurieren:
```
gcloud tasks queues update QUEUE_ID \
    --routing-override=service:SERVICE
```

Prüfen Sie mit dem folgenden Befehl, ob die Warteschlange erfolgreich konfiguriert wurde:

gcloud tasks queues describe QUEUE_ID --location=LOCATION

Ersetzen Sie LOCATION durch den Speicherort der Warteschlange.

Die Ausgabe sollte in etwa so aussehen:

appEngineRoutingOverride:
  host: SERVICE.PROJECT_ID.appspot.com
  service: SERVICE
name: projects/PROJECT_ID/locations/LOCATION_ID/queues/QUEUE_ID
rateLimits:
  maxBurstSize: 100
  maxConcurrentDispatches: 1000
  maxDispatchesPerSecond: 500.0
retryConfig:
  maxAttempts: 100
  maxBackoff: 3600s
  maxDoublings: 16
  minBackoff: 0.100s
state: RUNNING

Führen Sie den folgenden Befehl aus, um das Routing auf Warteschlangenebene zu entfernen:
```
gcloud tasks queues update QUEUE_ID \
    --clear-routing-override
```
Wenn das Routing auf Warteschlangenebene entfernt wird, wird das Routing auf Aufgabenebene auf Aufgaben in der Warteschlange und auf Aufgaben angewendet, die der Warteschlange in Zukunft hinzugefügt werden.

Definieren Sie Ratenlimits

Das Ratenlimit bestimmt die maximale Rate, mit der Aufgaben von einer Warteschlange weitergeleitet werden können, unabhängig davon, ob es sich um den ersten Versuch oder einen Wiederholungsversuch handelt.

Legen Sie die maximale Rate und die Anzahl gleichzeitiger Aufgaben fest, die von einer Warteschlange weitergeleitet werden können, indem Sie den folgenden Befehl ausführen:
```
gcloud tasks queues update QUEUE_ID \
    --max-dispatches-per-second=DISPATCH_RATE \
    --max-concurrent-dispatches=MAX_CONCURRENT_DISPATCHES
```
Ersetzen Sie Folgendes:
- QUEUE_ID: Die Warteschlangen-ID (Kurzname).
- DISPATCH_RATE: die Versandrate. Dies ist die Rate, zu der Tokens im Bucket aktualisiert werden. Bei Bedingungen mit einem relativ gleichmäßigen Aufgabenfluss entspricht dies der Rate, mit der Aufgaben weitergeleitet werden.
- MAX_CONCURRENT_DISPATCHES: die maximale Anzahl von Aufgaben in der Warteschlange, die gleichzeitig ausgeführt werden können.
Wenn Sie beispielsweise eine Warteschlange erstellt haben, ohne Parameter festzulegen, können Sie die maximale Anzahl gleichzeitiger Aufgaben mit dem folgenden Befehl aktualisieren:
```
gcloud tasks queues update QUEUE_ID \
    --max-concurrent-dispatches=MAX_CONCURRENT_DISPATCHES
```

Prüfen Sie mit dem folgenden Befehl, ob die Warteschlange erfolgreich konfiguriert wurde:

gcloud tasks queues describe QUEUE_ID --location=LOCATION

Ersetzen Sie LOCATION durch den Speicherort der Warteschlange.

Die Ausgabe sollte in etwa so aussehen:

name: projects/PROJECT_ID/locations/LOCATION_ID/queues/QUEUE_ID
rateLimits:
  maxBurstSize: 100
  maxConcurrentDispatches: MAX_CONCURRENT_DISPATCHES
  maxDispatchesPerSecond: 500.0
retryConfig:
  maxAttempts: 100
  maxBackoff: 3600s
  maxDoublings: 16
  minBackoff: 0.100s
state: RUNNING

Methoden zum Definieren von Verarbeitungsraten für Warteschlangen

Sie können die Verarbeitungsraten für Warteschlangen entweder über die Cloud Tasks API oder durch Hochladen einer queue.yaml-Datei definieren. Beide Methoden führen zu Warteschlangen mit demselben zugrunde liegenden Mechanismus.

In beiden Fällen verwendet die Warteschlange den Token-Bucket-Algorithmus, um die Rate der Aufgabenausführung zu steuern. Jede benannte Warteschlange hat einen Bucket, der ihre Tokens enthält.

Jedes Mal, wenn Ihre Anwendung eine Aufgabe ausführt, wird ein Token aus dem Bucket entfernt. Die Warteschlange verarbeitet weiterhin Aufgaben, bis keine Tokens mehr im Bucket vorhanden sind. Das System füllt den Bucket auf der Grundlage der max_dispatches_per_second-Rate, die Sie für die Warteschlange festlegen, kontinuierlich mit neuen Tokens auf. Wenn Ihre Warteschlange zu verarbeitende Aufgaben und der Bucket der Warteschlange Tokens enthält, verarbeitet das System gleichzeitig dieselbe Anzahl von Aufgaben und Tokens bis zu dem von Ihnen festgelegten Wert max_concurrent_dispatches.

Ein ungleichmäßiger Ladevorgang kann dazu führen, dass die Anzahl der Tokens im Bucket erheblich anwächst, was zu Bursts der Verarbeitung führen kann, wenn dann eine Reihe von Anfragen eingeht. In diesem Fall kann die Warteschlange eine tatsächliche Weiterleitungsrate aufweisen, die Ihre max_dispatches_per_second-Rate übersteigt, Systemressourcen verbraucht und mit Anfragen zur Nutzerverwaltung konkurriert. In Fällen, in denen Sie Warteschlangen zur Verwaltung von Weiterleitungsraten auf der Grundlage von relativ langsamen SLAs für nachgelagerte Dienste verwenden, kann dies zu Fehlern wie HTTP 429 (zu viele Anfragen) oder HTTP 503 (Dienst nicht verfügbar) führen.

Wenn Sie eine Cloud Tasks API-Methode verwenden, haben Sie zwei Felder, um die Warteschlangen-Weiterleitungsrate zu definieren:
- max_dispatches_per_second
- max_concurrent_dispatches
Ein drittes Feld, max_burst_size, wird vom System auf der Grundlage des Werts berechnet, den Sie für max_dispatches_per_second festgelegt haben. Weitere Informationen finden Sie unter RateLimits-Nachrichten.
Wenn Sie die Methode queue.yaml verwenden, können Sie alle drei Elemente festlegen:
- max_concurrent_requests, was max_concurrent_dispatches entspricht
- rate, was max_dispatches_per_second entspricht
- bucket_size, was max_burst_size entspricht

In den meisten Fällen führt die Verwendung der Cloud Tasks API-Methode und die Einstellung des Systems auf max_burst_size zu einer sehr effizienten Rate für die Verwaltung von Anfrage-Bursts. In einigen Fällen, insbesondere wenn die benötigte Rate relativ langsam ist, können Sie jedoch entweder die queue.yaml-Methode verwenden, um bucket_size manuell auf einen kleinen Wert zu setzen, oder max_concurrent_dispatches über die Cloud Tasks API auf einen kleinen Wert setzen, was Ihnen mehr Kontrolle bieten kann.

Wiederholungsparameter festlegen

Wenn eine Aufgabe nicht erfolgreich abgeschlossen wurde, wiederholt Cloud Tasks die Aufgabe mit exponentiellem Backoff gemäß den von Ihnen festgelegten Parametern.

Sie können die maximale Anzahl der Wiederholungen von fehlgeschlagenen Warteschlangenaufgaben, ein Zeitlimit für Wiederholungsversuche und das Intervall zwischen den Versuchen festlegen, indem Sie den folgenden Befehl ausführen:
```
gcloud tasks queues update QUEUE_ID \
    --max-attempts=MAX_ATTEMPTS \
    --max-retry-duration=MAX_RETRY_DURATION \
    --min-backoff=MIN_INTERVAL \
    --max-backoff=MAX_INTERVAL \
    --max-doublings=MAX_DOUBLINGS
```
Ersetzen Sie Folgendes:
- QUEUE_ID: Die Warteschlangen-ID (Kurzname).
- MAX_ATTEMPTS: Die maximale Anzahl der Versuche für eine Aufgabe, einschließlich des ersten Versuchs. Sie können unbegrenzte Wiederholungen zulassen, indem Sie dieses Flag auf -1 festlegen. Wenn MAX_ATTEMPTS auf -1 festgelegt ist, wird MAX_RETRY_DURATION weiterhin angewendet.
- MAX_RETRY_DURATION: die Höchstdauer für die Wiederholung einer fehlgeschlagenen Aufgabe, die ab dem ersten Versuch der Aufgabe gemessen wird. Der Wert muss ein String sein, der mit „s“ endet, z. B. 5s. Wenn der Wert auf 0 gesetzt ist, ist das Alter der Aufgabe unbegrenzt. Wenn MAX_RETRY_DURATION auf 0 festgelegt ist, wird MAX_ATTEMPTS weiterhin angewendet.
Hinweis :Wenn MAX_ATTEMPTS auf einen anderen Wert als -1 gesetzt ist und MAX_RETRY_DURATION größer als null ist, werden keine weiteren Wiederholungsversuche unternommen, wenn sowohl MAX_ATTEMPTS als auch MAX_RETRY_DURATION erfüllt sind. Wenn die Aufgabe MAX_ATTEMPTS-mal versucht wurde und die MAX_RETRY_DURATION-Zeit verstrichen ist, werden keine weiteren Versuche unternommen und die Aufgabe wird gelöscht. Wenn MAX_ATTEMPTS auf -1 und MAX_RETRY_DURATION auf 0 gesetzt ist, wird die Aufgabe unendlich oft wiederholt.
- MIN_INTERVAL: Die Mindestwartezeit zwischen Wiederholungsversuchen. Der Wert muss ein String sein, der mit "s" endet, zum Beispiel 5s.
- MAX_INTERVAL: Die maximale Wartezeit zwischen Wiederholungsversuchen. Der Wert muss ein String sein, der mit "s" endet, zum Beispiel 5s.
- MAX_DOUBLINGS: Die maximale Häufigkeit, mit der das Intervall zwischen fehlgeschlagenen Aufgabenwiederholungen verdoppelt wird, bevor die Erhöhung konstant wird. Das Wiederholungsintervall einer Aufgabe beginnt bei MIN_INTERVAL, verdoppelt sich dann MAX_DOUBLINGS-mal, steigt dann linear an und wird schließlich bis zu MAX_ATTEMPTS-mal in Intervallen von MAX_INTERVAL wiederholt.
  
  Wenn MIN_INTERVAL beispielsweise 10s, MAX_INTERVAL 300s und MAX_DOUBLINGS 3 ist, verdoppelt sich das Wiederholungsintervall 3 Mal, steigt linear um 2^3 * 10 s und wird dann in Intervallen von MAX_INTERVAL wiederholt, bis die Aufgabe MAX_ATTEMPTS Mal versucht wurde: 10 s, 20 s, 40 s, 80 s, 160 s, 240 s, 300 s, 300 s usw.
Weitere Informationen zu den Parametern finden Sie in den RetryConfig-Einstellungen für die Ressource Queue.
Prüfen Sie mit dem folgenden Befehl, ob die Warteschlange erfolgreich konfiguriert wurde:
```
gcloud tasks queues describe QUEUE_ID --location=LOCATION
```
Ersetzen Sie LOCATION durch den Speicherort der Warteschlange.

Die Ausgabe sollte die von Ihnen festgelegten Wiederholungsparameter enthalten.

Nächste Schritte

Weitere Informationen zum Erstellen von HTTP-Zielaufgaben
Mehr über das Erstellen von App Engine-Aufgaben erfahren
Weitere Informationen zur Warteschlangenverwaltung finden Sie in der RPC API-Referenz.
Weitere Informationen zur Warteschlangenverwaltung finden Sie in der Referenz zur REST API.