Configurer les files d'attente Cloud Tasks

Vous pouvez configurer votre file d'attente Cloud Tasks lorsque vous la créez ou à tout moment par la suite. La configuration s'applique à toutes les tâches de cette file d'attente.

La configuration des files d'attente comporte trois aspects fondamentaux :

Configurer le routage au niveau de la file d'attente

La configuration du routage au niveau de la file d'attente remplace le routage défini au niveau de la tâche. Cela est utile si vous souhaitez utiliser Cloud Tasks comme tampon devant votre service cible ou si vous devez modifier le routage de toutes les tâches d'une file d'attente.

Le routage au niveau de la file d'attente s'applique aux éléments suivants:

  • Tâches dans la file d'attente
  • Les tâches ajoutées à la file d'attente après le routage au niveau de la file d'attente

Limites

Le routage au niveau de la file d'attente n'est pas compatible avec les clés de chiffrement gérées par le client (CMEK) de Cloud Key Management Service (Cloud KMS). Si CMEK est activé, vous ne pouvez pas effectuer les opérations suivantes:

  • Créer des tâches sur une file d'attente avec routage au niveau de la file d'attente
  • Appliquer le routage au niveau de la file d'attente

Configurer le routage au niveau de la file d'attente pour les tâches HTTP

Vous pouvez configurer une file d'attente pour remplacer le routage au niveau de la tâche lors de sa création ou de sa mise à jour. Pour configurer le routage au niveau de la file d'attente, définissez le paramètre uriOverride de la file d'attente sur le chemin de votre choix.

Si vous appliquez un routage au niveau de la file d'attente en tant que mise à jour d'une file d'attente existante, mettez la file d'attente en pause avant d'appliquer les modifications, puis attendez une minute après l'application des modifications pour reprendre la file d'attente.

  1. Mettez la file d'attente en pause en exécutant la commande suivante:

      gcloud tasks queues pause QUEUE_ID
      

    Remplacez QUEUE_ID par l'ID de votre file d'attente.

  2. Modifiez ou supprimez le routage au niveau de la file d'attente.

    • Pour mettre à jour le routage au niveau de la file d'attente, définissez le paramètre uriOverride sur votre itinéraire mis à jour.

    • Pour supprimer le routage au niveau de la file d'attente à l'aide de l'API REST ou RPC:

      • API REST:envoyez une requête patch pour la file d'attente avec une charge utile vide et le paramètre updateMask défini sur httpTarget.

      • API RPC:envoyez un updateQueueRequest pour la file d'attente avec une charge utile vide et le paramètre update_mask défini sur http_target.

    L'exemple suivant utilise l'API REST pour mettre à jour l'hôte vers lequel les tâches sont acheminées:

    curl -X PATCH -d @- -i \
      -H "Authorization: Bearer ACCESS_TOKEN" \
      -H "Content-Type: application/json" \
      "https://cloudtasks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/queues/QUEUE_ID?updateMask=httpTarget.uriOverride" << EOF
    {
      "httpTarget": {"uriOverride":{"host":"NEW_HOST"}}
    }
    EOF
    

    Remplacez les éléments suivants :

    • ACCESS_TOKEN: votre jeton d'accès. Pour ce faire, exécutez la commande suivante dans votre terminal:

      gcloud auth application-default login
      gcloud auth application-default print-access-token
    • PROJECT_ID: ID de votre Google Cloud projet. Pour ce faire, exécutez la commande suivante dans votre terminal:

      gcloud config get-value project

    • LOCATION: emplacement de votre file d'attente.

    • NEW_HOST: nouvel hôte vers lequel vous souhaitez acheminer votre file d'attente.

  3. Patientez une minute.

    La prise en compte de la nouvelle configuration peut prendre jusqu'à une minute. Attendre de reprendre la file d'attente permet d'éviter que les tâches ne soient distribuées avec l'ancienne configuration.

  4. Reprenez la file d'attente en exécutant la commande suivante:

    gcloud tasks queues resume QUEUE_ID

Configurer le routage au niveau des files d'attente pour les tâches App Engine

Pour configurer le routage au niveau de la file d'attente pour les tâches App Engine, définissez le paramètre appEngineRoutingOverride de la file d'attente sur le service et la version App Engine de votre choix.

  1. Configurez le routage au niveau de la file d'attente et remplacez tout routage au niveau de la tâche:

    gcloud tasks queues update QUEUE_ID \
        --routing-override=service:SERVICE,version:VERSION

    Remplacez les éléments suivants :

    • QUEUE_ID: ID de la file d'attente (nom abrégé).
    • SERVICE: service de nœud de calcul App Engine responsable de la gestion des tâches.
    • VERSION: version de l'application.

    Par exemple, si vous configurez un service de nœud de calcul pour gérer toutes les tâches d'une file d'attente, vous pouvez diriger le routage vers ce service et la version par défaut:

    gcloud tasks queues update QUEUE_ID \
        --routing-override=service:SERVICE
  2. Vérifiez que la file d'attente a bien été configurée en exécutant la commande suivante:

    gcloud tasks queues describe QUEUE_ID --location=LOCATION

    Remplacez LOCATION par l'emplacement de la file d'attente.

    La sortie devrait ressembler à ce qui suit :

    appEngineRoutingOverride:
      host: SERVICE.PROJECT_ID.appspot.com
      service: SERVICE
    name: projects/PROJECT_ID/locations/LOCATION_ID/queues/QUEUE_ID
    rateLimits:
      maxBurstSize: 100
      maxConcurrentDispatches: 1000
      maxDispatchesPerSecond: 500.0
    retryConfig:
      maxAttempts: 100
      maxBackoff: 3600s
      maxDoublings: 16
      minBackoff: 0.100s
    state: RUNNING
  3. Pour supprimer le routage au niveau de la file d'attente, exécutez la commande suivante:

    gcloud tasks queues update QUEUE_ID \
        --clear-routing-override

    Lorsque le routage au niveau de la file d'attente est supprimé, le routage au niveau de la tâche est appliqué aux tâches de la file d'attente et aux tâches ajoutées à la file d'attente à l'avenir.

Définir des limites de débit

La limite de débit détermine le débit maximal auquel les tâches peuvent être distribuées par une file d'attente, que la distribution soit une première tentative de tâche ou une nouvelle tentative.

  1. Définissez le débit maximal et le nombre de tâches simultanées pouvant être distribuées par une file d'attente en exécutant la commande suivante:

    gcloud tasks queues update QUEUE_ID \
        --max-dispatches-per-second=DISPATCH_RATE \
        --max-concurrent-dispatches=MAX_CONCURRENT_DISPATCHES

    Remplacez les éléments suivants :

    • QUEUE_ID: ID de la file d'attente (nom abrégé).
    • DISPATCH_RATE: taux de distribution. Il s'agit de la fréquence d'actualisation des jetons dans le bucket. Dans les conditions où le flux de tâches est relativement stable, il s'agit de la vitesse à laquelle les tâches sont envoyées.
    • MAX_CONCURRENT_DISPATCHES: nombre maximal de tâches de la file d'attente pouvant s'exécuter en même temps.

    Par exemple, si vous avez créé une file d'attente sans définir de paramètres, vous pouvez mettre à jour le nombre maximal de tâches simultanées en exécutant la commande suivante:

    gcloud tasks queues update QUEUE_ID \
        --max-concurrent-dispatches=MAX_CONCURRENT_DISPATCHES
  2. Vérifiez que la file d'attente a bien été configurée en exécutant la commande suivante:

    gcloud tasks queues describe QUEUE_ID --location=LOCATION

    Remplacez LOCATION par l'emplacement de la file d'attente.

    La sortie devrait ressembler à ce qui suit :

    name: projects/PROJECT_ID/locations/LOCATION_ID/queues/QUEUE_ID
    rateLimits:
      maxBurstSize: 100
      maxConcurrentDispatches: MAX_CONCURRENT_DISPATCHES
      maxDispatchesPerSecond: 500.0
    retryConfig:
      maxAttempts: 100
      maxBackoff: 3600s
      maxDoublings: 16
      minBackoff: 0.100s
    state: RUNNING

Méthodes permettant de définir les taux de traitement de la file d'attente

Vous pouvez définir les taux de traitement des files d'attente à l'aide de l'API Cloud Tasks ou en important un fichier queue.yaml. Les deux méthodes aboutissent à des files d'attente qui utilisent le même mécanisme sous-jacent.

Dans les deux cas, la file d'attente utilise l'algorithme de token bucket (seau à jetons) pour contrôler le taux d'exécution des tâches. Chaque file d'attente nommée possède un bucket contenant ses jetons.

Chaque fois que l'application exécute une tâche, un jeton est supprimé du bucket. La file d'attente continue de traiter les tâches jusqu'à ce que le bucket n'ait plus de jetons. Le système remplit le bucket avec de nouveaux jetons en continu, en fonction du taux max_dispatches_per_second que vous spécifiez pour la file d'attente. Si votre file d'attente contient des tâches à traiter et que le bucket contient des jetons, le système traite simultanément autant de tâches que de jetons jusqu'à la valeur max_concurrent_dispatches que vous avez définie.

Une charge inégale peut augmenter considérablement le nombre de jetons dans le bucket, ce qui peut entraîner des utilisations intensives du traitement lorsqu'une vague de requêtes arrive. Dans ce cas, votre file d'attente peut présenter un taux de distribution réel supérieur à votre taux max_dispatches_per_second, consommant des ressources système et entrant en concurrence avec les requêtes servant les utilisateurs. Si vous utilisez des files d'attente pour gérer des taux de distribution basés sur des contrats de niveau de service relativement lents pour des services en aval, vous pouvez obtenir des erreurs telles que HTTP 429 (Trop de requêtes) ou HTTP 503 (Service indisponible).

  • Lorsque vous utilisez une méthode impliquant l'API Cloud Tasks, vous disposez de deux champs pour définir le taux de distribution de la file d'attente:

    • max_dispatches_per_second
    • max_concurrent_dispatches

    Un troisième champ, max_burst_size, est calculé par le système en fonction de la valeur que vous avez définie pour max_dispatches_per_second.

  • Lorsque vous utilisez la méthode queue.yaml, vous pouvez définir les trois éléments:

    • max_concurrent_requests, qui équivaut à max_concurrent_dispatches
    • rate, qui équivaut à max_dispatches_per_second
    • bucket_size, qui équivaut à max_burst_size

Dans la plupart des cas, l'utilisation de la méthode API Cloud Tasks et la définition de max_burst_size par le système permettent d'obtenir un taux très efficace de gestion des vagues de requêtes. Toutefois, dans certains cas, en particulier lorsque le débit requis est relativement lent, vous pouvez utiliser la méthode queue.yaml pour définir manuellement bucket_size sur une petite valeur ou définir max_concurrent_dispatches sur une petite valeur à l'aide de l'API Cloud Tasks pour avoir plus de contrôle.

Définir les paramètres de nouvelle tentative

Si une tâche ne s'effectue pas correctement, Cloud Tasks la relance avec un intervalle exponentiel entre les tentatives en fonction des paramètres que vous avez définis.

  1. Spécifiez le nombre maximal de nouvelles tentatives liées aux tâches ayant échoué dans la file d'attente, définissez une limite de temps pour les nouvelles tentatives et contrôlez l'intervalle entre les tentatives en exécutant la commande suivante:

    gcloud tasks queues update QUEUE_ID \
        --max-attempts=MAX_ATTEMPTS \
        --max-retry-duration=MAX_RETRY_DURATION \
        --min-backoff=MIN_INTERVAL \
        --max-backoff=MAX_INTERVAL \
        --max-doublings=MAX_DOUBLINGS

    Remplacez les éléments suivants :

    • QUEUE_ID: ID de la file d'attente (nom abrégé).
    • MAX_ATTEMPTS: nombre maximal de tentatives pour une tâche, y compris la première tentative. Vous pouvez autoriser des tentatives illimitées en définissant cet indicateur sur -1. Notez que si MAX_ATTEMPTS est défini sur -1, MAX_RETRY_DURATION est toujours appliqué.
    • MAX_RETRY_DURATION: durée maximale de la nouvelle tentative d'une tâche ayant échoué, mesurée à partir de la première tentative. La valeur doit être une chaîne qui se termine par "s", telle que 5s. Si la valeur est 0, l'âge de la tâche est illimité. Notez que si MAX_RETRY_DURATION est défini sur 0, MAX_ATTEMPTS est toujours appliqué.
    • MIN_INTERVAL: durée minimale d'attente entre les tentatives de nouvelle tentative. La valeur doit être une chaîne qui se termine par "s", telle que 5s.
    • MAX_INTERVAL: durée maximale d'attente entre les tentatives de nouvelle tentative. La valeur doit être une chaîne qui se termine par "s", telle que 5s.
    • MAX_DOUBLINGS: nombre maximal de fois où l'intervalle entre les tentatives d'exécution de tâches ayant échoué est doublé avant que l'augmentation ne devienne constante. L'intervalle de nouvelle tentative d'une tâche commence à MIN_INTERVAL, puis double MAX_DOUBLINGS fois, puis augmente de manière linéaire et de nouvelles tentatives sont effectuées à l'intervalle de MAX_INTERVAL jusqu'à MAX_ATTEMPTS fois.

      Par exemple, si MIN_INTERVAL est 10s, MAX_INTERVAL est 300s et MAX_DOUBLINGS est 3, l'intervalle de nouvelle tentative doublera 3 fois, augmentera de manière linéaire de 2^3 * 10 s, puis sera relancé à des intervalles de MAX_INTERVAL jusqu'à ce que la tâche ait été tentée MAX_ATTEMPTS fois: 10 s, 20 s, 40 s, 80 s, 160 s, 240 s, 300 s, 300 s, etc.

    Pour en savoir plus sur les paramètres, consultez les paramètres RetryConfig de la ressource Queue.

  2. Vérifiez que la file d'attente a bien été configurée en exécutant la commande suivante:

    gcloud tasks queues describe QUEUE_ID --location=LOCATION

    Remplacez LOCATION par l'emplacement de la file d'attente.

    La sortie doit contenir les paramètres de nouvelle tentative que vous avez définis.

Étape suivante