Résoudre les problèmes liés aux abonnements BigQuery

Cette page fournit des conseils de dépannage courants pour les abonnements BigQuery.

Vérifier l'état d'un abonnement BigQuery

Pour vérifier l'état d'un abonnement, procédez comme suit :

  1. Dans la console Google Cloud, accédez à Pub/Sub page d'abonnement.

    Accéder aux abonnements

  2. Vérifiez l'icône d'état de votre abonnement BigQuery.

    Si l'icône est une coche verte, cela signifie que l'abonnement est opérationnel.

    Si l'icône est un point d'exclamation rouge, cela signifie que l'abonnement est en état d'erreur.

  3. Cliquez sur l'abonnement BigQuery.

    La page des détails de l'abonnement s'ouvre.

  4. Vérifiez si le message d'erreur s'affiche dans l'état de l'abonnement.

  5. En fonction du message d'erreur, accédez à la section appropriée de cette page pour résoudre le problème.

Une fois le problème résolu, l'abonnement revient à un état correct.

Impossible de créer ou de mettre à jour un abonnement

Voici quelques-uns des problèmes courants que vous pourriez rencontrer si vous rencontrez des difficultés pour créer ou mettre à jour un abonnement BigQuery.

Erreur "Table introuvable"

Si la table que vous spécifiez dans le workflow de création ou de mise à jour d'un abonnement n'existe pas, le workflow renvoie une erreur de table introuvable. Dans la console Google Cloud, le message ressemble à celui-ci :

The BigQuery table or dataset specified cannot be found.

Pour résoudre le problème, créez la table et assurez-vous de pouvoir vérifier son état avant de l'utiliser avec un abonnement BigQuery.

Erreur de correspondance du schéma

Si les schémas de la table et du sujet ne sont pas compatibles, le workflow de création ou de mise à jour d'un abonnement renvoie une erreur d'incohérence de schéma. Dans la console Google Cloud, le message ressemble à celui-ci :

Incompatible schema type for field project_ids: expected INT64, got STRING

Le message d'erreur spécifié concerne une incohérence au niveau du schéma d'un champ nommé project_ids. Selon le type de non-concordance de schéma que vous rencontrez, vous pouvez voir une variante différente du message d'erreur.

Pour résoudre le problème, vérifiez si les mappages de schémas sont compatibles.

Erreur de compte de service

Si vous n'avez pas configuré le compte de service Pub/Sub avec le les bonnes autorisations, puis le workflow de création ou de mise à jour d'un abonnement renvoie une erreur. Dans la console Google Cloud, le message ressemble à celui-ci :

Service account service-1234234234@gcp-sa-pubsub.iam.gserviceaccount.com
is missing permissions required to write to the BigQuery table:
bigquery.tables.get, bigquery.tables.updateData.

Pour résoudre le problème, vérifiez si le compte de service les autorisations appropriées.

L'état de l'abonnement affiche un point d'exclamation rouge.

Si vous modifiez la table après avoir créé un abonnement, cela peut affecter la façon dont Pub/Sub écrit des messages dans la table. Si une modification entraîne un numéro, le champ "state" de l'abonnement définies sur un état d'erreur ;

Sur la page d'informations de l'abonnement, vérifiez l'état du champ Subscription state. Le champ Subscription state fournit une erreur plus spécifique, Il peut s'agir de l'un des éléments suivants:

  • table not found: la table est supprimée. Créez une table et vérifiez son état. Consultez la section Obtenir des informations sur une table.

  • autorisation table refusée: le compte de service Pub/Sub n'a plus l'autorisation d'écrire dans la table. Vérifiez si le compte de service dispose des autorisations appropriées.

  • Différence de schéma de table: le schéma de la table n'est plus compatible avec le Paramètres d'abonnement BigQuery. Vérifiez si le schéma les mappages sont compatibles.

Lorsqu'un abonnement Pub/Sub est dans l'état d'erreur, les messages ne sont pas écrits dans la table BigQuery et restent dans la file d'attente de l'abonnement. Notez que les messages ne sont pas distribués à un a joint une lettre morte, si elle est configurée. Les messages non confirmés sont conservés pour la période définie dans message_retention_duration(7 jours, par défaut).

Un arriéré se forme

Si vous constatez une accumulation de messages en attente dans l'abonnement ou les messages en accédant à la file d'attente des lettres mortes d'un abonnement, causes.

Message d'erreur INVALID_ARGUMENT

Cette erreur se produit lorsque le message fourni est dans un format que Pub/Sub considère comme valide, mais pas le schéma de la table de destination BigQuery. Cela signifie qu'un ou plusieurs champs du message contiennent des valeurs non autorisées par le schéma de la table BigQuery. Vérifiez la compatibilité du schéma pour vous assurer que les types et formats de données sont corrects. Voici quelques-unes des erreurs les plus courantes :

  • Une chaîne vide ("") n'est pas un fichier JSON valide. Lors de l'envoi de données à une instance nullable Colonne de table BigQuery JSON, fournissez un objet JSON ({}) vide, null ou une chaîne JSON vide ("\"\"") pour représenter les valeurs manquantes. L'envoi d'une chaîne vide génère une erreur.

  • Si la valeur d'un champ de message dépasse la longueur maximale du champ BigQuery, le message échoue en raison de limitations de taille.

Pour résoudre les erreurs INVALID_ARGUMENT, ajoutez un sujet de lettres mortes à l'abonnement concerné. Le sujet des lettres mortes capture les messages qui n'ont pas pu être écrites dans BigQuery, avec un attribut appelé CloudPubSubDeadLetterSourceDeliveryErrorMessage qui explique la raison de l'échec.

Ces échecs de distribution sont également visibles dans l'Explorateur de métriques. Sélectionnez la métrique pubsub.googleapis.com/subscription/push_request_count, puis filtrer par response_code=invalid_argument.

Message d'erreur RESOURCE_EXHAUSTED

Si les messages sont écrits lentement dans BigQuery, vous devrez peut-être augmenter le quota de transfert Pub/Sub ou le quota de débit d'écriture du stockage BigQuery de votre projet. Pour vérifier si vous rencontrez des limites de quota, Examiner la métrique des requêtes push (subscription/push_request_count) pour les erreurs resource_exhausted.

Un autre moyen de diagnostiquer les problèmes de quota consiste à vérifier le quota du projet. Accédez à IAM et administration > Quotas dans le projet contenant votre ressource Pub/Sub ou votre instance BigQuery. Recherchez le quota approprié, pubsub.googleapis.com/regionalpushsubscriber ou bigquerystorage.googleapis.com/write/append_bytes. Si l'un des quotas nécessite vous pouvez demander un quota plus élevé.

Table partitionnée par heure affichant __UNPARTITIONED__ dans la colonne "ID de partition"

Lorsqu'une table de destination BigQuery est partitionnée par heure, les lignes atterrit initialement sur une partition spéciale nommée __UNPARTITIONED__ dans le Vue INFORMATION_SCHEMA.PARTITIONS. Il s'agit d'un comportement attendu pour les tables utilisant le partitionnement par date d'ingestion.

BigQuery utilise un tampon de flux de données pour optimiser le processus d'écriture. Les données peuvent résider dans la partition __UNPARTITIONED__ jusqu'à ce qu'un volume suffisant s'accumule ou qu'au moins une heure se soit écoulée. Une fois ces conditions remplies, BigQuery repartitionne les données dans la partition horaire appropriée.

Vous pouvez surveiller les données de la partition __UNPARTITIONED__ à l'aide de la méthode Vue INFORMATION_SCHEMA.PARTITIONS.

Étape suivante

  • Si vous rencontrez toujours des problèmes avec votre consultez l'article Obtenir de l'aide.