Cette page a été traduite par l'API Cloud Translation.

Résoudre les problèmes liés aux requêtes

Ce document est destiné à vous aider à résoudre les problèmes courants liés à l'exécution de requêtes, tels que l'identification des raisons de lenteur des requêtes ou la résolution des erreurs courantes renvoyées par les requêtes ayant échoué.

Résoudre les problèmes de lenteur des requêtes

Lorsque vous résolvez des problèmes de lenteur des requêtes, tenez compte des causes courantes suivantes :

Consultez la page Google Cloud État du service pour connaître les éventuelles pannes du service BigQuery qui pourraient avoir un impact sur les performances des requêtes.
Examinez la chronologie de la tâche de votre requête sur la page des informations sur la tâche pour voir le temps nécessaire à l'exécution de chaque étape de la requête.
- Si la majeure partie du temps écoulé est due à de longs délais de création, contactez Cloud Customer Care pour obtenir de l'aide.
- Si la majeure partie du temps écoulé est due à des temps d'exécution longs, consultez vos informations sur les performances des requêtes. Les informations sur les performances des requêtes peuvent vous informer si l'exécution de votre requête a dépassé la durée d'exécution moyenne et suggérer les causes possibles. Les causes possibles peuvent inclure une contention des emplacements de requête ou un quota de shuffle insuffisant. Pour en savoir plus sur chaque problème de performances des requêtes et les solutions possibles, consultez la page Interpréter les informations sur les performances des requêtes.
Examinez le champ finalExecutionDurationMs dans JobStatistics pour votre tâche de requête. La requête a peut-être été relancée. Le champ finalExecutionDurationMs contient la durée en millisecondes de l'exécution de la dernière tentative de ce job.
Examinez la quantité d'octets traités sur la page des informations sur la tâche de requête pour voir si elle est plus élevée que prévu. Pour ce faire, comparez le nombre d'octets traités par la requête actuelle avec celui d'une autre requête qui s'est terminée dans un délai acceptable. Si le nombre d'octets traités est très différent entre les deux requêtes, il est possible que la requête ait été lente en raison d'un volume de données important. Pour savoir comment optimiser vos requêtes afin de gérer de grands volumes de données, consultez Optimiser le calcul des requêtes.

Vous pouvez également identifier les requêtes de votre projet qui traitent une grande quantité de données en recherchant les requêtes les plus coûteuses à l'aide de la vue INFORMATION_SCHEMA.JOBS.

Comparer une exécution lente et rapide de la même requête

Si une requête qui s'exécutait rapidement est désormais lente, examinez la sortie de l'objet Job API pour identifier les changements dans son exécution.

Succès de cache

Vérifiez si l'exécution rapide du job était un succès de cache (hit) en examinant la valeur cacheHit. Si la valeur est true pour l'exécution rapide de la requête, la requête utilise les résultats mis en cache au lieu d'exécuter la requête.

Si vous vous attendez à ce que le job lent utilise des résultats mis en cache, recherchez pourquoi la requête n'utilise plus les résultats mis en cache. Si vous ne vous attendez pas à ce que la requête récupère des données du cache, recherchez un exemple d'exécution rapide de requête qui n'a pas accédé au cache pour l'enquête.

Retards liés aux quotas

Pour déterminer si le ralentissement est dû à des reports de quota, vérifiez le champ quotaDeferments pour les deux jobs. Comparez les valeurs pour déterminer si l'heure de début de la requête la plus lente a été retardée par des reports de quota qui n'ont pas affecté le job le plus rapide.

Durée de l'exécution

Pour comprendre la différence entre la durée d'exécution de la dernière tentative des deux jobs, comparez leurs valeurs pour le champ finalExecutionDurationMs.

Si les valeurs de finalExecutionDurationMs sont assez similaires, mais que la différence de temps d'exécution réel entre les deux requêtes, calculée comme startTime - endTime, est beaucoup plus importante, cela signifie qu'il peut y avoir eu une nouvelle tentative d'exécution de requête interne pour le job lent en raison d'un éventuel problème temporaire. Si vous constatez ce type de différence à plusieurs reprises, contactez Cloud Customer Care pour obtenir de l'aide.

Octets traités

Examinez la quantité d'octets traités sur la page des informations sur la tâche de requête ou consultez totalBytesProcessed dans JobStatistics pour voir si elle est plus élevée que prévu. Si le nombre d'octets traités est très différent entre les deux requêtes, cela peut indiquer que la requête est lente en raison d'une modification du volume de données traitées. Pour savoir comment optimiser les requêtes afin de gérer de grands volumes de données, consultez Optimiser le calcul des requêtes. Les raisons suivantes peuvent entraîner une augmentation du nombre d'octets traités par une requête :

La taille des tables référencées par la requête a augmenté.
La requête lit désormais une plus grande partition de la table.
La requête fait référence à une vue dont la définition a changé.

Tables référencées

Vérifiez si les requêtes lisent les mêmes tables en analysant le résultat du champ referencedTables dans JobStatistics2. Les différences entre les tables référencées peuvent s'expliquer par les éléments suivants :

La requête SQL a été modifiée pour lire différentes tables. Comparez le texte de la requête pour le confirmer.
La définition de la vue a changé entre les exécutions de la requête. Vérifiez les définitions des vues référencées dans cette requête et mettez-les à jour si nécessaire.

Des différences dans les tableaux référencés peuvent expliquer les variations de totalBytesProcessed.

Utilisation des vues matérialisées

Si la requête fait référence à des vues matérialisées, des différences de performances peuvent être dues au fait que des vues matérialisées ont été choisies ou refusées lors de l'exécution de la requête. Inspectez MaterializedViewStatistics pour savoir si des vues matérialisées utilisées dans la requête rapide ont été refusées dans la requête lente. Examinez les champs chosen et rejectedReason dans l'objet MaterializedView.

Statistiques de mise en cache des métadonnées

Pour les requêtes impliquant des tables BigLake Amazon S3 ou des tables BigLake Cloud Storage avec la mise en cache des métadonnées activée, comparez la sortie de MetadataCacheStatistics pour vérifier s'il existe une différence dans l'utilisation du cache de métadonnées entre la requête lente et la requête rapide, ainsi que les raisons correspondantes. Par exemple, le cache de métadonnées peut se trouver en dehors de la fenêtre maxStaleness de la table.

Comparer les statistiques BigQuery BI Engine

Si la requête utilise BigQuery BI Engine, analysez le résultat de BiEngineStatistics pour déterminer si les mêmes modes d'accélération ont été appliqués à la requête lente et à la requête rapide. Consultez le champ BiEngineReason pour comprendre la raison générale de l'accélération partielle ou de l'absence d'accélération, par exemple un manque de mémoire, une réservation manquante ou une entrée trop volumineuse.

Examiner les différences dans les insights sur les performances des requêtes

Comparez les insights sur les performances des requêtes pour chacune d'elles en examinant le graphique d'exécution dans la console Google Cloud ou l'objet StagePerformanceStandaloneInsight pour comprendre les problèmes potentiels suivants :

Conflit d'emplacements (slotContention)
Jointures à cardinalité élevée (highCardinalityJoins)
Quota de brassage insuffisant (insufficientShuffleQuota)
Décalage des données (partitionSkew)

Portez attention aux insights fournis pour le job lent, ainsi qu'aux différences entre les insights générés pour le job rapide, afin d'identifier les changements de phase qui affectent les performances.

Une analyse plus approfondie des métadonnées d'exécution des jobs nécessite d'examiner les différentes étapes d'exécution des requêtes en comparant les objets ExplainQueryStage pour les deux jobs.

Pour commencer, examinez les métriques Wait ms et Shuffle output bytes décrites dans la section Interpréter les informations sur les étapes de la requête.

Avertissements sur les ressources dans la vue `INFORMATION_SCHEMA.JOBS`

Interrogez le champ query_info.resource_warning de la vue INFORMATION_SCHEMA.JOBS pour voir s'il existe une différence entre les avertissements analysés par BigQuery et les ressources utilisées.

Analyse des statistiques de charge de travail

Les ressources d'emplacement disponibles et les conflits d'emplacements peuvent affecter le temps d'exécution des requêtes. Les sections suivantes vous aident à comprendre l'utilisation et la disponibilité des emplacements pour une exécution spécifique d'une requête.

Nombre moyen d'emplacements par seconde

Pour calculer le nombre moyen d'emplacements utilisés par milliseconde par la requête, divisez la valeur slot-milliseconds de la tâche, totalSlotMs de JobStatistics2, par la durée en millisecondes de l'exécution de la dernière tentative de cette tâche, finalExecutionDurationMs de JobStatistics.

Vous pouvez également calculer le nombre moyen d'emplacements par milliseconde utilisés par un job en interrogeant la vue INFORMATION_SCHEMA.JOBS.

Une tâche effectuant une quantité de travail similaire avec un nombre moyen d'emplacements par seconde plus élevé se termine plus rapidement. Une utilisation moyenne des emplacements par seconde plus faible peut être due aux éléments suivants :

Aucune ressource supplémentaire n'était disponible en raison d'un conflit de ressources entre différentes tâches. La réservation était au maximum.
Le job n'a pas demandé d'emplacements supplémentaires pendant une grande partie de l'exécution. Par exemple, cela peut se produire en cas de biais de données.

Modèles de gestion de la charge de travail et taille des réservations

Si vous utilisez le modèle de facturation à la demande, le nombre d'emplacements que vous pouvez utiliser par projet est limité. Il est également possible que votre projet dispose parfois de moins d'emplacements disponibles s'il existe de nombreux conflits pour la capacité à la demande dans un emplacement spécifique.

Le modèle basé sur la capacité est plus prévisible et vous permet de spécifier un nombre garanti d'emplacements de référence.

Tenez compte de ces différences lorsque vous comparez une exécution de requête à la demande à une exécution de requête qui utilise une réservation.

Il est recommandé d'utiliser une réservation pour obtenir des performances d'exécution de requêtes stables et prévisibles. Pour en savoir plus sur les différences entre les charges de travail à la demande et celles basées sur la capacité, consultez Présentation de la gestion des charges de travail.

Simultanéité des jobs

La simultanéité des jobs représente la concurrence entre les jobs pour les ressources de slots lors de l'exécution des requêtes. Une concurrence plus élevée des tâches entraîne généralement une exécution plus lente des tâches, car la tâche a accès à moins d'emplacements.

Vous pouvez interroger la vue INFORMATION_SCHEMA.JOBS pour trouver le nombre moyen de jobs simultanés exécutés en même temps qu'une requête spécifique dans un projet.

Si plusieurs projets sont attribués à une réservation, modifiez la requête pour utiliser JOBS_BY_ORGANIZATION au lieu de JOBS_BY_PROJECT afin d'obtenir des données précises au niveau de la réservation.

Une concurrence moyenne plus élevée lors de l'exécution lente du job par rapport au job rapide est un facteur contribuant à la lenteur globale.

Envisagez de réduire la simultanéité dans le projet ou la réservation en répartissant les requêtes utilisant les ressources de manière intensive, au fil du temps dans une réservation ou un projet, ou sur des réservations ou projets différents.

Une autre solution consiste à acheter une réservation ou à augmenter la taille d'une réservation existante. Envisagez d'autoriser la réservation à utiliser les emplacements inactifs.

Pour savoir combien d'emplacements ajouter, consultez Estimer les exigences relatives à la capacité d'emplacements.

Les jobs exécutés dans des réservations auxquelles plusieurs projets sont attribués peuvent avoir des résultats d'attribution d'emplacements différents avec la même simultanéité moyenne des jobs, selon le projet qui les exécute. Pour en savoir plus, consultez la section sur la planification équitable.

Utilisation des réservations

Vous pouvez utiliser les graphiques de ressources d'administration et BigQuery Cloud Monitoring pour surveiller l'utilisation des réservations. Pour en savoir plus, consultez Surveiller les réservations BigQuery.

Pour savoir si un job a demandé des emplacements supplémentaires, examinez la métrique "Unités exécutables estimées", qui est estimatedRunnableUnits dans la réponse de l'API Job ou period_estimated_runnable_units dans la vue INFORMATION_SCHEMA.JOBS_TIMELINE. Si la valeur de cette métrique est supérieure à 0, cela signifie que le job aurait pu bénéficier de slots supplémentaires à ce moment-là. Pour estimer le pourcentage du temps d'exécution du job pendant lequel le job aurait bénéficié d'emplacements supplémentaires, exécutez la requête suivante sur la vue INFORMATION_SCHEMA.JOBS_TIMELINE :

SELECT
  ROUND(COUNTIF(period_estimated_runnable_units > 0) / COUNT(*) * 100, 1) AS execution_duration_percentage
FROM `myproject`.`region-us`.INFORMATION_SCHEMA.JOBS_TIMELINE
WHERE job_id = 'my_job_id'
GROUP BY job_id;

Le résultat ressemble à ce qui suit :

+---------------------------------+
|   execution_duration_percentage |
+---------------------------------+
|                            96.7 |
+---------------------------------+

Un faible pourcentage signifie que la disponibilité des ressources de créneaux horaires n'est pas un facteur majeur de la lenteur des requêtes dans ce scénario.

Si le pourcentage est élevé et que la réservation n'a pas été entièrement utilisée pendant cette période, contactez le Cloud Customer Care pour obtenir de l'aide.

Si la réservation a été entièrement utilisée lors de l'exécution lente du job et que le pourcentage est élevé, cela signifie que le job était limité en ressources. Envisagez de réduire la simultanéité, d'augmenter la taille de la réservation, d'autoriser la réservation à utiliser des emplacements inactifs ou d'acheter une réservation si le job a été exécuté à la demande.

Les métadonnées de la tâche et les résultats de l'analyse de la charge de travail ne sont pas concluants

Si vous ne parvenez toujours pas à identifier la raison des performances plus lentes que prévu des requêtes, contactez le service client Cloud pour obtenir de l'aide.

Résoudre les échecs de requêtes à l'aide de `gcpdiag`

gcpdiag est un outil Open Source. Il ne s'agit pas d'un produit Google Cloud officiellement pris en charge. Vous pouvez utiliser l'outil gcpdiag pour vous aider à identifier et à résoudre les problèmes liés au projet Google Cloud. Pour plus d'informations, consultez le projet gcpdiag sur GitHub.

L'outil gcpdiag vous aide à analyser les requêtes BigQuery ayant échoué pour déterminer s'il existe une cause première connue et une solution pour l'échec spécifique.

Exécuter la commande `gcpdiag`

Vous pouvez exécuter la commande gcpdiag à partir de Google Cloud CLI :

ConsoleGoogle Cloud

Terminez l'exécution, puis copiez la commande suivante.

gcpdiag runbook bigquery/failed_query \
   --parameter project_id=PROJECT_ID \
   --parameter bigquery_job_region=JOB_REGION \
   --parameter bigquery_job_id=JOB_ID \
   --parameter bigquery_skip_permission_check=SKIP_PERMISSION_CHECK

Ouvrez la console Google Cloud et activez Cloud Shell.

Ouvrir la console Cloud

Collez la commande copiée.
Exécutez la commande gcpdiag, qui télécharge l'image Docker gcpdiag, puis effectue des vérifications de diagnostic. Le cas échéant, suivez les instructions de sortie pour corriger les échecs de vérification.

Docker

Vous pouvez exécuter gcpdiag à l'aide d'un wrapper qui démarre gcpdiag dans un conteneur Docker. Docker ou Podman doivent être installés.

Copiez et exécutez la commande suivante sur votre station de travail locale.
```
curl https://gcpdiag.dev/gcpdiag.sh >gcpdiag && chmod +x gcpdiag
```

Exécutez la commande gcpdiag.

./gcpdiag runbook bigquery/failed_query \
   --parameter project_id=PROJECT_ID \
   --parameter bigquery_job_region=JOB_REGION \
   --parameter bigquery_job_id=JOB_ID \
   --parameter bigquery_skip_permission_check=SKIP_PERMISSION_CHECK

Affichez les paramètres disponibles pour ce runbook.

Remplacez les éléments suivants :

PROJECT_ID : ID du projet contenant la ressource.
JOB_REGION : région dans laquelle la tâche BigQuery a été exécutée.
JOB_ID : identifiant du job BigQuery.
SKIP_PERMISSION_CHECK : (facultatif) définissez cette valeur sur True si vous souhaitez ignorer la vérification des autorisations correspondante et accélérer l'exécution du runbook (la valeur par défaut est False).

Options utiles :

--universe-domain : le cas échéant, le domaine Cloud souverain du partenaire de confiance hébergeant la ressource.
--parameter ou -p : paramètres du runbook.

Pour obtenir la liste et la description de toutes les options de l'outil gcpdiag, consultez les instructions d'utilisation de gcpdiag.

Résolution de schéma Avro

Chaîne d'erreur : Cannot skip stream

Cette erreur peut se produire lors du chargement de plusieurs fichiers Avro avec différents schémas, ce qui entraîne un problème de résolution du schéma et l'échec de la tâche d'importation dans un fichier aléatoire.

Pour résoudre cette erreur, assurez-vous que le dernier fichier alphabétique du job de chargement contient le sur-ensemble (union) des différents schémas. Il s'agit d'une exigence basée sur la manière dont Avro gère la résolution de schéma.

Requêtes simultanées en conflit

Chaîne d'erreur : Concurrent jobs in the same session are not allowed

Cette erreur peut se produire lorsque plusieurs requêtes s'exécutent simultanément dans une session, ce qui n'est pas accepté. Référez-vous aux limites de session.

Instructions LMD en conflit

Chaîne d'erreur : Could not serialize access to table due to concurrent update

Cette erreur peut se produire en cas de conflit lors de l'exécution simultanée de plusieurs instructions LMD (langage de manipulation de données) sur une même table ou lorsque la table est tronquée par une instruction LMD impliquant une mutation. Pour en savoir plus, consultez la section Conflits d'instructions LMD.

Pour résoudre cette erreur, exécutez des opérations LMD qui affectent une seule table afin d'éviter les chevauchements.

Sous-requêtes corrélées

Chaîne d'erreur : Correlated subqueries that reference other tables are not supported unless they can be de-correlated

Cela peut se produire lorsque votre requête contient une sous-requête qui référence une colonne extérieure à cette sous-requête, appelée colonne de corrélation. La sous-requête corrélée est évaluée à l'aide d'une stratégie d'exécution imbriquée inefficace, dans laquelle la sous-requête est évaluée pour chaque ligne de la requête externe générant les colonnes de corrélation. Parfois, BigQuery peut réécrire en interne les requêtes avec des sous-requêtes corrélées afin qu'elles s'exécutent plus efficacement. L'erreur de sous-requêtes corrélée se produit lorsque BigQuery ne peut pas optimiser suffisamment la requête.

Pour résoudre cette erreur, essayez les options suivantes :

Supprimez toutes les clauses ORDER BY, LIMIT, EXISTS, NOT EXISTS ou IN de votre sous-requête.
Utilisez une requête à plusieurs instructions pour créer une table temporaire à référencer dans votre sous-requête.
Réécrivez votre requête pour utiliser une CROSS JOIN à la place.

Autorisations de contrôle des accès insuffisantes au niveau des colonnes

Chaîne d'erreur : Requires fineGrainedGet permission on the read columns to execute the DML statements

Cette erreur se produit lorsque vous tentez d'effectuer une instruction LMD DELETE, UPDATE ou MERGE, sans l'autorisation "Lecteur détaillé" sur les colonnes analysées qui utilisent le contrôle des accès au niveau des colonnes. pour restreindre l'accès au niveau des colonnes. Pour en savoir plus, consultez la page Impact sur les opérations d'écriture avec le contrôle des accès au niveau des colonnes.

Identifiants non valides pour les requêtes programmées

Chaînes d'erreur :

Error code: INVALID_USERID
Error code 5: Authentication failure: User Id not found
PERMISSION_DENIED: BigQuery: Permission denied while getting Drive credentials

Cette erreur peut se produire lorsqu'une requête programmée échoue en raison d'identifiants obsolètes, en particulier lors de l'interrogation de données Google Drive.

Pour résoudre cette erreur, procédez comme suit :

Assurez-vous d'avoir activé le service de transfert de données BigQuery, qui est un prérequis pour utiliser les requêtes programmées.
Mettez à jour les identifiants de la requête programmée.

Identifiants du compte de service non valides

Chaîne d'erreur : HttpError 403 when requesting returned: The caller does not have permission

Cette erreur peut se produire lorsque vous tentez de configurer une requête programmée avec un compte de service. Pour résoudre cette erreur, consultez la procédure de dépannage dans Problèmes d'autorisation.

Heure d'instantané non valide

Chaîne d'erreur : Invalid snapshot time

Cette erreur peut se produire lorsque vous essayez d'interroger des données historiques en dehors de la fenêtre de fonctionnalité temporelle de l'ensemble de données. Pour résoudre cette erreur, modifiez la requête d'accès aux données historiques afin de l'inclure dans la fenêtre de fonctionnalité temporelle de l'ensemble de données.

Cette erreur peut également se produire si l'une des tables utilisées dans la requête est supprimée puis recréée après le démarrage de la requête. Vérifiez si une requête planifiée ou une application effectuent cette opération en même temps que la requête ayant échoué. Le cas échéant, essayez de déplacer le processus qui effectue l'opération de suppression et de recréation à une heure qui n'entre pas en conflit avec les requêtes qui lisent cette table.

La tâche existe déjà

Chaîne d'erreur : Already Exists: Job <job name>

Cette erreur peut se produire pour les tâches de requête qui doivent évaluer des tableaux volumineux, de telle sorte que la création de la tâche de requête prend plus de temps que la moyenne. Par exemple, une requête avec une clause WHERE telle que WHERE column IN (<2000+ elements array>).

Pour résoudre cette erreur, procédez comme suit :

Autorisez BigQuery à générer une valeur jobId aléatoire plutôt que d'en spécifier une.
Utilisez une requête paramétrée pour charger le tableau.

Cette erreur peut également se produire lorsque vous définissez manuellement un ID de tâche, mais que la tâche ne renvoie pas de résultat positif dans un délai imparti. Dans ce cas, vous pouvez ajouter un gestionnaire d'exceptions pour vérifier si le job existe. Si c'est le cas, vous pouvez extraire les résultats de la requête du job.

Job introuvable

Chaîne d'erreur : Job not found

Cette erreur peut se produire en réponse à un appel getQueryResults dans lequel aucune valeur n'est spécifiée pour le champ location. Dans ce cas, réessayez l'appel et fournissez une valeur location.

Pour en savoir plus, consultez la page Évitez plusieurs évaluations des mêmes expressions de table courantes (CTE).

Position introuvable

Chaîne d'erreur : Dataset [project_id]:[dataset_id] was not found in location [region]

Cette erreur apparaît lorsque vous faites référence à une ressource d'ensemble de données qui n'existe pas ou lorsque l'emplacement dans la requête ne correspond pas à l'emplacement de l'ensemble de données.

Pour résoudre ce problème, spécifiez l'emplacement de l'ensemble de données dans la requête ou vérifiez que l'ensemble de données est disponible au même emplacement.

La requête dépasse le délai d'exécution

Chaîne d'erreur : Query fails due to reaching the execution time limit

Si votre requête atteint le Délai d'exécution de la requête, vérifiez la durée des précédentes exécutions de la requête en interrogeant la vue INFORMATION_SCHEMA.JOBS avec une requête semblable à l'exemple suivant :

SELECT TIMESTAMP_DIFF(end_time, start_time, SECOND) AS runtime_in_seconds
FROM `region-us`.INFORMATION_SCHEMA.JOBS
WHERE statement_type = 'QUERY'
AND query = "my query string";

Si les exécutions précédentes de la requête ont pris beaucoup moins de temps, utilisez les insights sur les performances des requêtes pour déterminer et résoudre le problème sous-jacent.

La réponse à la requête est trop volumineuse

Chaîne d'erreur : responseTooLarge

Cette erreur se produit lorsque les résultats de la requête dépassent la taille de réponse maximale.

Pour résoudre cette erreur, suivez les instructions fournies pour le message d'erreur responseTooLarge dans le tableau des erreurs.

Réservation introuvable ou sans créneaux

Chaîne d'erreur : Cannot run query: project does not have the reservation in the data region or no slots are configured

Cette erreur se produit lorsque la réservation attribuée au projet dans la région de la requête ne comporte aucun emplacement. Vous pouvez ajouter des emplacements à la réservation, autoriser la réservation à utiliser des emplacements inactifs, utiliser une autre réservation ou supprimer l'attribution et exécuter la requête à la demande.

Table introuvable

Chaîne d'erreur : Not found: Table [project_id]:[dataset].[table_name] was not found in location [region]

Cette erreur se produit lorsqu'une table de votre requête est introuvable dans l'ensemble de données ou la région que vous avez spécifiés. Pour résoudre cette erreur, procédez comme suit :

Vérifiez que votre requête contient le nom du projet, de l'ensemble de données et de la table appropriés.
Vérifiez que la table existe dans la région dans laquelle vous avez exécuté la requête.
Assurez-vous que la table n'a pas été supprimée et recréée lors de l'exécution du job. Sinon, une propagation incomplète des métadonnées peut être à l'origine de cette erreur.

Trop d'instructions LMD

Chaîne d'erreur : Too many DML statements outstanding against <table-name>, limit is 20

Cette erreur se produit lorsque vous dépassez la limite de 20 instructions LMD à l'état PENDING dans une file d'attente pour une seule table. Cette erreur se produit généralement lorsque vous envoyez des jobs LMD sur une seule table plus rapidement que ce que BigQuery peut traiter.

Une solution possible consiste à regrouper plusieurs opérations LMD plus petites dans des jobs plus volumineux, mais moins nombreux. Par exemple, en regroupant les mises à jour et les insertions. Lorsque vous regroupez des jobs plus petites en plus grandes, le coût d'exécution des jobs les plus importants est amorti et l'exécution est plus rapide. Le regroupement des instructions LMD qui affectent les mêmes données améliore généralement l'efficacité des jobs LMD et est moins susceptible de dépasser la limite de quota de la file d'attente. Pour plus d'informations sur l'optimisation de vos opérations LMD, consultez la section Éviter les instructions LMD qui mettent à jour ou insèrent des lignes simples.

D'autres solutions permettant d'améliorer l'efficacité de vos instructions LMD peuvent consister à partitionner ou à mettre en cluster vos tables. Pour en savoir plus, consultez la section Bonnes pratiques.

Transaction abandonnée en raison d'une mise à jour simultanée

Chaîne d'erreur : Transaction is aborted due to concurrent update against table [table_name]

Cette erreur peut se produire lorsque deux instructions LMD (langage de manipulation de données) impliquant une mutation tentent de mettre à jour la même table simultanément. Par exemple, supposons que vous démarriez une transaction dans une session qui contient une instruction LMD mutatrice suivie d'une erreur. En l'absence de gestionnaire d'exceptions, BigQuery annule automatiquement la transaction à la fin de la session, ce qui peut prendre jusqu'à 24 heures. Pendant ce temps, les autres tentatives d'exécution d'une instruction LMD en mutation sur la table échouent.

Pour résoudre cette erreur, listez vos sessions actives et vérifiez si l'une d'elles contient une tâche de requête avec l'état ERROR qui a exécuté une instruction LMD mutatrice sur la table. Mettez ensuite fin à cette session.

L'utilisateur ne dispose pas de l'autorisation requise

Chaînes d'erreur :

Access Denied: Project [project_id]: User does not have bigquery.jobs.create permission in project [project_id].
User does not have permission to query table project-id:dataset.table.
Access Denied: User does not have permission to query table or perhaps it does not exist.

Ces erreurs peuvent se produire lorsque vous exécutez une requête sans l'autorisation bigquery.jobs.create sur le projet à partir duquel vous exécutez la requête, quelles que soient vos autorisations sur le projet contenant les données.

Ces erreurs peuvent également s'afficher si votre compte de service, votre utilisateur ou votre groupe ne dispose pas de l'autorisation bigquery.tables.getData sur toutes les tables et vues auxquelles votre requête fait référence. Pour en savoir plus sur les autorisations requises pour exécuter une requête, consultez Rôles requis.

Ces erreurs peuvent également se produire si la table n'existe pas dans la région interrogée, par exemple asia-south1. Vous pouvez vérifier la région en examinant l'emplacement de l'ensemble de données.

Lorsque vous corrigez ces erreurs, tenez compte des points suivants :

Comptes de service : les comptes de service doivent disposer de l'autorisation bigquery.jobs.create sur le projet à partir duquel ils s'exécutent, et de l'autorisation bigquery.tables.getData sur toutes les tables et vues référencées par la requête.
Rôles personnalisés : l'autorisation bigquery.jobs.create doit être explicitement incluse dans le rôle concerné pour les rôles IAM personnalisés. Ils doivent également disposer de l'autorisation bigquery.tables.getData sur toutes les tables et vues auxquelles la requête fait référence.
Ensembles de données partagés : lorsque vous travaillez avec des ensembles de données partagés dans un projet distinct, il se peut que vous ayez tout de même besoin de l'autorisation bigquery.jobs.create dans le projet pour exécuter des requêtes ou des jobs dans cet ensemble de données.

Pour autoriser l'accès à une table ou une vue, consultez Autoriser l'accès à une table ou une vue.

Accès refusé par une règle d'administration

Chaîne d'erreur : IAM setPolicy failed for Dataset DATASET: Operation denied by org policy on resource.

Cette erreur se produit lorsqu'une règle d'administration empêche le compte principal d'interroger une ressource BigQuery. Le service de règles d'administration vous permet d'appliquer des contraintes sur les ressources compatibles dans toute votre hiérarchie d'organisation.

Si le principal doit avoir accès à la ressource, vous devrez utiliser les outils de dépannage VPC disponibles pour diagnostiquer le problème lié à votre règle d'administration.

Problèmes liés à un dépassement de ressources

Les problèmes suivants se produisent lorsque BigQuery ne dispose pas de ressources suffisantes pour traiter votre requête.

La requête dépasse les ressources du processeur

Chaîne d'erreur : Query exceeded resource limits

Cela erreur se produit lorsque les requêtes à la demande utilisent trop de ressources de processeur par rapport à la quantité de données analysée. Pour en savoir plus sur la résolution de ces problèmes, consultez la page Résoudre les problèmes liés au dépassement de ressources.

La requête dépasse les ressources mémoire

Chaîne d'erreur : Resources exceeded during query execution: The query could not be executed in the allotted memory

Pour les instructions SELECT, cette erreur se produit lorsque la requête utilise trop de ressources. Pour résoudre cette erreur, consultez la section Résoudre les problèmes liés au dépassement de ressources.

Espace de pile insuffisant

Chaîne d'erreur : Out of stack space due to deeply nested query expression during query resolution.

Cette erreur peut se produire lorsqu'une requête contient trop d'appels de fonction imbriqués. Parfois, des parties d'une requête sont traduites en appels de fonction lors de l'analyse. Par exemple, une expression avec des opérateurs de concaténation répétés, comme A || B || C || ..., devient CONCAT(A, CONCAT(B, CONCAT(C, ...))).

Pour résoudre cette erreur, réécrivez votre requête afin de réduire le niveau d'imbrication.

Ressources dépassées lors de l'exécution de la requête

Chaîne d'erreur : Resources exceeded during query execution: The query could not be executed in the allotted memory. Peak usage: [percentage]% of limit. Top memory consumer(s): ORDER BY operations.

Cela peut se produire avec les requêtes ORDER BY ... LIMIT ... OFFSET .... En raison de détails d'implémentation, le tri peut avoir lieu sur une seule unité de calcul, qui peut manquer de mémoire si elle doit traiter trop de lignes avant l'application de LIMIT et OFFSET, en particulier avec un OFFSET élevé.

Pour résoudre cette erreur, évitez les grandes valeurs OFFSET dans les requêtes ORDER BY ... LIMIT. Vous pouvez également utiliser la fenêtrage évolutive ROW_NUMBER() pour attribuer des rangs en fonction de l'ordre choisi, puis filtrer ces rangs dans une clause WHERE. Exemple :

SELECT ...
FROM (
  SELECT ROW_NUMBER() OVER (ORDER BY ...) AS rn
  FROM ...
)
WHERE rn > @start_index AND rn <= @page_size + @start_index  -- note that row_number() starts with 1

La requête dépasse les ressources de brassage

Chaîne d'erreur : Resources exceeded during query execution: Your project or organization exceeded the maximum disk and memory limit available for shuffle operations

Cette erreur se produit lorsqu'une requête ne peut pas accéder à suffisamment de ressources de brassage.

Pour résoudre cette erreur, provisionnez plus d'emplacements ou réduisez la quantité de données traitée par la requête. Pour en savoir plus, consultez la section Quota de brassage insuffisant.

Pour en savoir plus sur la résolution de ces problèmes, consultez la section Résoudre les problèmes liés au dépassement de ressources.

Requête trop complexe

Chaîne d'erreur : Resources exceeded during query execution: Not enough resources for query planning - too many subqueries or query is too complex

Cette erreur se produit lorsqu'une requête est trop complexe. Les principales causes de la complexité sont les suivantes :

Clauses WITH profondément imbriquées ou utilisées à plusieurs reprises.
Vues profondément imbriquées ou utilisées à plusieurs reprises.
Utilisation répétée de l'opérateur UNION ALL.

Pour résoudre cette erreur, essayez les options suivantes :

Divisez la requête en plusieurs requêtes, puis utilisez un langage procédural pour exécuter ces requêtes en séquence, avec un état partagé.
Utilisez des tables temporaires au lieu des clauses WITH.
Réécrivez votre requête pour réduire le nombre d'objets référencés et de comparaisons.

Vous pouvez surveiller de manière proactive les requêtes qui approchent de la limite de complexité en utilisant le champ query_info.resource_warning dans la vue INFORMATION_SCHEMA.JOBS. L'exemple suivant renvoie les requêtes ayant entraîné une utilisation élevée des ressources au cours des trois derniers jours :

SELECT
  ANY_VALUE(query) AS query,
  MAX(query_info.resource_warning) AS resource_warning
FROM
  <your_project_id>.`region-us`.INFORMATION_SCHEMA.JOBS
WHERE
  creation_time > TIMESTAMP_SUB(CURRENT_TIMESTAMP(), INTERVAL 3 DAY)
  AND query_info.resource_warning IS NOT NULL
GROUP BY
  query_info.query_hashes.normalized_literals
LIMIT
  1000

Pour en savoir plus sur la résolution de ces problèmes, consultez la section Résoudre les problèmes liés au dépassement de ressources.

Résoudre les problèmes liés au dépassement de ressources

Pour les tâches de requête :

Pour optimiser vos requêtes, procédez comme suit :

Essayez de retirer une clause ORDER BY.
Si la requête utilise JOIN, assurez-vous que la plus grande table se trouve à gauche de la clause. Assurez-vous également que vos données ne contiennent pas de clés d'association en double.
Si la requête utilise FLATTEN, déterminez si elle est nécessaire pour ce cas d'utilisation. Pour en savoir plus, consultez la section sur les données imbriquées et répétées.
Si la requête utilise EXACT_COUNT_DISTINCT, pensez à utiliser plutôt COUNT(DISTINCT).
Si votre requête utilise COUNT(DISTINCT <value>, <n>) avec une valeur <n> élevée, pensez à utiliser GROUP BY à la place. Pour en savoir plus, consultez la section consacrée à COUNT(DISTINCT).
Si votre requête utilise UNIQUE, utilisez plutôt GROUP BY ou une fonction de fenêtre dans une instruction subselect.
Si votre requête matérialise plusieurs lignes à l'aide d'une clause LIMIT, envisagez de filtrer une autre colonne telle que ROW_NUMBER(), ou de supprimer complètement la clause LIMIT pour autoriser le chargement en parallèle des écritures.
Si votre requête utilise des vues profondément imbriquées et une clause WITH, cela peut entraîner une croissance exponentielle de complexité, atteignant ainsi les limites.
Utilisez des tables temporaires au lieu des clauses WITH. Une clause WITH peut devoir être recalculée plusieurs fois, ce qui peut compliquer la requête et la ralentir. La persistance des résultats intermédiaires dans les tables temporaires réduit la complexité.
Évitez d'utiliser des requêtes UNION ALL.
Si votre requête utilise MATCH_RECOGNIZE, modifiez la clause PARTITION BY pour réduire la taille des partitions ou ajoutez une clause PARTITION BY si elle n'existe pas.

Pour en savoir plus, consultez les ressources suivantes :

Pour les tâches de chargement :

Si vous chargez des fichiers Avro ou Parquet, réduisez la taille des lignes dans les fichiers. Recherchez les restrictions de taille spécifiques au format de fichier que vous chargez :

Si cette erreur se produit lors du chargement des fichiers ORC, contactez l'assistance.

Pour l'API Storage :

Chaîne d'erreur : Stream memory usage exceeded

Lors d'un appel ReadRows à l'API Storage Read, certains flux avec une utilisation élevée de mémoire peuvent obtenir une erreur RESOURCE_EXHAUSTED avec ce message. Cela peut se produire lors de la lecture de tables volumineuses ou de tables avec un schéma complexe. Pour résoudre le problème, réduisez la taille des lignes de résultat en sélectionnant moins de colonnes à lire (à l'aide du paramètre selected_fields), ou en simplifiant le schéma de la table.

Résoudre les problèmes de connectivité

Les sections suivantes expliquent comment résoudre les problèmes de connectivité lorsque vous essayez d'interagir avec BigQuery :

Ajouter le DNS Google à la liste d'autorisation

Utilisez l 'outil Google IP Dig pour résoudre le point de terminaison DNS BigQuery bigquery.googleapis.com en une seule adresse IP d'enregistrement A. Assurez-vous que cette adresse IP n'est pas bloquée dans les paramètres de votre pare-feu.

En général, nous vous recommandons d'ajouter les noms DNS Google à la liste d'autorisation. Les plages d'adresses IP partagées dans les fichiers https://www.gstatic.com/ipranges/goog.json et https://www.gstatic.com/ipranges/cloud.json changent souvent. Nous vous recommandons donc d'ajouter plutôt les noms de domaine DNS de Google à la liste d'autorisation. Voici une liste de noms DNS courants que nous vous recommandons d'ajouter à la liste d'autorisation :

*.1e100.net
*.google.com
*.gstatic.com
*.googleapis.com
*.googleusercontent.com
*.appspot.com
*.gvt1.com

Identifier le proxy ou le pare-feu qui supprime les paquets

Pour identifier tous les sauts de paquets entre le client et Google Front End (GFE), exécutez une commande traceroute sur votre machine cliente. Elle peut mettre en évidence le serveur qui supprime les paquets dirigés vers le GFE. Voici un exemple de commande traceroute :

traceroute -T -p 443 bigquery.googleapis.com

Il est également possible d'identifier les sauts de paquets pour des adresses IP GFE spécifiques si le problème est lié à une adresse IP particulière :

traceroute -T -p 443 142.250.178.138

En cas de problème de délai d'expiration côté Google, la requête sera envoyée jusqu'au GFE.

Si vous constatez que les paquets n'atteignent jamais le GFE, contactez votre administrateur réseau pour résoudre ce problème.

Générer un fichier PCAP et analyser votre pare-feu ou votre proxy

Générez un fichier de capture de paquets (PCAP) et analysez-le pour vous assurer que le pare-feu ou le proxy ne filtre pas les paquets vers les adresses IP Google et qu'il autorise les paquets à atteindre le GFE.

Voici un exemple de commande pouvant être exécutée avec l'outil tcpdump :

tcpdump -s 0 -w debug.pcap -K -n host bigquery.googleapis.com

Configurer des tentatives pour les problèmes de connectivité intermittents

Dans certaines situations, les équilibreurs de charge GFE peuvent interrompre les connexions provenant d'une adresse IP client. Par exemple, s'ils détectent des schémas de trafic DDoS ou si l'instance d'équilibreur de charge est en cours de réduction, ce qui peut entraîner le recyclage de l'adresse IP du point de terminaison. Si les équilibreurs de charge GFE interrompent la connexion, le client doit intercepter la requête ayant expiré et la relancer vers le point de terminaison DNS. Assurez-vous de ne pas utiliser la même adresse IP tant que la requête n'a pas abouti, car l'adresse IP peut avoir changé.

Si vous avez identifié un problème de délais d'attente cohérents côté Google pour lesquels les nouvelles tentatives ne sont pas utiles, contactez le Cloud Customer Care et veillez à inclure un nouveau fichier PCAP généré en exécutant un outil de capture de paquets tel que tcpdump.

Étapes suivantes

Obtenir des insights sur les performances des requêtes.
Découvrez comment optimiser les requêtes pour améliorer les performances.
Consultez la page Quotas et limites pour les requêtes.
En savoir plus sur les autres messages d'erreur BigQuery.