Résoudre les problèmes liés à Dataform

Ce document explique comment résoudre les problèmes liés à Dataform.

Accès à BigQuery refusé

L'erreur suivante se produit lorsque vous déclenchez une invocation de workflow avant d'accorder à Dataform l'accès à BigQuery:

Access Denied: Project PROJECT_ID: User does not have bigquery.jobs.create permission in project PROJECT_ID.

Pour résoudre cette erreur, accordez à Dataform l'accès à BigQuery.

Le jeton d'accès d'un dépôt distant est refusé

L'erreur suivante se produit lorsque votre jeton d'authentification pour un dépôt tiers connecté n'a pas accès à ce dépôt:

The access token for remote repository REPOSITORY_NAME was rejected

Pour résoudre cette erreur, vérifiez les autorisations requises dans votre fournisseur Git et mettez à jour le jeton d'authentification Secret Manager en conséquence. Pour en savoir plus sur l'authentification de dépôts Git tiers dans Dataform, consultez Se connecter à un dépôt Git tiers.

Quota BigQuery dépassé

L'erreur suivante se produit lorsque le nombre de requêtes API que Dataform envoie à BigQuery dépasse le quota BigQuery:

Quota exceeded: Your user_method exceeded quota for concurrent api requests
per user per method.

Pour résoudre cette erreur, réduisez le nombre de requêtes parallèles à moins de 250 fois comme suit:

Pour savoir comment résoudre cette erreur dans BigQuery, consultez la section Résoudre les erreurs de quota et de limite.

La limite de simultanéité des requêtes BigQuery est dépassée

L'erreur suivante se produit lorsque le nombre de requêtes simultanées exécutées dans BigQuery dépasse la limite de simultanéité des requêtes BigQuery:

Exceeded rate limits: too many concurrent queries for this project_and_region

Pour résoudre cette erreur, réduisez le nombre de requêtes parallèles à moins de 250 fois comme suit:

Pour savoir comment résoudre cette erreur dans BigQuery, consultez la section Résoudre les erreurs de quota et de limite.

Erreurs d'appel de workflow BigQuery

Les erreurs suivantes se produisent lors de l'exécution d'un workflow SQL vers BigQuery:

Pour résoudre ces erreurs, consultez la section Messages d'erreur BigQuery.

Propriétés includeDependentAssertions en conflit

L'erreur suivante se produit lors de la compilation lorsque le paramètre includeDependentAssertions est défini pour la même action avec des valeurs différentes dans un même fichier:

Conflicting "includeDependentAssertions" properties are not allowed. Dependency
dependencyName has different values set for this property.

Pour résoudre cette erreur, modifiez le fichier et supprimez les répétitions en conflit du paramètre includeDependentAssertions.

Pour en savoir plus sur l'utilisation du paramètre includeDependentAssertions pour définir des assertions en tant que dépendances, consultez la section Définir les assertions d'une action sélectionnée en tant que dépendances.

Échec de la compilation

Les erreurs suivantes se produisent lors de la compilation en raison de la taille ou du nombre de requêtes compilées:

  • Compilation timed out. Reduce the complexity of your project to ensure it can compile within limits.
  • Compilation exceeded its allowed heap memory limits. Reduce the complexity of your project to ensure it can compile within limits.
  • Compilation exceeded its allowed ArrayBuffer or string memory limits. Reduce the complexity of your project to ensure it can compile within limits.

Pour résoudre ces erreurs, procédez comme suit:

  1. Mettez à jour le noyau Dataform avec la dernière version.
  2. Inspectez votre workflow SQL pour identifier et réduire les inefficacités.
  3. Réduisez la taille des requêtes SQL.
  4. Réduisez le nombre d'opérations JavaScript en mémoire, par exemple:

    config { config {type: "table" }}
    js {
        const tooBig = new Uint8Array(110_000_000);
    }
    SELECT ...
    
  5. Diviser le dépôt

Pour en savoir plus sur les limites des ressources de compilation Dataform, consultez la section Quotas et limites.

@dataform/core erreurs de dépendance

Les erreurs suivantes se produisent lors de la compilation si la dépendance dataform-core dans package.json est obsolète:

Failed to resolve @dataform/core
@dataform/core version should be X.X.X or newer

La dépendance @dataform/core est obligatoire dans package.json. Lorsque vous initialisez le premier espace de travail de votre dépôt, Dataform renseigne automatiquement package.json avec la version actuelle de @dataform/core. Vous devez mettre à jour @dataform/core vers la dernière version dès qu'elle est disponible.

Pour résoudre ces erreurs, mettez à jour @dataform/core vers la dernière version.

Échec de la résolution de dataform.json

L'erreur suivante se produit lorsque vous initialisez un espace de travail Dataform, mais que le processus d'initialisation ne parvient pas à installer tous les packages:

Uncaught Error: Failed to resolve dataform.json

Pour résoudre cette erreur, dans votre espace de travail, ouvrez package.json et cliquez sur Installer des paquets.

Échec de la résolution de workflow_settings.yaml

L'erreur suivante se produit lorsque vous initialisez un espace de travail Dataform, mais que le processus d'initialisation ne parvient pas à installer tous les packages:

Uncaught Error: Failed to resolve workflow_settings.yaml

Pour résoudre cette erreur, dans votre espace de travail, ouvrez workflow_settings.yaml, puis cliquez sur Installer des packages.

Les cibles de packages git+ ne sont pas acceptées.

L'erreur suivante se produit lorsque vous définissez des packages dans package.json avec des cibles précédées du préfixe git+:

'git+' prefixed package targets are not currently supported. However,
in most cases they can be used via a '.tar.gz' suffixed target instead.

Dataform n'est pas compatible avec les cibles de package précédées du préfixe git+.

Pour résoudre cette erreur, générez une URL tar.gz du package et mettez à jour la cible du package dans package.json. Pour en savoir plus sur l'installation de packages dans Dataform, consultez Installer un package.

Délai d'installation du package dépassé

L'erreur suivante se produit lorsque la taille des packages définis dans package.json dépasse la taille maximale des dépendances NPM:

API request error: Package installation timed out

Pour résoudre cette erreur, supprimez les paquets redondants de package.json. Assurez-vous que le fichier package.json ne contient pas @dataform/cli et que la taille totale des dépendances NPM définies ne dépasse pas 200 Mo.

Si vos configurations de version font référence à des commits Git, assurez-vous que les fichiers package.json de leurs cibles sont valides.

Impossible d'accéder au registre de paquets privé

L'erreur suivante se produit lorsque l'authentification Dataform d'un package privé expire:

Permission denied when fetching one or more npm packages. Please verify that
private registry authentication details are valid for each npm registry

Pour résoudre cette erreur, vérifiez que les informations d'authentification du registre privé sont valides pour chaque registre NPM. Pour en savoir plus, consultez la section Authentifier un package privé.

Impossible d'accéder au dépôt distant

L'erreur suivante se produit en raison de l'instabilité de Git ou lorsqu'un nom de branche dans le dépôt Git tiers connecté contient un caractère non ASCII ou non anglais:

Remote repository REPOSITORY_NAME could not be reached.

Pour résoudre cette erreur, inspectez les noms de branches dans le dépôt tiers connecté. Si un nom de branche contient un caractère non ASCII ou non anglais, supprimez la branche.

Impossible d'accéder au dépôt distant: generic::invalid_argument

L'erreur suivante se produit sur la page Détails des configurations de version lorsqu'une version planifiée rencontre occasionnellement une connexion GitHub, GitLab ou Bitbucket lente, instable ou interrompue:

generic::invalid_argument: Remote repository 'REMOTE_REPOSITORY_URL' could not be reached.

Aucune action n'est requise de votre part. Sauf si les problèmes GitHub, GitLab ou Bitbucket Cloud persistent, les versions planifiées suivantes peuvent être publiées.

Impossible d'accéder au secret d'un dépôt distant

L'erreur suivante se produit lorsque votre compte de service Dataform ne peut pas accéder à votre secret Secret Manager pour un dépôt tiers connecté:

Dataform's service account is unable to reach the configured secret.
Make sure the secret exists and is shared with your Dataform service account:
SERVICE_ACCOUNT_ID.

Pour résoudre cette erreur, procédez comme suit :

  • Vérifiez que votre compte de service Dataform a accès au secret.
  • Excluez le secret de votre périmètre de service VPC-SC. Dataform n'est pas compatible avec VPC-SC pour le moment.

Argument inconnu: tags

L'erreur suivante se produit lorsque votre version de la CLI Dataform ne reconnaît pas l'argument tags:

Unknown argument: tags

Pour résoudre cette erreur, procédez comme suit :

  • Mettez à jour la version de la CLI vers 3.0.0 ou une version ultérieure. Testez toujours les nouvelles versions de paquets dans un environnement hors production avant de les déployer dans votre environnement de production.
  • Il est recommandé de toujours utiliser la dernière version disponible du package de base Dataform.
  • Spécifiez explicitement la version du package dans package.json, par exemple 3.0.0. N'utilisez pas d'autres options dependencies de package.json, par exemple >version.