Provisionner des ressources Dataplex avec Terraform

HashiCorp Terraform est un outil IaC (Infrastructure as Code) qui vous permet de provisionner et de gérer l'infrastructure cloud. Terraform fournit des plug-ins appelés fournisseurs qui vous permettent d'interagir avec des fournisseurs cloud et d'autres API. Vous pouvez utiliser le fournisseur Terraform pour Google Cloud pour provisionner et gérer les ressources Google Cloud , y compris Dataplex.

Cette page vous présente l'utilisation de Terraform avec Dataplex, y compris une présentation du fonctionnement de Terraform et des ressources pour vous aider à commencer à utiliser Terraform avec Google Cloud. Vous trouverez également des liens vers la documentation de référence Terraform pour Dataplex, des exemples de code et des guides sur l'utilisation de Terraform pour provisionner des ressources Dataplex.

Pour savoir comment commencer à utiliser Terraform pour Google Cloud, consultez Installer et configurer Terraform ou la présentation rapide Terraform pour Google Cloud .

Fonctionnement de Terraform

Terraform possède une syntaxe déclarative et axée sur la configuration qui vous permet de décrire l'infrastructure que vous souhaitez provisionner dans votre projet Google Cloud . Après avoir créé cette configuration dans un ou plusieurs fichiers de configuration Terraform, vous pouvez utiliser la CLI Terraform pour appliquer cette configuration à vos ressources Dataplex.

Les étapes suivantes expliquent le fonctionnement de Terraform :

  1. Vous devez décrire l'infrastructure que vous souhaitez provisionner dans un fichier de configuration Terraform. Vous n'avez pas besoin d'écrire de code décrivant comment provisionner l'infrastructure. Terraform provisionne l'infrastructure pour vous.
  2. Vous exécutez la commande terraform plan, qui évalue votre configuration et génère un plan d'exécution. Vous pouvez examiner le plan et apporter les modifications nécessaires.
  3. Vous exécutez la commande terraform apply, qui effectue les actions suivantes :

    1. Il provisionne votre infrastructure en fonction de votre plan d'exécution en appelant les API Dataplex correspondantes en arrière-plan.
    2. Il crée un fichier d'état Terraform, qui est un fichier JSON qui mappe les ressources de votre fichier de configuration avec les ressources de l'infrastructure réelle. Terraform utilise ce fichier pour conserver un enregistrement de l'état le plus récent de votre infrastructure et pour déterminer quand créer, mettre à jour et détruire des ressources.
    3. Lorsque vous exécutez terraform apply, Terraform utilise le mappage dans le fichier d'état pour comparer l'infrastructure existante au code et effectuer les mises à jour si nécessaire :

      • Si un objet de ressource est défini dans le fichier de configuration, mais n'existe pas dans le fichier d'état, Terraform le crée.
      • Si un objet de ressource existe dans le fichier d'état, mais possède une configuration différente de celle contenue dans votre fichier de configuration, Terraform met à jour la ressource en fonction de votre fichier de configuration.
      • Si un objet de ressource dans le fichier d'état correspond à votre fichier de configuration, Terraform laisse la ressource telle quelle.

Ressources Terraform pour Dataplex

Les ressources sont les éléments fondamentaux du langage Terraform. Chaque bloc de ressources décrit un ou plusieurs objets d'infrastructure, tels que des réseaux virtuels ou des instances de calcul.

Le tableau suivant répertorie les ressources Terraform disponibles pour Dataplex:

Service Ressources Terraform Sources de données
Dataplex

Guides basés sur Terraform pour Dataplex

Le tableau suivant recense les guides d'utilisation et tutoriels basés sur Terraform pour Dataplex:

Guide Détails
Gérer les règles de qualité des données en tant que code avec Terraform Ce tutoriel explique comment gérer les règles de qualité des données Dataplex en tant que code avec Terraform, Cloud Build et GitHub.

Modules et plans Terraform pour Dataplex

Les modules et les plans vous aident à automatiser le provisionnement et la gestion des ressources Google Cloud à grande échelle. Un module est un ensemble de fichiers de configuration Terraform réutilisables qui crée une abstraction logique des ressources Terraform. Un plan comprend un package de modules déployables et réutilisables ainsi qu'une règle qui implémente et documente une solution spécifique.

Le tableau suivant répertorie les modules et les modèles liés à Dataplex:

Module ou plan Détails
dataplex-auto-data-quality Ce module explique comment déployer des règles de qualité des données sur des tables BigQuery dans les environnements de développement et de production à l'aide de Cloud Build.

Étape suivante