Lire les données de plusieurs tables Microsoft SQL Server


Cette page explique comment lire plusieurs tables d'une base de données Microsoft SQL Server, à l'aide de la source multi-tables. Utilisez la source multi-tables lorsque vous souhaitez que votre pipeline lise des données à partir de plusieurs tables. Si vous souhaitez que votre pipeline lise des données à partir d'une seule table, consultez la section Lire les données d'une table SQL Server.

La source multi-tables génère des données avec plusieurs schémas et inclut un champ de nom de table indiquant la table de provenance des données. Lorsque vous utilisez la source multi-tables, utilisez l'un des récepteurs multi-tables, à savoir BigQuery multi-tables ou GCS multi-fichiers.

Avant de commencer

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Make sure that billing is enabled for your Google Cloud project.

  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  5. Make sure that billing is enabled for your Google Cloud project.

  6. Enable the Cloud Data Fusion, Cloud Storage, BigQuery, and Dataproc APIs.

    Enable the APIs

  7. Créez une instance Cloud Data Fusion.
  8. Assurez-vous que votre base de données SQL Server peut accepter les connexions depuis Cloud Data Fusion. Pour ce faire, nous vous recommandons de créer une instance Cloud Data Fusion privée.

Afficher votre instance Cloud Data Fusion

Lorsque vous utilisez Cloud Data Fusion, vous utilisez à la fois la console Google Cloud et l'interface utilisateur distincte Cloud Data Fusion. Dans la console Google Cloud, vous pouvez créer un projet Google Cloud , et créer et supprimer des instances Cloud Data Fusion. Dans l'interface utilisateur de Cloud Data Fusion, vous pouvez utiliser les différentes pages, telles que Studio ou Wrangler, pour utiliser les fonctionnalités de Cloud Data Fusion.

  1. Dans la console Google Cloud, accédez à la page Cloud Data Fusion.

  2. Pour ouvrir l'instance dans Cloud Data Fusion Studio, cliquez sur Instances, puis sur Afficher l'instance.

    Accéder à la page "Instances"

Stocker votre mot de passe SQL Server en tant que clé sécurisée

Ajoutez votre mot de passe SQL Server en tant que clé sécurisée à chiffrer sur votre instance Cloud Data Fusion. Plus loin dans ce guide, vous veillerez à ce que votre mot de passe soit récupéré à l'aide de Cloud KMS.

  1. En haut à droite de n'importe quelle page Cloud Data Fusion, cliquez sur Administrateur système.

  2. Cliquez sur l'onglet Configuration.

  3. Cliquez sur Envoyer des appels HTTP.

    Configuration.

  4. Dans le menu déroulant, sélectionnez PUT.

  5. Dans le champ "Chemin d'accès", saisissez namespaces/NAMESPACE_ID/securekeys/PASSWORD.

  6. Dans le champ Corps, saisissez {"data":"SQL_SERVER_PASSWORD"}.

  7. Cliquez sur Envoyer.

    Mot de passe.

Assurez-vous que la Réponse que vous recevez correspond au code d'état 200.

Obtenir le pilote JDBC pour SQL Server

Utiliser le hub

  1. Dans l'interface utilisateur de Cloud Data Fusion, cliquez sur Hub.

  2. Dans la barre de recherche, saisissez Microsoft SQL Server JDBC Driver.

  3. Cliquez sur Pilote JDBC Microsoft SQL Server.

  4. Cliquez sur Download (Télécharger). Suivez la procédure de téléchargement affichée.

  5. Cliquez sur Déployer. Importez le fichier JAR de l'étape précédente.

  6. Cliquez sur Terminer.

Utiliser Studio

  1. Accédez au site Microsoft.com.

  2. Choisissez votre téléchargement, puis cliquez sur Télécharger.

  3. Dans l'interface utilisateur de Cloud Data Fusion, cliquez sur Menu, puis accédez à la page Studio.

  4. Cliquez sur Ajouter.

  5. Sous Pilote, cliquez sur Importer.

  6. Importez le fichier JAR téléchargé à l'étape 2.

  7. Cliquez sur Suivant.

  8. Configurez le pilote en saisissant un nom.

  9. Dans le champ Nom de la classe, saisissez com.microsoft.sqlserver.jdbc.SQLServerDriver.

  10. Cliquez sur Terminer.

Déployer les plug-ins multi-tables

  1. Dans l'interface utilisateur Web de Cloud Data Fusion, cliquez sur Hub.

  2. Dans la barre de recherche, saisissez Multiple table plugins.

  3. Cliquez sur Plug-ins multi-tables.

    Mot de passe.
  4. Cliquez sur Déployer.

  5. Cliquez sur Terminer.

  6. Cliquez sur Créer un pipeline.

Se connecter à SQL Server

  1. Dans l'interface utilisateur de Cloud Data Fusion, cliquez sur Menu, puis accédez à la page Studio.

  2. Dans Studio, développez le menu Source.

  3. Cliquez sur Multiple Database Tables (Tables à plusieurs bases de données).

    Tables multiples.
  4. Placez le pointeur sur le nœud Multiple Database Tables (Tables à plusieurs bases de données), puis cliquez sur Properties (Propriétés).

    Propriétés.
  5. Dans le champ Reference name (Nom de référence), spécifiez un nom de référence qui servira à identifier votre source SQL Server.

  6. Dans le champ JDBC Connection String (Chaîne de connexion JDBC), saisissez la chaîne de connexion JDBC. Exemple : jdbc:sqlserver://mydbhost:1433. Pour en savoir plus, consultez la section Créer l'URL de connexion.

  7. Saisissez le nom du plug-in JDBC, le nom d'utilisateur de la base de données et le mot de passe de l'utilisateur de la base de données.

  8. Cliquez sur Valider.

  9. Cliquez sur Fermer.

Se connecter à BigQuery ou Cloud Storage

  1. Dans l'interface utilisateur de Cloud Data Fusion, cliquez sur Menu, puis accédez à la page Studio.

  2. Développez Évier.

  3. Cliquez sur BigQuery multi-tables ou GCS multi-fichiers.

  4. Connectez le nœud Plusieurs tableaux de base de données à BigQuery multi-tables ou à GCS multi-fichiers.

    Connectez le lavabo.
  5. Maintenez le pointeur sur le nœud BigQuery multi-tables ou GCS multi-fichiers, cliquez sur Propriétés, puis configurez le récepteur.

    Pour en savoir plus, consultez Récepteur Google BigQuery multi-tables et Récepteur Google Cloud Storage multi-fichiers.

  6. Cliquez sur Valider.

  7. Cliquez sur Fermer.

Exécuter un aperçu du pipeline

  1. Dans l'interface utilisateur de Cloud Data Fusion, cliquez sur Menu, puis accédez à la page Studio.

  2. Cliquez sur Aperçu.

  3. Cliquez sur Exécuter. Attendez que l'aperçu se termine.

Déployer le pipeline

  1. Dans l'interface utilisateur de Cloud Data Fusion, cliquez sur Menu, puis accédez à la page Studio.

  2. Cliquez sur Déployer.

Exécuter le pipeline

  1. Dans l'interface utilisateur de Cloud Data Fusion, cliquez sur Menu.

  2. Cliquez sur Liste.

  3. Cliquez sur le pipeline.

  4. Sur la page des détails du pipeline, cliquez sur Exécuter.

Étape suivante