Lire à partir de plusieurs tables Microsoft SQL Server


Cette page explique comment lire plusieurs tables à partir d'une base de données Microsoft SQL Server à l'aide de la source multitables. Utilisez la source multi-tables lorsque vous souhaitez que votre pipeline lise des données à partir de plusieurs tables. Si vous souhaitez que votre pipeline lise les données d'une seule table, consultez la section Lire à partir d'une table SQL Server.

La source multicloud génère des données avec plusieurs schémas et inclut un champ de nom de table qui indique la table d'où proviennent les données. Lorsque vous utilisez la source multicloud, utilisez l'un des récepteurs multitables, la multitable BigQuery ou le fichier multiple GCS.

Avant de commencer

  1. Connectez-vous à votre compte Google Cloud. Si vous débutez sur Google Cloud, créez un compte pour évaluer les performances de nos produits en conditions réelles. Les nouveaux clients bénéficient également de 300 $ de crédits gratuits pour exécuter, tester et déployer des charges de travail.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Make sure that billing is enabled for your Google Cloud project.

  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  5. Make sure that billing is enabled for your Google Cloud project.

  6. Enable the Cloud Data Fusion, Cloud Storage, BigQuery, and Dataproc APIs.

    Enable the APIs

  7. Créez une instance Cloud Data Fusion.
  8. Assurez-vous que votre base de données SQL Server peut accepter les connexions depuis Cloud Data Fusion. Pour ce faire, nous vous recommandons de créer une instance Cloud Data Fusion privée.

Afficher votre instance Cloud Data Fusion

Lorsque vous utilisez Cloud Data Fusion, vous utilisez à la fois la console Google Cloud et l'interface utilisateur Cloud Data Fusion distincte. Dans la console Google Cloud, vous pouvez créer un projet Google Cloud, ainsi que créer et supprimer des instances Cloud Data Fusion. Dans l'interface utilisateur Cloud Data Fusion, vous pouvez utiliser les différentes pages, telles que Studio ou Wrangler, pour utiliser les fonctionnalités de Cloud Data Fusion.

  1. Dans la console Google Cloud, accédez à la page Cloud Data Fusion.

  2. Pour ouvrir l'instance dans Cloud Data Fusion Studio, Cliquez sur Instances, puis sur Afficher l'instance.

    Accéder à la page "Instances"

Stocker votre mot de passe SQL Server en tant que clé sécurisée

Ajoutez votre mot de passe SQL Server en tant que clé sécurisée à chiffrer sur votre instance Cloud Data Fusion. Plus loin dans ce guide, vous veillerez à ce que votre mot de passe soit récupéré à l'aide de Cloud KMS.

  1. En haut à droite de n'importe quelle page Cloud Data Fusion, cliquez sur Administrateur système.

  2. Cliquez sur l'onglet Configuration.

  3. Cliquez sur Effectuer des appels HTTP.

    Configuration.

  4. Dans le menu déroulant, sélectionnez PUT.

  5. Dans le champ "Chemin d'accès", saisissez namespaces/NAMESPACE_ID/securekeys/PASSWORD.

  6. Dans le champ Corps, saisissez {"data":"SQL_SERVER_PASSWORD"}.

  7. Cliquez sur Envoyer.

    Mot de passe.

Assurez-vous que la Réponse que vous recevez correspond au code d'état 200.

Obtenir le pilote JDBC pour SQL Server

Utiliser le hub

  1. Dans l'interface utilisateur de Cloud Data Fusion, cliquez sur Hub.

  2. Dans la barre de recherche, saisissez Microsoft SQL Server JDBC Driver.

  3. Cliquez sur Pilote JDBC Microsoft SQL Server.

  4. Cliquez sur Download (Télécharger). Suivez la procédure de téléchargement affichée.

  5. Cliquez sur Déployer. Importez le fichier JAR de l'étape précédente.

  6. Cliquez sur Terminer.

Utiliser Studio

  1. Accédez au site Microsoft.com.

  2. Choisissez votre téléchargement, puis cliquez sur Télécharger.

  3. Dans l'interface utilisateur de Cloud Data Fusion, cliquez sur le menu , puis accédez à la page Studio.

  4. Cliquez sur Ajouter.

  5. Sous Pilote, cliquez sur Importer.

  6. Importez le fichier JAR téléchargé à l'étape 2.

  7. Cliquez sur Suivant.

  8. Configurez le pilote en saisissant un nom.

  9. Dans le champ Class name (Nom de la classe), saisissez com.microsoft.sqlserver.jdbc.SQLServerDriver.

  10. Cliquez sur Terminer.

Déployer les plug-ins multi-tables

  1. Dans l'interface utilisateur Web de Cloud Data Fusion, cliquez sur Hub.

  2. Dans la barre de recherche, saisissez Multiple table plugins.

  3. Cliquez sur Plug-ins multi-tables.

    Mot de passe.
  4. Cliquez sur Déployer.

  5. Cliquez sur Terminer.

  6. Cliquez sur Créer un pipeline.

Se connecter à SQL Server

  1. Dans l'interface utilisateur de Cloud Data Fusion, cliquez sur le menu , puis accédez à la page Studio.

  2. Dans Studio, développez le menu Source.

  3. Cliquez sur Multiple Database Tables (Tables à plusieurs bases de données).

    Tables multiples.
  4. Placez le pointeur sur le nœud Multiple Database Tables (Tables à plusieurs bases de données), puis cliquez sur Properties (Propriétés).

    Propriétés.
  5. Dans le champ Nom de la référence, spécifiez un nom de référence qui sera utilisé pour identifier votre source SQL Server.

  6. Dans le champ Chaîne de connexion JDBC, saisissez la chaîne de connexion JDBC. Exemple : jdbc:sqlserver://mydbhost:1433. Pour en savoir plus, consultez Créer l'URL de connexion.

  7. Renseignez les champs Nom du plug-in JDBC, Nom d'utilisateur de la base de données et Mot de passe de l'utilisateur de la base de données.

  8. Cliquez sur Valider.

  9. Cliquez sur Fermer.

Associer Looker Studio à BigQuery ou Cloud Storage

  1. Dans l'interface utilisateur de Cloud Data Fusion, cliquez sur le menu , puis accédez à la page Studio.

  2. Développez Récepteur.

  3. Cliquez sur Multitable BigQuery ou Multifichier GCS.

  4. Connectez le nœud Multiple Database Tables (Tables de bases de données multiples) à l'option Multitable BigQuery ou Multi File GCS.

    Branchez un lavabo.
  5. Gardez le pointeur de la souris sur le nœud Multitable BigQuery ou Multi File GCS, cliquez sur Propriétés et configurez le récepteur.

    Pour en savoir plus, consultez les pages Récepteur multi-table Google BigQuery et Récepteur multi-fichiers Google Cloud Storage.

  6. Cliquez sur Valider.

  7. Cliquez sur Fermer.

Exécuter l'aperçu du pipeline

  1. Dans l'interface utilisateur de Cloud Data Fusion, cliquez sur le menu , puis accédez à la page Studio.

  2. Cliquez sur Aperçu.

  3. Cliquez sur Exécuter. Attendez que l'aperçu se termine correctement.

Déployer le pipeline

  1. Dans l'interface utilisateur de Cloud Data Fusion, cliquez sur le menu , puis accédez à la page Studio.

  2. Cliquez sur Déployer.

Exécuter le pipeline

  1. Dans l'interface utilisateur de Cloud Data Fusion, cliquez sur le menu .

  2. Cliquez sur Liste.

  3. Cliquez sur le pipeline.

  4. Sur la page des détails du pipeline, cliquez sur Run (Exécuter).

Étapes suivantes