Azure Data Lake Storage
Le connecteur Azure Data Lake Storage vous permet de vous connecter à Azure Data Lake Storage et d'utiliser SQL pour récupérer et mettre à jour les données Azure Data Lake Storage.
Avant de commencer
Avant d'utiliser le connecteur Azure Data Lake Storage, effectuez les tâches suivantes:
- Dans votre projet Google Cloud :
- Vérifiez que la connectivité réseau est configurée. Pour en savoir plus sur les modèles de réseau, consultez la section Connectivité réseau.
- Attribuez le rôle IAM roles/connectors.admin à l'utilisateur qui configure le connecteur.
- Attribuez les rôles IAM suivants au compte de service que vous souhaitez utiliser pour le connecteur :
roles/secretmanager.viewer
roles/secretmanager.secretAccessor
Un compte de service est un compte Google spécial destiné à représenter un utilisateur non humain qui doit s'authentifier et obtenir les autorisations permettant d'accéder aux données des API Google. Si vous ne possédez pas de compte de service, vous devez en créer un. Pour plus d'informations, consultez la section Créer un compte de service.
- Activez les services suivants :
secretmanager.googleapis.com
(API Secret Manager)connectors.googleapis.com
(API Connectors)
Pour savoir comment activer des services, consultez la page Activer des services.
Si ces services ou autorisations n'ont pas encore été activés pour votre projet, vous êtes invité à les activer lors de la configuration du connecteur.
- Pour savoir comment créer un compte de stockage Azure, consultez Créer un compte de stockage. Pour en savoir plus sur la création d'un conteneur dans Azure, consultez Créer un conteneur. Pour en savoir plus sur la création d'un répertoire dans Azure, consultez Créer un répertoire.
Configurer le connecteur
Pour configurer le connecteur, vous devez créer une connexion à votre source de données (système backend). Une connexion est spécifique à une source de données. Cela signifie que si vous disposez de nombreuses sources de données, vous devez créer une connexion distincte pour chacune d'elles. Pour créer une connexion, procédez comme suit :
- Dans la console Cloud, accédez à la page Integration Connectors > Connections (Connecteurs d'intégration > Connexions), puis sélectionnez ou créez un projet Google Cloud.
- Cliquez sur + Créer pour ouvrir la page Créer une connexion.
- Dans la section Emplacement, choisissez l'emplacement de la connexion.
- Région : sélectionnez un emplacement dans la liste déroulante.
Les régions disponibles pour les connecteurs sont les suivantes :
Pour obtenir la liste de toutes les régions disponibles, consultez la page Emplacements.
- Cliquez sur Next (Suivant).
- Région : sélectionnez un emplacement dans la liste déroulante.
- Dans la section Détails de connexion, procédez comme suit :
- Connecteur: sélectionnez Azure Data Lake Storage dans la liste déroulante des connecteurs disponibles.
- Version du connecteur : sélectionnez la version du connecteur dans la liste déroulante des versions disponibles.
- Dans le champ Nom de connexion, saisissez un nom pour l'instance de connexion.
Les noms de connexion doivent répondre aux critères suivants :
- Les noms de connexion peuvent contenir des lettres, des chiffres ou des traits d'union.
- Les lettres doivent être en minuscules.
- Les noms de connexion doivent commencer par une lettre et se terminer par une lettre ou un chiffre.
- Les noms de connexion ne peuvent pas dépasser 49 caractères.
- Saisissez éventuellement une Description pour l'instance de connexion.
- Vous pouvez également activer Cloud Logging, puis sélectionner un niveau de journalisation. Par défaut, le niveau de journalisation est défini sur
Error
. - Compte de service : sélectionnez un compte de service disposant des rôles requis.
- Vous pouvez également configurer les paramètres du nœud de connexion :
- Nombre minimal de nœuds : saisissez le nombre minimal de nœuds de connexion.
- Nombre maximal de nœuds : saisissez le nombre maximal de nœuds de connexion.
Un nœud est une unité (ou instance répliquée) de connexion qui traite des transactions. Pour traiter plus de transactions pour une connexion, plus de nœuds sont nécessaires. À l'inverse, moins de nœuds sont nécessaires pour traiter moins de transactions. Pour comprendre comment les nœuds affectent la tarification de votre connecteur, consultez la section Tarifs des nœuds de connexion. Si vous ne saisissez aucune valeur, le nombre minimal de nœuds est défini par défaut sur 2 (pour une meilleure disponibilité) et le nombre maximal sur 50.
- Compte: cette propriété spécifie le nom du compte Azure Data Lake Storage.
- Directory (Répertoire) : cette propriété spécifie le chemin d'accès racine pour lister les fichiers et les dossiers.
- File System (Système de fichiers) : cette propriété spécifie le nom du FileSystem qui sera utilisé dans un compte de stockage de deuxième génération. Par exemple, le nom de votre conteneur de blobs Azure.
- Taille des fragments: taille des fragments (en Mo) à utiliser lors de l'importation de fichiers volumineux.
- Inclure les sous-répertoires: indiquez si les chemins d'accès aux sous-répertoires doivent être listés dans la vue "Ressources" du schéma ADLSGen2.
- Vous pouvez également cliquer sur + Ajouter un libellé pour ajouter un libellé à la connexion sous la forme d'une paire clé/valeur.
- Cliquez sur Suivant.
-
Dans la section Authentification, saisissez les informations d'authentification.
- Sélectionnez un type d'authentification, puis saisissez les informations appropriées.
Les types d'authentification suivants sont compatibles avec la connexion Azure Data Lake Storage:
- Signature d'accès partagé
- Clé d'accès au compte
- Cliquez sur Next (Suivant).
Pour comprendre comment configurer ces types d'authentification, consultez la section Configurer l'authentification.
- Sélectionnez un type d'authentification, puis saisissez les informations appropriées.
- Vérifiez vos informations de connexion et d'authentification.
- Cliquez sur Créer.
Exemples de configuration de connexion
Cette section présente des exemples de valeurs pour les différents champs que vous configurez lorsque vous créez la connexion Azure Data Lake Storage.
Type de connexion Signature d'accès partagé
Nom du champ | Détails |
---|---|
Emplacement | us-central1 |
Connecteur | azuredatalakestorage |
Version du connecteur | 1 |
Nom de connexion | adls-gen2-conn-public |
Activer Cloud Logging | Oui |
Compte de service | SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com |
Compte | google-cloud-dslgen3 |
Annuaire | testdirectory1 |
Système de fichiers | testcontainer1 |
Inclure les sous-répertoires | Non |
Nombre minimal de nœuds | 2 |
Nombre maximal de nœuds | 50 |
Signature d'accès partagé | SHARED_ACCESS_SIGNATURE |
Version de secret | 1 |
Type de connexion de la clé d'accès au compte
Nom du champ | Détails |
---|---|
Emplacement | us-central1 |
Connecteur | azuredatalakestorage |
Version du connecteur | 1 |
Nom de connexion | azure-data-lake-conn |
Activer Cloud Logging | Oui |
Compte de service | SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com |
Compte | google-cloud-dslgen3 |
Annuaire | testdirectory1 |
Système de fichiers | testcontainer1 |
Inclure les sous-répertoires | Non |
Nombre minimal de nœuds | 2 |
Nombre maximal de nœuds | 50 |
Clé d'accès au compte | ACCOUNT_ACCESS_KEY |
Version de secret | 1 |
Configurer l'authentification
Saisissez les détails en fonction de l'authentification que vous souhaitez utiliser.
-
Signature d'accès partagé
Si vous souhaitez utiliser la connexion anonyme, sélectionnez Non disponible.
- Signature d'accès partagé: secret Secret Manager contenant la signature d'accès partagé.
-
Clé d'accès au compte
Si vous souhaitez utiliser la connexion anonyme, sélectionnez Non disponible.
- Clé d'accès au compte: secret Secret Manager contenant la clé d'accès au compte.
Entités, opérations et actions
Tous les connecteurs Integration Connectors fournissent une couche d'abstraction pour les objets de l'application connectée. Vous ne pouvez accéder aux objets d'une application que via cette abstraction. L'abstraction vous est présentée en tant qu'entités, opérations et actions.
- Entité : une entité peut être considérée comme un objet ou un ensemble de propriétés dans l'application ou le service connecté. La définition d'une entité diffère d'un connecteur à l'autre. Par exemple, dans un connecteur de base de données, les tables sont les entités, dans un connecteur de serveur de fichiers, les dossiers sont les entités et, dans un connecteur de système de messagerie, les files d'attente sont les entités.
Toutefois, il est possible qu'un connecteur ne soit pas compatible ou ne possède aucune entité. Dans ce cas, la liste
Entities
est vide. - Opération : une opération est l'activité que vous pouvez effectuer sur une entité. Vous pouvez effectuer l'une des opérations suivantes sur une entité :
La sélection d'une entité dans la liste disponible génère une liste d'opérations disponibles pour l'entité. Pour obtenir une description détaillée des opérations, consultez les opérations d'entité de la tâche de connecteur. Toutefois, si un connecteur n'est pas compatible avec l'une des opérations d'entité, ces opérations non compatibles ne sont pas listées dans la liste
Operations
. - Action : une action est une fonction de première classe mise à la disposition de l'intégration via l'interface du connecteur. Une action vous permet de modifier une ou plusieurs entités, et varie d'un connecteur à l'autre. Normalement, une action comporte des paramètres d'entrée et un paramètre de sortie. Toutefois, il est possible qu'un connecteur ne prenne en charge aucune action, auquel cas la liste
Actions
est vide.
Limites du système
Le connecteur Azure Data Lake Storage peut traiter cinq transactions par seconde et par nœud, et limite les transactions dépassant cette limite. Par défaut, les connecteurs d'intégration allouent deux nœuds (pour une meilleure disponibilité) à une connexion.
Pour en savoir plus sur les limites applicables à Integration Connectors, consultez la section Limites.
Actions
Cette section répertorie les actions compatibles avec le connecteur. Pour savoir comment configurer les actions, consultez Exemples d'actions.
Action DownloadFile
Cette action vous permet de télécharger le contenu d'un blob spécifique à partir d'un répertoire ou d'un conteneur.
Paramètres d'entrée de l'action DownloadFile
Nom du paramètre | Type de données | Obligatoire | Description |
---|---|---|---|
Chemin d'accès | Chaîne | Oui | Chemin d'accès au fichier (y compris le nom de fichier) à télécharger. Exemple :
|
HasBytes | Booléen | Non | Indique si le contenu doit être téléchargé sous forme d'octets (format Base64).
false .
|
Paramètres de sortie de l'action DownloadFile
Si l'action aboutit, elle renvoie le contenu du fichier ou du blob.
Pour savoir comment configurer l'action DownloadFile
, consultez la section Exemples d'actions.
Action CreateFile
Cette action vous permet de créer un blob ou un fichier dans un conteneur ou un répertoire.
Paramètres d'entrée de l'action CreateFile
Nom du paramètre | Type de données | Obligatoire | Description |
---|---|---|---|
Chemin d'accès | Chaîne | Oui | Chemin d'accès au fichier qui sera créé. |
Pour savoir comment configurer l'action CreateFile
, consultez la section Exemples d'actions.
Action CopyFile
Cette action vous permet de copier le contenu d'un fichier ou d'un blob dans un autre fichier ou blob du même conteneur ou du même répertoire.
Paramètres d'entrée de l'action CopyFile
Nom du paramètre | Type de données | Obligatoire | Description |
---|---|---|---|
Chemin source | Chaîne | Oui | Chemin d'accès au fichier qui sera copié. |
DestinationPath | Chaîne | Oui | Chemin d'accès au fichier dans lequel il sera copié. |
Pour savoir comment configurer l'action CopyFile
, consultez la section Exemples d'actions.
Action DeleteObject
Cette action vous permet de supprimer un fichier ou un blob.
Paramètres d'entrée de l'action DeleteObject
Nom du paramètre | Type de données | Obligatoire | Description |
---|---|---|---|
Récursif | Chaîne | Non | Définissez cette valeur sur true pour supprimer tout le contenu du dossier, y compris les sous-dossiers. |
Chemin d'accès | Chaîne | Oui | Chemin d'accès au fichier ou au dossier à supprimer. |
DeleteType | Chaîne | Oui |
|
Pour savoir comment configurer l'action DeleteObject
, consultez la section Exemples d'actions.
Action LeaseBlob
Cette action vous permet de créer et de gérer un verrouillage sur un blob.
Paramètres d'entrée de l'action LeaseBlob
Nom du paramètre | Type de données | Obligatoire | Description |
---|---|---|---|
Chemin d'accès | Chaîne | Oui | Chemin d'accès au fichier. |
LeaseAction | Chaîne | Oui | Spécifie l'action de bail à exécuter. |
LeaseDuration | Integer | Oui | Indique la durée du bail. |
Pour savoir comment configurer l'action LeaseBlob
, consultez la section Exemples d'actions.
Action UploadFile
Cette action permet aux utilisateurs d'importer le contenu dans un blob ou un conteneur spécifique.
Paramètres d'entrée de l'action UploadFile
Nom du paramètre | Type de données | Obligatoire | Description |
---|---|---|---|
Chemin d'accès | Chaîne | Oui | Chemin d'accès au fichier à importer. |
HasBytes | Booléen | Non | Indique si le contenu doit être importé sous la forme d'octets. |
Contenu | Chaîne | Oui | Contenu à importer. |
Pour savoir comment configurer l'action UploadFile
, consultez la section Exemples d'actions.
Action RenameObject
Cette action vous permet de renommer un fichier ou un dossier.
Paramètres d'entrée de l'action RenameObject
Nom du paramètre | Type de données | Obligatoire | Description |
---|---|---|---|
Chemin d'accès | Chaîne | Oui | Chemin d'accès qui sera renommé. |
RenameTo | Chaîne | Oui | Nouveau nom du fichier ou du dossier. |
Pour savoir comment configurer l'action RenameObject
, consultez la section Exemples d'actions.
Exemples d'actions
Exemple : Télécharger un fichier
Cet exemple télécharge un fichier binaire.
- Dans la boîte de dialogue
Configure connector task
, cliquez surActions
. - Sélectionnez l'action
DownloadFile
, puis cliquez sur OK. - Dans la section Task Input (Entrée de la tâche) de la tâche Connectors (Connecteurs), cliquez sur
connectorInputPayload
, puis saisissez une valeur semblable à la suivante dans le champDefault Value
:{ "Path": "testdirectory1/test1.pdf", "HasBytes": true }
Si l'action réussit, le paramètre de réponse connectorOutputPayload
de la tâche DownloadFile
aura une valeur semblable à celle-ci:
[{ "Success": "True", "ContentBytes": "UEsDBBQABgAIAAAAIQCj77sdZQEAAFIFAAATAAgCW0NvbnRlbnRfVHlwZXNdLnhtbCCiBAIooA" }]
Exemple : Importer un fichier
Cet exemple importe du contenu sous la forme d'un blob.
- Dans la boîte de dialogue
Configure connector task
, cliquez surActions
. - Sélectionnez l'action
UploadFile
, puis cliquez sur OK. - Dans la section Entrée de la tâche de la tâche Connecteurs, cliquez sur
connectorInputPayload
, puis saisissez une valeur semblable à la suivante dans le champDefault Value
:{ "Path": "testblob4", "HasBytes": true, "Content": "abcdef\nabcdef" }
Si l'action réussit, le paramètre de réponse connectorOutputPayload
de la tâche UploadFile
aura une valeur semblable à celle-ci:
[{ "Success": "true" }]
Exemple : Créer un fichier
Cet exemple crée un fichier dans le répertoire spécifié.
- Dans la boîte de dialogue
Configure connector task
, cliquez surActions
. - Sélectionnez l'action
CreateFile
, puis cliquez sur OK. - Dans la section Entrée de la tâche de la tâche Connecteurs, cliquez sur
connectorInputPayload
, puis saisissez une valeur semblable à la suivante dans le champDefault Value
:{ "path": "testdirectory1/testblob" }
Si l'action réussit, le paramètre de réponse connectorOutputPayload
de la tâche CreateFile
aura une valeur semblable à celle-ci:
[{ "Success": "true" }]
Exemple : Copier un fichier
Cet exemple copie un fichier d'un emplacement à un autre.
- Dans la boîte de dialogue
Configure connector task
, cliquez surActions
. - Sélectionnez l'action
CopyFile
, puis cliquez sur OK. - Dans la section Entrée de la tâche de la tâche Connecteurs, cliquez sur
connectorInputPayload
, puis saisissez une valeur semblable à la suivante dans le champDefault Value
:{ "SourcePath": "testdirectory1/testblob", "DestinationPath": "testblob" }
Si l'action réussit, le paramètre de réponse connectorOutputPayload
de la tâche CopyFile
aura une valeur semblable à celle-ci:
[{ "Success": "true" }]
Exemple : Supprimer un blob
Cet exemple supprime le blob spécifié.
- Dans la boîte de dialogue
Configure connector task
, cliquez surActions
. - Sélectionnez l'action
DeleteObject
, puis cliquez sur OK. - Dans la section Entrée de la tâche de la tâche Connecteurs, cliquez sur
connectorInputPayload
, puis saisissez une valeur semblable à la suivante dans le champDefault Value
:{ "path": "testdirectory1/testblob" }
Si l'action réussit, le paramètre de réponse connectorOutputPayload
de la tâche DeleteObject
aura une valeur semblable à celle-ci:
[{ "Success": "true" }]
Exemple : Louer un blob
Cet exemple loue le blob spécifié.
- Dans la boîte de dialogue
Configure connector task
, cliquez surActions
. - Sélectionnez l'action
LeaseBlob
, puis cliquez sur OK. - Dans la section Entrée de la tâche de la tâche Connecteurs, cliquez sur
connectorInputPayload
, puis saisissez une valeur semblable à la suivante dans le champDefault Value
:{ "Path": "testblob2", "LeaseAction": "Acquire", "LeaseDuration": 60.0 }
Si l'action réussit, le paramètre de réponse connectorOutputPayload
de la tâche LeaseBlob
aura une valeur semblable à celle-ci:
[{ "LeaseId": "7aae9ca2-f015-41b6-9bdf-5fd3401fc493", "Success": "true" }]
Exemple : Renommer un blob
Cet exemple renomme un blob.
- Dans la boîte de dialogue
Configure connector task
, cliquez surActions
. - Sélectionnez l'action
RenameObject
, puis cliquez sur OK. - Dans la section Entrée de la tâche de la tâche Connecteurs, cliquez sur
connectorInputPayload
, puis saisissez une valeur semblable à la suivante dans le champDefault Value
:{ "Path": "testblob", "RenameTo": "testblob6" }
Si l'action réussit, le paramètre de réponse connectorOutputPayload
de la tâche RenameObject
aura une valeur semblable à celle-ci:
[{ "Success": true }]
Exemples d'opérations d'entité
Cette section explique comment effectuer certaines opérations d'entité dans ce connecteur.
Exemple : Répertorier tous les enregistrements
Cet exemple liste tous les enregistrements de l'entité Resource
.
- Dans la boîte de dialogue
Configure connector task
, cliquez surEntities
. - Sélectionnez
Resource
dans la listeEntity
. - Sélectionnez l'opération
List
, puis cliquez sur OK. - Dans la section Task Input (Entrée de la tâche) de la tâche Connectors (Connecteurs), vous pouvez filtrer votre ensemble de résultats en spécifiant une clause de filtre. Spécifiez toujours la valeur de la clause de filtre entre guillemets simples (').
Exemple : Obtenir un enregistrement
Cet exemple récupère un enregistrement avec l'ID spécifié à partir de l'entité Resource
.
- Dans la boîte de dialogue
Configure connector task
, cliquez surEntities
. - Sélectionnez
Resource
dans la listeEntity
. - Sélectionnez l'opération
Get
, puis cliquez sur OK. - Dans la section Task Input (Entrée de la tâche) de la tâche Connectors (Connecteurs), cliquez sur EntityId, puis saisissez
testdirectory1/testblob1
dans le champ Default Value (Valeur par défaut).Ici,
testdirectory1/testblob1
est un ID d'enregistrement unique dans l'entitéResource
.
Utiliser la connexion Azure Data Lake Storage dans une intégration
Une fois la connexion créée, elle devient disponible à la fois dans Apigee Integration et Application Integration. Vous pouvez utiliser la connexion dans une intégration via la tâche Connecteurs.
- Pour savoir comment créer et utiliser la tâche Connecteurs dans Apigee Integration, consultez la section Tâche Connecteurs.
- Pour savoir comment créer et utiliser la tâche Connecteurs dans Application Integration, consultez la section Tâche Connecteurs.
Obtenir de l'aide auprès de la communauté Google Cloud
Vous pouvez publier vos questions et discuter de ce connecteur sur les forums Cloud de la communauté Google Cloud.Étape suivante
- Découvrez comment suspendre et réactiver une connexion.
- Découvrez comment surveiller l'utilisation des connecteurs.
- Découvrez comment afficher les journaux de connecteur.