Créer une liste d'URL

Cette page explique comment créer une liste d'URL et tester le processus de génération de hachages MD5. Vous pouvez transférer des données depuis une liste d'emplacements de données publics vers un bucket Cloud Storage à l'aide du service de transfert de stockage. Lorsque vous configurez le transfert, il vous suffit simplement de vous référer à la liste d'URL.

Exigences

Les listes d'URL doivent remplir les conditions suivantes :

  • La liste d'URL doit être un fichier de valeurs séparées par des tabulations (TSV).

  • Les URL doivent être triées dans l'ordre lexicographique UTF-8.

  • Le serveur définit un en-tête Etag fort dans la réponse HTTP lorsqu'il renvoie la liste d'URL.

  • La liste d'URL est accessible à partir d'une URL commençant par http ou https.

Pour vous assurer que vos données sont transférables, vérifiez les points suivants :

  • Chaque URL spécifiée est accessible au public.

    Par exemple, dans Cloud Storage, vous pouvez partager un objet publiquement et obtenir un lien vers celui-ci.

  • Le fichier robots.txt du serveur permet d'accéder à chaque URL.

  • Le serveur hébergeant chaque objet :

    • Est compatible avec les requêtes Range
    • Renvoie un en-tête Content-Length dans chaque réponse.

Mettre en forme la liste d'URL

Procédez comme suit pour mettre en forme une liste d'URL :

  1. Créez un fichier de valeurs séparées par des tabulations (TSV).

  2. Insérez le spécificateur de format TsvHttpData-1.0 sur la première ligne.

  3. Ajoutez des lignes supplémentaires pour chaque objet à transférer. Sur chaque ligne, incluez, dans l'ordre, les champs suivants séparés par des tabulations :

    • L'URL HTTP ou HTTPS d'un objet source.

      Lorsqu'un objet situé sur http(s)://[HOSTNAME]:[PORT]/[URL_PATH] est transféré vers Cloud Storage, le nom de l'objet dans Cloud Storage est [HOSTNAME]/[URL_PATH].

    • La taille de l'objet en octets.

      Assurez-vous que la taille spécifiée correspond à la taille réelle de l'objet lors de son extraction. Si la taille de l'objet reçu par Cloud Storage ne correspond pas à la taille spécifiée, le transfert de l'objet échouera.

    • La somme de contrôle MD5 encodée en Base64 de l'objet.

      Assurez-vous que la somme de contrôle MD5 spécifiée correspond à celle calculée à partir des octets transférés. Si la somme de contrôle MD5 de l'objet reçu par Cloud Storage ne correspond pas à celle spécifiée, le transfert de l'objet échouera.

      Pour plus d'informations sur la génération de sommes de contrôle MD5, consultez la section Générer des sommes de contrôle MD5.

    Voici un exemple de fichier TSV spécifiant deux objets à transférer :

    TsvHttpData-1.0
    https://example.com/buckets/obj1      1357      wHENa08V36iPYAsOa2JAdw==
    https://example.com/buckets/obj2      2468      R9acAaveoPd2y8nniLUYbw==
    

Générer des sommes de contrôle MD5

Cloud Storage vérifie l'intégrité de vos données à l'aide de la somme de contrôle MD5 que vous fournissez pour chaque objet.

Utilisez l'objet public suivant pour vérifier que vous générez correctement la somme de contrôle MD5 :

https://storage.googleapis.com/md5-test/md5-test

Cet objet possède une somme de contrôle MD5 encodée en base64 de BfnRTwvHpofMOn2Pq7EVyQ==.

Copiez l'objet dans un fichier local appelé md5-test et vérifiez la somme de contrôle à l'aide d'OpenSSL :

openssl md5 -binary md5-test | openssl enc -base64

Étape suivante