Cette page explique comment créer une liste d'URL et tester le processus de génération de hachages MD5. Vous pouvez transférer des données depuis une liste d'emplacements de données publics vers un bucket Cloud Storage à l'aide du service de transfert de stockage. Lorsque vous configurez le transfert, il vous suffit simplement de vous référer à la liste d'URL.
Exigences
Les listes d'URL doivent remplir les conditions suivantes :
La liste d'URL doit être un fichier TSV (valeurs séparées par des tabulations).
Les URL doivent être triées dans l'ordre lexicographique UTF-8.
Le serveur définit un en-tête
Etag
fort dans la réponse HTTP lorsqu'il renvoie la liste d'URL.La liste d'URL est accessible publiquement à partir d'une URL commençant par
http
ouhttps
.
Pour vous assurer que vos données sont transférables, vérifiez les points suivants :
Chaque URL spécifiée est accessible au public.
Par exemple, dans Cloud Storage, vous pouvez partager un objet publiquement et obtenir un lien vers celui-ci.
Le fichier
robots.txt
du serveur autorise l'accès à chaque URL.Le serveur hébergeant chaque objet :
- Est compatible avec les requêtes
Range
- Renvoie un en-tête
Content-Length
dans chaque réponse.
- Est compatible avec les requêtes
Mettre en forme la liste d'URL
Procédez comme suit pour mettre en forme une liste d'URL :
Créez un fichier de valeurs séparées par des tabulations (TSV).
Insérez le spécificateur de format
TsvHttpData-1.0
sur la première ligne.Ajoutez des lignes supplémentaires pour chaque objet à transférer. Sur chaque ligne, incluez, dans l'ordre, les champs suivants séparés par des tabulations :
L'URL HTTP ou HTTPS d'un objet source.
Lorsqu'un objet situé sur
http(s)://[HOSTNAME]:[PORT]/[URL_PATH]
est transféré vers Cloud Storage, le nom de l'objet dans Cloud Storage est[HOSTNAME]/[URL_PATH]
.La taille de l'objet en octets.
Assurez-vous que la taille spécifiée correspond à la taille réelle de l'objet lors de son extraction. Si la taille de l'objet reçu par Cloud Storage ne correspond pas à la taille spécifiée, le transfert de l'objet échouera.
La somme de contrôle MD5 encodée en Base64 de l'objet.
Assurez-vous que la somme de contrôle MD5 spécifiée correspond à celle calculée à partir des octets transférés. Si la somme de contrôle MD5 de l'objet reçu par Cloud Storage ne correspond pas à celle spécifiée, le transfert de l'objet échouera.
Voici un exemple de fichier TSV spécifiant deux objets à transférer :
TsvHttpData-1.0 https://example.com/buckets/obj1 1357 wHENa08V36iPYAsOa2JAdw== https://example.com/buckets/obj2 2468 R9acAaveoPd2y8nniLUYbw==