Cette page décrit les limitations connues de Cloud Storage et du service de transfert de stockage.
Limitations courantes
Taille d'objet maximale de 5 Tio dans Cloud Storage
Cloud Storage accepte une taille d'objet unique maximale 5 tébioctets. Si vous avez des objets de plus de 5 Tio, le transfert d'objets échoue pour Cloud Storage ou Service de transfert de stockage.
Exigences de dénomination des objets Cloud Storage
Cloud Storage impose des exigences de nom d'objet qui s'appliquent à tous les transferts du service de transfert de stockage.
Les objets modifiés ne sont pas transférés
Le service de transfert de stockage ne verrouille pas les fichiers sources lors d'un transfert.
Si les données d'un objet sont mises à jour pendant un transfert, la section suivante décrit comment le service de transfert de stockage répond :
Transferts depuis des clouds autres que Google vers Google Cloud : si les données d'un objet sont mises à jour lors d'un transfert, le service de transfert de stockage fait échouer le transfert de cet objet et celui-ci n'est pas transféré.
Transferts depuis des systèmes de fichiers vers Google Cloud : si les données d'un objet sont mises à jour pendant un transfert, le service de transfert de stockage tente à nouveau d'importer les données. Si l'importation échoue plusieurs fois, le service de transfert de stockage enregistre un
FILE_MODIFIED_FAILURE
. Pour en savoir plus, consultez la section Dépannage.Transferts depuis Google Cloud vers un système de fichiers : si les données d'un objet sont mises à jour pendant un transfert, le service de transfert de stockage tente à nouveau de procéder au téléchargement. Si le téléchargement échoue plusieurs fois, le service de transfert de stockage enregistre un
PRECONDITION_FAILURE
. Pour en savoir plus, consultez la section Dépannage.
Pour remédier à cet échec, procédez comme suit :
- Réessayez d'effectuer le transfert.
Si le transfert de l'objet continue d'échouer, assurez-vous que ses données ne peuvent pas être mises à jour lors du transfert :
- Source Cloud Storage : placez une préservation à titre conservatoire sur l'objet.
- Source Amazon S3 : définissez un verrouillage d'objet S3.
- Source Microsoft Azure Storage : définissez une règle d'immuabilité pour le stockage de blobs.
- Source du système de fichiers : définissez les fichiers en mode lecture seule ou limitez les écritures aux fichiers en cours de transfert.
Une fois le transfert terminé, vous pouvez réactiver les mises à jour de l'objet.
Dossiers dans Cloud Storage
Les objets Cloud Storage se trouvent dans un espace de noms unique au sein d'un bucket. Pour Consultez la section Espace de noms des objets pour en savoir plus. Par conséquent, le service de transfert de stockage ne crée pas d'espaces de noms hiérarchiques dans Cloud Storage. Par exemple, si vous effectuez un transfert à partir d'Azure Data Lake Storage (ADLS) de deuxième génération, le service de transfert de stockage ne recrée pas les espaces de noms ADLS Gen 2 dans Cloud Storage.
Supprimer des objets dans des buckets Amazon S3 dont le versionnement est suspendu
Lorsque vous utilisez la suppression d'objets de la source dans le service de transfert de stockage après la fonctionnalité de transfert sur un bucket Amazon S3 dont le versionnement est suspendu, le service de transfert de stockage supprime l'objet avec un ID de version nul, et non avec la version actuelle.
Emplacement des tâches du service de transfert de stockage
Le service de transfert de stockage choisit son emplacement en fonction de la région du bucket Cloud Storage source. À partir d'aujourd'hui, nous créons des jobs de service de transfert de stockage emplacements suivants. Cette liste est susceptible de changer à mesure que le service de transfert de stockage accepte de nouvelles régions.
Si votre bucket Cloud Storage source se trouve dans une région non répertoriée, nous choisirons la région par défaut dans la région externe de la source.
- ASIA-EAST1
- ASIA-EAST2
- ASIA-NORTHEAST1
- ASIE-NORD-EST2
- ASIA-NORTHEAST3
- ASIE-SUD1
- ASIE-SUD2
- ASIA-SOUTHEAST1
- ASIA-SOUTHEAST2
- AUSTRALIA-SOUTHEAST1
- AUSTRALIA-SOUTHEAST2
- EUROPE-WEST1
- EUROPE-WEST2
- EUROPE-WEST3
- EUROPE-WEST4
- EUROPE-WEST9
- EUROPE-NORTH1
- EUROPE-SUD-WEST1
- NORTHAMERIQUE-NORD-EST1
- NORTHAMERIQUE-NORD-EST2
- US-CENTRAL1
- US-CENTRAL2
- US-EAST1
- US-EAST4
- US-WEST1
- US-WEST2
- US-WEST3
- US-WEST4
- NAM4
Limitations connues des transferts de système de fichiers
Aucune assistance en temps réel
Le service de transfert de stockage ne prend pas en charge la détection des modifications sub-horaires. Le service de transfert de stockage est un service de déplacement des données par lot qui peut analyser la source à une fréquence allant jusqu'à une fois par heure.
Configurations du système d'exploitation compatibles
Les agents de transfert nécessitent l'installation de Docker et s'exécutent sur des serveurs Linux ou sur des machines virtuelles (VM). Pour copier des données sur un système de fichiers CIFS ou SMB, vous pouvez installer le volume sur un serveur ou une VM Linux, puis exécuter l'agent à partir de ce serveur ou de cette VM Linux.
Exigences relatives à la mémoire
Voici les exigences de mémoire pour les agents du service de transfert des données sur site :- Mémoire minimale : 1 Gio
- Mémoire minimale pour effectuer des importations hautes performances : 6 Gio
Limitations de scaling
Le service de transfert de stockage prend en charge les transferts individuels qui représentent :
- Des centaines de téraoctets
- Jusqu'à 1 milliard de fichiers
- Plusieurs dizaines de Gbit/s en vitesse de transfert
Les transferts individuels supérieurs à ces tailles sont fiables, mais leur performance n'a pas été testée.
Si vous disposez d'un ensemble de données d'une taille supérieure à ces limites, nous vous recommandons de répartir vos données sur plusieurs tâches de transfert.
Nous prenons actuellement en charge les répertoires volumineux, à condition que chaque agent dispose d'au moins 1 Go de mémoire pour chaque million de fichiers du répertoire le plus volumineux, ce qui nous permet d'itérer le contenu du répertoire sans dépasser la mémoire.
Limites concernant les agents et les pools d'agents
Nous acceptons jusqu'à 100 agents pour un seul pool d'agents. Il est peu probable que vous ayez besoin de plus d'agents pour obtenir de meilleures performances dans les environnements classiques.
Vous pouvez créer jusqu'à 800 pools d'agents par projet.
Un seul répertoire par tâche
Nous ne prenons en charge que le transfert du contenu complet d'un répertoire de système de fichiers (de manière récursive). Vous pouvez partitionner le transfert en créant plusieurs tâches qui transfèrent différents sous-répertoires de votre ensemble de données, mais nous ne prenons actuellement pas en charge le globbing ou le filtrage de fichiers dans une seule tâche.
Noms de fichiers pris en charge
Les règles suivantes s'appliquent à tous les noms de fichiers faisant partie d'un transfert :
- Les noms de fichiers doivent utiliser l'encodage UTF8.
- Les noms de fichiers doivent être compatibles Unicode.
- Ils ne doivent pas contenir de sauts de ligne (
\n
) ni de retours chariot (\r
).
Si votre répertoire source contient des noms de fichiers non compatibles, la tâche pour ce répertoire échoue.
Dans ce cas, mettez à jour les noms de fichiers non compatibles et réexécutez le job.
Types de fichiers compatibles
Le service de transfert de stockage permet de transférer des fichiers standards et des fichiers cachés de type Unix.
Les fichiers cachés de type Unix sont des fichiers commençant par le caractère .
. Lorsque le service de transfert de stockage rencontre un fichier non standard, tel qu'un appareil, un pipeline nommé ou un socket, il génère une erreur UNSUPPORTED_FILE_MODE
.
Les répertoires vides ne sont pas créés dans Cloud Storage, car les objets ne font pas partie de sous-répertoires au sein d'un bucket. Pour en savoir plus, consultez Espace de noms de l'objet.
Longueur de chemin maximale
Le service de transfert de stockage suit la longueur de chemin maximale de Cloud Storage, qui est de 1 024 octets. Le préfixe d'objet pour l'objet de destination est inclus dans la limite de longueur, car le préfixe est incorporé dans le nom de l'objet dans Cloud Storage.
Métadonnées de fichiers prises en charge
Consultez la section Conservation des métadonnées pour en savoir plus sur les métadonnées conservées, par défaut ou en option.
Mises en veille de tâches étendues
Les tâches mises en pause pendant plus de 30 jours sont considérées comme inactives. Lorsqu'une tâche est inactive, le tâche mise en pause est abandonnée, et la planification de la configuration de la tâche est désactivée. Aucune nouvelle exécution de la tâche ne démarre sauf si vous réactivez explicitement cette tâche.
Sécurité des sources du système de fichiers
Accès de l'agent
Les utilisateurs en mesure de créer des tâches de transfert peuvent récupérer et télécharger des données n'importe quel répertoire de système de fichiers accessible par l'agent. Si les agents sont exécutés en tant que root et qu'ils ont accès à l'ensemble du système de fichiers, un acteur malveillant peut prendre le contrôle de l'hôte. Nous vous recommandons vivement de limiter l'accès des agents aux répertoires nécessaires uniquement.