Cette page vous explique comment créer et démarrer des tâches de transfert depuis Amazon S3 vers Cloud Storage.
Configurer les autorisations
Avant de créer un transfert, vous devez configurer les autorisations sur votre bucket Amazon S3. Pour en savoir plus, consultez Configurer l'accès à une source: Amazon S3.
Vous devez également configurer des autorisations pour les entités Google Cloud suivantes:
Compte utilisateur utilisé pour créer le transfert. Il s'agit du compte connecté à la console Google Cloud, ou du compte spécifié lors de l'authentification auprès de la CLI gcloud. Le compte utilisateur peut être un compte utilisateur standard ou un compte de service géré par l'utilisateur. | |
Le compte de service géré par Google, également appelé agent de service, utilisé par le service de transfert de stockage. Ce compte est généralement identifié par son adresse e-mail, qui utilise le format project-PROJECT_NUMBER@storage-transfer-service.iam.gserviceaccount.com .
|
Consultez la section Autorisations de transfert sans agent pour obtenir des instructions.
Options de sortie
Le service de transfert de stockage fournit plusieurs options pour transférer vos données S3 vers Cloud Storage.
Option de sortie | Description |
---|---|
Sans agent par défaut | Cette option utilise un transfert géré sans agent à partir de S3. Le trafic sortant vous est facturé par Amazon.
Suivez les instructions de cette page pour utiliser cette option. |
Distribution CloudFront | Utilisez une distribution Amazon CloudFront comme chemin de sortie. Les transferts de données via CloudFront peuvent bénéficier de coûts de sortie AWS inférieurs à ceux d'un transfert direct à partir de S3. Pour en savoir plus, consultez les tarifs de CloudFront et les frais de sortie S3.
Suivez les instructions de la section Transférer depuis S3 via CloudFront pour configurer votre distribution et créer un transfert. |
Réseau privé géré | Transférez vos données
sur un réseau géré par Google. Vous ne payez aucuns frais de sortie S3. Vous payez à Google Cloud un tarif par Gio. Consultez la page Tarifs pour en savoir plus. AWS peut toujours vous facturer des frais d'exploitation (par exemple, LIST ou GET ), consultez leurs tarifs pour en savoir plus.
Tous les transferts de projets sur le réseau privé géré partagent la même bande passante. En cas d'utilisation élevée, le transfert peut ralentir. Les transferts comportant des fichiers volumineux sont davantage affectés que ceux comportant de petits fichiers. Suivez les instructions sur cette page pour utiliser cette option. Spécifiez l'option Réseau privé géré dans la console Google Cloud ou le champ managedPrivateNetwork dans l'API REST. Gcloud CLI et les bibliothèques clientes ne sont pas compatibles avec les transferts gérés via un réseau privé. Consultez la liste des régions disponibles. |
Basé sur des agents | Valable pour tout stockage compatible S3, y compris Amazon S3. En installant un logiciel agent sur des machines ayant accès à vos buckets S3, vous pouvez contrôler le chemin d'accès réseau et la bande passante. Cette option nécessite des agents et des pools d'agents.
Suivez les instructions de la section Transférer des données à partir de sources compatibles S3 pour utiliser cette option. |
Régions où le service est disponible
Le service de transfert de stockage est compatible avec les régions Amazon S3 suivantes:
af-south-1 ap-east-1 ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2 ap-southeast-3 |
ap-southeast-4 ca-central-1 ca-west-1 eu-central-1 eu-central-2 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-2
|
eu-west-3 il-central-1 me-central-1 me-south-1 sa-east-1 us-east-1 us-east-2 us-west-1 us-west-2
|
Les transferts utilisant le réseau privé géré sont compatibles avec les régions AWS suivantes:
us-east-1 us-east-2 us-west-1 us-west-2 ca-west-1 ca-central-1 |
Options de transfert
Les fonctionnalités suivantes du service de transfert de stockage sont disponibles pour les transferts de S3 vers Cloud Storage
- Transférer des fichiers spécifiques à l'aide d'un fichier manifeste
- Vous pouvez transmettre une liste de fichiers sur lesquels le service de transfert de stockage doit agir. Pour en savoir plus, consultez Transférer des fichiers ou des objets spécifiques à l'aide d'un fichier manifeste.
- Spécifier la classe de stockage
- Vous pouvez spécifier la
classe de stockage Cloud Storage à utiliser pour vos données dans le bucket de destination. Consultez les options
StorageClass
pour plus de détails sur REST ou utilisez l'option--custom-storage-class
avec la Google Cloud CLI.Notez que tous les paramètres de classe de stockage sont ignorés si la classe automatique est activée pour le bucket de destination. Si la classe automatique est activée, les objets transférés dans le bucket sont initialement définis sur le stockage standard.
- Conservation des métadonnées
-
Lors du transfert de fichiers à partir de S3, le service de transfert de stockage peut éventuellement conserver certains attributs en tant que métadonnées personnalisées.
Consultez la section Amazon S3 vers Cloud Storage de la page Conservation des métadonnées pour en savoir plus sur les métadonnées qui peuvent être conservées et sur la configuration de votre transfert.
- Transferts basés sur des événements
- Le service de transfert de stockage peut écouter les notifications d'événements Amazon S3 envoyées à Amazon SQS pour transférer automatiquement les données ajoutées ou mises à jour dans l'emplacement source. Pour en savoir plus, consultez la section Transferts basés sur des événements.
- Journalisation et surveillance
- Les transferts provenant de S3 peuvent être visualisés dans Cloud Logging et Cloud Monitoring. Pour en savoir plus, consultez Cloud Logging pour le service de transfert de stockage et Surveiller les tâches de transfert. Vous pouvez également configurer des notifications Pub/Sub.
Créer un transfert
Le service de transfert de stockage fournit plusieurs interfaces pour créer un transfert.
N'incluez pas d'informations sensibles telles que des informations permettant d'identifier personnellement l'utilisateur ou des données de sécurité dans le nom de votre tâche de transfert. Les noms de ressources peuvent être propagés vers les noms d'autres ressources Google Cloud et peuvent être exposés à des systèmes internes de Google en dehors de votre projet.
Console Google Cloud
Accédez à la page Service de transfert de stockage dans Google Cloud Console.
Cliquez sur Créer une tâche de transfert. La page Créer une tâche de transfert s'affiche.
Sous Type de source, sélectionnez Amazon S3.
Pour Type de destination, sélectionnez Google Cloud Storage.
Sélectionnez votre mode de planification. Les transferts par lot s'exécutent de manière ponctuelle ou planifiée. Les transferts basés sur des événements surveillent en continu la source et transfèrent les données lorsqu'elles sont ajoutées ou modifiées.
Pour configurer un transfert basé sur des événements, suivez les instructions de la section Transferts basés sur des événements.
Cliquez sur Étape suivante.
Dans le champ Nom du bucket ou du dossier, saisissez le nom du bucket source.
Le nom du bucket est celui qui apparaît dans AWS Management Console.
Si vous utilisez une distribution CloudFront pour effectuer un transfert à partir de S3, saisissez le nom du domaine de distribution dans le champ Domaine CloudFront. Exemple :
https://dy1h2n3l4ob56.cloudfront.net
Consultez la section Transférer depuis S3 via CloudFront pour configurer une distribution CloudFront.Pour utiliser un réseau privé géré pour ce transfert, cochez la case. Pour en savoir plus, consultez la section Options de sortie.
Sélectionnez votre méthode d'authentification Amazon Web Services (AWS). Pour en savoir plus, consultez Configurer l'accès à une source: Amazon S3.
Clé d'accès: saisissez votre clé d'accès dansID de clé d'accès et le secret associé à votre clé d'accès dans le champs Clé d'accès du secret.
Rôle IAM AWS pour la fédération d'identité: saisissez votre ARN dans le champ AWS IAM role ARN (ARN du rôle IAM AWS pour la fédération d'identité) en respectant la syntaxe suivante:
arn:aws:iam::ACCOUNT:role/ROLE-NAME-WITH-PATH
Où :
ACCOUNT
: ID du compte AWS sans tiret.ROLE-NAME-WITH-PATH
: nom du rôle AWS incluant le chemin d'accès.
Pour en savoir plus sur les ARN, consultez la page ARN d'IAM.
Ressource de secret: sélectionnez cette option pour utiliser des identifiants Amazon enregistrés dans Secret Manager. Sélectionnez un secret dans la liste ou saisissez-en un manuellement au format
projects/PROJECT_NUMBER/secrets/SECRET_NAME
.
S'il s'agit d'un transfert basé sur des événements, saisissez l'ARN de la file d'attente Amazon SQS, au format suivant:
arn:aws:sqs:us-east-1:1234567890:event-queue
- Vous pouvez également choisir de filtrer les objets par préfixe ou par date de dernière modification. Si vous avez spécifié un dossier comme emplacement source, les filtres de préfixe sont relatifs à ce dossier. Par exemple, si votre source est
my-test-bucket/path/
, un filtre d'inclusionfile
inclut tous les fichiers commençant parmy-test-bucket/path/file
. Cliquez sur Étape suivante.
Dans le champ Bucket ou dossier, saisissez le nom du bucket de destination et (éventuellement) le nom du dossier, ou cliquez sur Parcourir pour sélectionner un bucket dans une liste existante de buckets de votre projet actuel. Pour créer un bucket, cliquez sur
Créer un bucket.
Cliquez sur Next step (Étape suivante).
Sélectionnez les paramètres de la tâche de transfert.
Dans le champ Description, saisissez une description du transfert. Nous vous recommandons de saisir une description pertinente et unique afin de pouvoir différencier les tâches.
Sous Options de métadonnées, choisissez d'utiliser les options par défaut, ou cliquez sur Afficher et sélectionner des options pour spécifier des valeurs pour toutes les métadonnées acceptées. Pour en savoir plus, consultez la section Conservation des métadonnées.
Sous Écrasement, sélectionnez l'une des options suivantes :
S'ils sont différents : écrase les fichiers de destination si le fichier source du même nom contient d'autres ETags ou valeurs de somme de contrôle.
Toujours : écrit toujours les fichiers de destination lorsque le fichier source porte le même nom, même s'ils sont identiques.
Sous Dans quel contexte effectuer des suppressions, sélectionnez l'une des options suivantes :
Jamais : ne supprime jamais les fichiers de la source ou de la destination.
Supprimer les fichiers de la source après leur transfert : supprime les fichiers de la source après leur transfert vers la destination.
Supprimer les fichiers de la destination s'ils ne figurent pas dans la source : si les fichiers du bucket Cloud Storage de destination ne figurent pas dans la source, supprimez-les du bucket.
Cette option garantit que le bucket Cloud Storage de destination correspond exactement à votre source.
Sous Options de notification, sélectionnez votre sujet Pub/Sub et les événements pour lesquels vous souhaitez recevoir des notifications. Pour en savoir plus, consultez la section Notifications Pub/Sub.
Cliquez sur Étape suivante.
Choisissez vos options de planification :
Dans la liste déroulante Exécuter une fois, sélectionnez l'une des options suivantes :
Exécuter une fois : exécute un seul transfert, à partir de l'heure que vous sélectionnez.
Exécuter tous les jours : exécute un transfert tous les jours, à l'heure que vous sélectionnez.
Vous pouvez saisir une date de fin (facultatif) ou laisser le champ Date de fin vide pour exécuter le transfert en continu.
Run every week (Exécuter toutes les semaines) : exécute un transfert chaque semaine à partir de l'heure que vous avez sélectionnée.
Exécuter avec une fréquence personnalisée : exécute un transfert à la fréquence que vous sélectionnez. Vous pouvez choisir de répéter le transfert à des intervalles réguliers d'heures, de jours ou de semaines.
Vous pouvez saisir une date de fin (facultatif) ou laisser le champ Date de fin vide pour exécuter le transfert en continu.
Dans la liste déroulante À partir de maintenant, sélectionnez l'une des options suivantes :
À partir de maintenant : lance le transfert lorsque vous cliquez sur Créer.
À partir de : lance le transfert à la date et à l'heure que vous sélectionnez. Cliquez sur Agenda pour afficher un calendrier et sélectionner la date de début.
Pour créer votre tâche de transfert, cliquez sur Créer.
gcloud CLI
Pour créer une tâche de transfert, utilisez la commande gcloud transfer jobs create
. La création d'une tâche lance le transfert spécifié, sauf si un calendrier ou une valeur --do-not-run
est spécifié.
La gcloud CLI n'accepte pas les transferts via CloudFront ou un réseau privé géré.
gcloud transfer jobs create \
s3://S3_BUCKET_NAME gs://STORAGE_BUCKET_NAME \
--source-creds-file="relative_path/to/creds.json"
Où :
S3_BUCKET_NAME est la source de données pour ce transfert. Vous pouvez éventuellement inclure un chemin d'accès :
s3://S3_BUCKET_NAME/S3_FOLDER_PATH
STORAGE_BUCKET_NAME est le bucket Cloud Storage vers lequel transférer les données. Pour effectuer un transfert dans un répertoire spécifique, spécifiez
gs://STORAGE_BUCKET_NAME/STORAGE_FOLDER_PATH/
, y compris la barre oblique finale.--source-creds-file
spécifie le chemin relatif vers un fichier local sur votre ordinateur qui inclut les identifiants AWS pour la source de transfert. Le contenu doit être au format JSON suivant:{ "accessKeyId": string, "secretAccessKey": string }
Des options supplémentaires vous sont proposées :
--do-not-run
empêche le service de transfert de stockage d'exécuter la tâche lors de l'envoi de la commande. Pour exécuter la tâche, mettez-la à jour pour ajouter une planification ou utilisezjobs run
pour la démarrer manuellement.--manifest-file
spécifie le chemin d'accès à un fichier CSV dans Cloud Storage contenant une liste des fichiers à transférer depuis votre source. Pour en savoir plus sur la mise en forme du fichier manifeste, consultez la section Transférer des fichiers ou objets spécifiques à l'aide d'un fichier manifeste.Informations sur la tâche: vous pouvez spécifier
--name
et--description
.Programmation: spécifiez
--schedule-starts
,--schedule-repeats-every
,--schedule-repeats-until
ou--do-not-run
.Conditions des objets: utilisez les conditions pour déterminer les objets à transférer. Cela inclut
--include-prefixes
et--exclude-prefixes
, ainsi que les conditions basées sur l'heure dans--include-modified-[before | after]-[absolute | relative]
. Si vous avez spécifié un dossier avec votre source, les filtres de préfixe sont relatifs à ce dossier. Pour en savoir plus, consultez la section Filtrer les objets sources par préfixe.Options de transfert : indiquez si vous souhaitez remplacer les fichiers de destination (
--overwrite-when=different
oualways
) et si vous souhaitez supprimer certains fichiers pendant ou après le transfert (--delete-from=destination-if-unique
ousource-after-transfer
) ; indiquez quelles valeurs de métadonnées sont à conserver (--preserve-metadata
) ; et éventuellement définissez une classe de stockage sur des objets transférés (--custom-storage-class
).Notifications: configurez des notifications Pub/Sub pour les transferts avec
--notification-pubsub-topic
,--notification-event-types
et--notification-payload-format
.Cloud Logging: activez Cloud Logging avec
--log-actions
et--log-action-states
. Pour en savoir plus, consultez la page Cloud Logging pour le service de transfert de stockage.
Pour afficher toutes les options, exécutez gcloud transfer jobs create --help
ou reportez-vous à la documentation de référence gcloud
.
REST
Les exemples suivants vous montrent comment utiliser le service de transfert de stockage via l'API REST.
Lorsque vous configurez ou modifiez des tâches de transfert à l'aide de l'API Storage Transfer Service, l'heure doit être exprimée en temps UTC. Pour en savoir plus sur la spécification de la planification d'une tâche de transfert, consultez la section Programmer.
Lorsque vous créez des tâches de transfert, n'incluez pas le préfixe s3://
pour bucketName
dans les noms sources du bucket Amazon S3.
Transfert sans agent
L'exemple suivant crée une tâche de transfert à l'aide de la configuration sans agent standard. Pour en savoir plus, consultez la documentation de référence sur transferJobs.create.
POST https://storagetransfer.googleapis.com/v1/transferJobs { "description": "DESCRIPTION", "status": "ENABLED", "projectId": "PROJECT_ID", "transferSpec": { "awsS3DataSource": { "bucketName": "AWS_SOURCE_NAME", "awsAccessKey": { "accessKeyId": "AWS_ACCESS_KEY_ID", "secretAccessKey": "AWS_SECRET_ACCESS_KEY" } }, "gcsDataSink": { "bucketName": "GCS_SINK_NAME" } } }
Pour connaître les autres options d'authentification, consultez la page Configurer l'accès à une source: Amazon S3.
Distribution CloudFront
Si vous effectuez un transfert depuis S3 via une distribution CloudFront, spécifiez le nom du domaine de distribution comme valeur du champ transferSpec.awsS3DataSource.cloudfrontDomain
:
POST https://storagetransfer.googleapis.com/v1/transferJobs { "description": "DESCRIPTION", "status": "ENABLED", "projectId": "PROJECT_ID", "transferSpec": { "awsS3DataSource": { "bucketName": "AWS_SOURCE_NAME", "cloudfrontDomain": "https://dy1h2n3l4ob56.cloudfront.net", "awsAccessKey": { "accessKeyId": "AWS_ACCESS_KEY_ID", "secretAccessKey": "AWS_SECRET_ACCESS_KEY" } }, "gcsDataSink": { "bucketName": "GCS_SINK_NAME" } } }
Réseau privé géré
Pour effectuer un transfert depuis S3 à l'aide d'un réseau privé géré par Google, spécifiez le champ transferSpec.awsS3DataSource.managedPrivateNetwork
:
POST https://storagetransfer.googleapis.com/v1/transferJobs { "description": "DESCRIPTION", "status": "ENABLED", "projectId": "PROJECT_ID", "transferSpec": { "awsS3DataSource": { "bucketName": "AWS_SOURCE_NAME", "managedPrivateNetwork": TRUE, "awsAccessKey": { "accessKeyId": "AWS_ACCESS_KEY_ID", "secretAccessKey": "AWS_SECRET_ACCESS_KEY" } }, "gcsDataSink": { "bucketName": "GCS_SINK_NAME" } } }
Bibliothèques clientes
Les exemples suivants vous montrent comment utiliser le service de transfert de stockage de manière automatisée avec Go, Java, Node.js et Python.
Lorsque vous configurez ou modifiez des tâches de transfert de manière automatisée, l'heure doit être exprimée en temps UTC. Pour en savoir plus sur la spécification de la planification d'une tâche de transfert, consultez la section Programmer.
Pour en savoir plus sur les bibliothèques clientes du service de transfert de stockage, consultez la page Premiers pas avec les bibliothèques clientes du service de transfert de stockage.
Transférer des données depuis Amazon S3 vers Cloud Storage
Dans cet exemple, vous allez apprendre à déplacer des fichiers depuis Amazon S3 vers un bucket Cloud Storage.
Lorsque vous créez des tâches de transfert, n'incluez pas le préfixe s3://
pour bucketName
dans les noms sources du bucket Amazon S3.
Les bibliothèques clientes du service de transfert de stockage n'acceptent pas les transferts via CloudFront ou un réseau privé géré.
Go
Java
Vous recherchez des exemples plus anciens ? Consultez le guide de migration du service de transfert de stockage.
Node.js
Python
Vous recherchez des exemples plus anciens ? Consultez le guide de migration du service de transfert de stockage.