Der Storage Transfer Service unterstützt die Übertragung bestimmter Dateien oder Objekte, die mit einem manifest angegeben werden. Ein Manifest ist eine CSV-Datei, die in Cloud Storage hochgeladen wird und eine Liste von Dateien oder Objekten enthält, auf denen Storage Transfer Service Aktionen ausführen kann.
Ein Manifest kann für die folgenden Übertragungen verwendet werden:
Von AWS S3, S3-kompatiblem Speicher, Azure Blob Storage oder Cloud Storage in einen Cloud Storage-Bucket.
Von einem Dateisystem in einen Cloud Storage-Bucket
Von einem Cloud Storage-Bucket in ein Dateisystem
Zwischen zwei Dateisystemen.
Von einer öffentlich zugänglichen HTTP-/HTTPS-Quelle zu einem Cloud Storage-Bucket Folgen Sie der Anleitung unter URL-Liste erstellen, da das Manifestformat für URL-Listen einzigartig ist.
Manifest erstellen
Für Manifestdateien gelten die folgenden Anforderungen:
- Manifeste müssen im CSV-Format vorliegen.
- Sie können beliebige UTF-8-Zeichen enthalten.
- Die erste Spalte muss ein Dateiname oder Objektname sein. Der Name ist relativ zum Stammpfad oder zum Bucket und zum Ordner, die im Übertragungsjob angegeben sind. Weitere Informationen finden Sie unter Dateisystemübertragungen und Objektspeicherübertragungen.
- Manifestdateien unterstützen keine Platzhalter. Ordnernamen ohne Datei- oder Objektnamen werden nicht unterstützt.
- Wenn ein Datei- oder Objektname ein Komma enthält, muss er in Anführungszeichen gesetzt werden. Beispiel:
"doe,john.txt"
. - Bei Übertragungen mit Übertragungsagenten (d.h. Dateisystemübertragungen oder Übertragungen von S3-kompatiblem Speicher) beträgt die maximale Größe der Manifestdatei 1 GiB, was etwa 1 Million Zeilen entspricht. Wenn die Manifestdatei größer als 1 GiB ist, können Sie sie in mehrere Dateien aufteilen und mehrere Übertragungsjobs ausführen. Bei agentlosen Übertragungen gibt es keine Beschränkung für die Größe der Manifestdatei.
Wir empfehlen, die Übertragung mit einer kleinen Teilmenge von Dateien oder Objekten zu testen, um unnötige API-Aufrufe aufgrund von Konfigurationsfehlern zu vermeiden.
Sie können den Status von Dateiübertragungen auf der Seite „Übertragungsjobs“ überwachen. Dateien oder Objekte, die nicht übertragen werden sollen, werden in den Übertragungslogs aufgeführt.
Dateisystemübertragungen
Wenn Sie ein Manifest von Dateien in einem Dateisystem erstellen möchten, erstellen Sie eine CSV-Datei mit einer einzelnen Spalte, die die Dateipfade relativ zum Stammverzeichnis enthält, das bei der Erstellung des Übertragungsjobs angegeben wurde.
So übertragen Sie beispielsweise die folgenden Dateisystemdateien:
Dateipfad |
---|
rootdir/dir1/subdir1/file1.txt |
rootdir/file2.txt |
rootdir/dir2/subdir1/file3.txt |
Das Manifest sollte in etwa so aussehen:
dir1/subdir1/file1.txt
file2.txt
dir2/subdir1/file3.txt
Speichern Sie die Manifestdatei mit einem beliebigen Dateinamen und der Erweiterung .csv
.
Objektspeicherübertragungen
Um ein Manifest von Objekten zu erstellen, erstellen Sie eine CSV-Datei, deren erste Spalte die Objektnamen relativ zum Bucket-Namen und Pfad enthält, die beim Erstellen des Übertragungsjobs angegeben wurden. Alle Objekte müssen sich im selben Bucket befinden.
Sie können auch eine optionale zweite Spalte mit der Cloud Storage-Generierungsnummer der zu übertragenden Version angeben.
Sie können beispielsweise die folgenden Objekte übertragen:
Objektpfad | Cloud Storage-Generierungsnummer |
---|---|
SOURCE_PATH/object1.pdf |
1664826685911832 |
SOURCE_PATH/object2.pdf |
|
SOURCE_PATH/object3.pdf |
1664826610699837 |
Das Manifest sollte in etwa so aussehen:
object1.pdf,1664826685911832
object2.pdf
object3.pdf,1664826610699837
Speichern Sie die Manifestdatei mit einem beliebigen Dateinamen und der Erweiterung .csv
.
HTTP-/HTTPS-Übertragungen
Wenn Sie bestimmte Dateien von einer HTTP- oder HTTPS-Quelle übertragen möchten, folgen Sie der Anleitung unter URL-Liste erstellen.
Manifest veröffentlichen
Nachdem Sie das Manifest erstellt haben, müssen Sie es für den Storage Transfer Service verfügbar machen. Storage Transfer Service kann auf die Datei in einem Cloud Storage-Bucket oder in Ihrem Dateisystem zugreifen.
Manifest in Cloud Storage hochladen
Sie können die Manifestdatei in einem beliebigen Cloud Storage-Bucket speichern.
Der Dienst-Agent, der die Übertragung ausführt, muss die Berechtigung storage.objects.get
für den Bucket haben, der das Manifest enthält. Eine Anleitung zum Ermitteln der Dienst-Agent-ID und zum Erteilen von Berechtigungen für diesen Dienst-Agent für einen Bucket finden Sie unter Erforderliche Berechtigungen erteilen.
Eine Anleitung zum Hochladen des Manifests in einen Bucket findest du in der Cloud Storage-Dokumentation unter Objekte hochladen.
Wenn Sie beispielsweise mit der gcloud
CLI eine Datei in Cloud Storage hochladen möchten, verwenden Sie den Befehl gcloud storage cp
:
gcloud storage cp MANIFEST.CSV gs://DESTINATION_BUCKET_NAME/
Wobei:
MANIFEST.CSV
ist der lokale Pfad zu Ihrer Manifestdatei. Beispiel:Desktop/manifest01.csv
.DESTINATION_BUCKET_NAME
ist der Name des Buckets, in den Sie das Objekt hochladen. Beispiel:my-bucket
Wenn der Vorgang erfolgreich ausgeführt wurde, sieht die Antwort in etwa so aus:
Completed files 1/1 | 164.3kiB/164.3kiB
Sie können ein Manifest mit vom Kunden verwalteten Cloud KMS-Verschlüsselungsschlüsseln verschlüsseln. Sorgen Sie in diesem Fall dafür, dass allen Dienstkonten, die auf das Manifest zugreifen, die entsprechenden Verschlüsselungsschlüssel zugewiesen werden. Vom Kunden bereitgestellte Schlüssel werden nicht unterstützt.
Manifest in einem Dateisystem speichern
Sie können die Manifestdatei im Quell- oder Zieldateisystem speichern.
Auf den Speicherort der Datei muss für die Übertragungs-Agenten zugegriffen werden können. Wenn Sie den Verzeichniszugriff für Ihre Kundenservicemitarbeiter einschränken, muss sich die Manifestdatei in einem bereitgestellten Verzeichnis befinden.
Übertragung starten
Ändern Sie die Manifestdatei erst, wenn ein Übertragungsvorgang abgeschlossen ist. Wir empfehlen, die Manifestdatei während einer Übertragung zu sperren.
Cloud Console
So starten Sie eine Übertragung mit einem Manifest über die Cloud Console:
Folgen Sie der Anleitung unter Wechselstellen erstellen, um den Ursprung, das Ziel und die Optionen auszuwählen.
Klicken Sie im letzten Schritt Einstellungen auswählen und setzen Sie ein Häkchen in das Kästchen Liste der zu übertragenden Dateien über Manifestdatei angeben.
Geben Sie den Speicherort der Manifestdatei ein.
gcloud
Fügen Sie das --manifest-file=MANIFEST_FILE
-Flag mit dem gcloud transfer jobs create
-Befehl hinzu, um die im Manifest aufgeführten Dateien oder Objekte zu übertragen.
gcloud transfer jobs create SOURCE DESTINATION \
--manifest-file=MANIFEST_FILE
MANIFEST_FILE kann einen der folgenden Werte haben:
Der Pfad zur CSV-Datei in einem Cloud Storage-Bucket:
--manifest-file=gs://my_bucket/sample_manifest.csv
Unter Manifest in Cloud Storage hochladen finden Sie Informationen zu den erforderlichen Berechtigungen, wenn der Bucket oder die Datei nicht öffentlich ist.
Der relative Pfad vom Dateisystem SOURCE, einschließlich aller angegebenen Pfade:
--manifest-file=source://relative_path/sample_manifest.csv
Der relative Pfad vom Dateisystem DESTINATION, einschließlich aller angegebenen Pfade:
--manifest-file=destination://relative_path/sample_manifest.csv
REST + Clientbibliotheken
REST
Um die im Manifest aufgeführten Dateien oder Objekte zu übertragen, führen Sie einen createTransferJob
-API-Aufruf aus, der eine transferSpec
mit dem hinzugefügten Feld transferManifest
angibt. Beispiel:
POST https://storagetransfer.googleapis.com/v1/transferJobs ... "transferSpec": { "posixDataSource": { "rootDirectory": "/home/", }, "gcsDataSink": { "bucketName": "GCS_NEARLINE_SINK_NAME", "path": "GCS_SINK_PATH", }, "transferManifest": { "location": "gs://my_bucket/sample_manifest.csv" } }
Die Manifestdatei kann in einem Cloud Storage-Bucket oder im Quell- oder Zieldateisystem gespeichert werden. Cloud Storage-Buckets müssen das Präfix gs://
und den vollständigen Pfad einschließlich des Bucket-Namens enthalten. Dateisystemspeicherorte müssen das Präfix source://
oder destination://
verwenden und sind relativ zur Dateisystemquelle oder ‑ziel sowie optional zum Stammverzeichnis.
Go
Java
Node.js
Python
Die Objekte oder Dateien im Manifest werden nicht unbedingt in der aufgeführten Reihenfolge übertragen.
Wenn das Manifest Dateien enthält, die bereits im Ziel vorhanden sind, werden diese Dateien übersprungen, es sei denn, die Option Überschreiben von Objekten, die bereits im Ziel vorhanden sind ist angegeben.
Wenn das Manifest Objekte enthält, die in einer anderen Version am Ziel vorhanden sind, wird das Objekt am Ziel mit der Quellversion des Objekts überschrieben. Wenn das Ziel ein versionierter Bucket ist, wird eine neue Version des Objekts erstellt.