Storage Transfer Service-Agents sind Anwendungen, die in einem Docker-Container ausgeführt werden. die sich mit dem Storage Transfer Service für Übertragungen mit Dateisystemen koordinieren oder einen S3-kompatiblen Speicher.
Wenn für die Übertragung kein Dateisystem oder S3-kompatibler Speicher verwendet wird, keine Agents einrichten.
In diesem Dokument wird beschrieben, wie Übertragungs-Agents in auf euren Servern.
Übersicht
Agent-Prozesse sind dynamisch. Sie können während der Übertragung auch Agents hinzufügen, um die Leistung zu verbessern. Neu gestartete Agents werden dem entsprechenden Agent-Pool hinzugefügt und sind an der Verarbeitung vorhandener Übertragungen beteiligt. Damit können Sie anpassen, wie viele Agents ausgeführt werden, oder die Übertragungsleistung an die sich ändernde Übertragungsnachfrage anpassen.
Agent-Prozesse sind eine fehlertolerante Sammlung. Wenn ein Agent nicht mehr ausgeführt wird, funktionieren die verbleibenden Agents weiterhin. Wenn alle Ihre Agents angehalten werden und Sie die Agents neu starten, wird die Übertragung an der Stelle fortgesetzt, an der die Agents angehalten wurden. Auf diese Weise können Sie vermeiden, Agents zu überwachen, Übertragungen zu wiederholen oder Wiederherstellungslogik zu implementieren. Wenn Sie Agents mit Google Kubernetes Engine koordinieren, können Sie Ihre Agent-Pools ohne Ausfallzeiten bei der Übertragung patchen, verschieben und dynamisch skalieren.
Beispiel: Sie senden zwei Übertragungen, während zwei Agents ausgeführt werden. Wenn einer der Agents aufgrund eines Neustarts oder Betriebssystem-Patches gestoppt wird, funktioniert der verbleibende Agent weiterhin. Die beiden Übertragungen werden weiterhin ausgeführt, sind jedoch langsamer, da ein einzelner Agent Daten verschiebt. Wenn der verbleibende Agent ebenfalls beendet wird, werden alle Übertragungen unterbrochen, da keine Agents ausgeführt werden. Wenn Sie die Agent-Prozesse neu starten, werden die Übertragungen an der Stelle fortgesetzt, an der sie unterbrochen wurden.
Agent-Prozesse gehören zu einem Pool. Sie verschieben Ihre Daten parallel. Aus diesem Grund müssen alle Agents in einem Pool dieselben Zugriff auf alle Datenquellen, die Sie übertragen möchten.
Wenn Sie beispielsweise Daten aus einem bestimmten Dateisystem übertragen, müssen Sie das Dateisystem auf allen Computern bereitstellen, auf denen Agents in Ihrem Agent-Pool. Wenn einige Agents im Pool eine Datenquelle erreichen können und andere können, werden keine Übertragungen aus dieser Datenquelle gelingen.
Vorbereitung
Bevor Sie die Übertragungen konfigurieren, müssen Sie folgenden Zugriff konfiguriert haben: für Nutzer und Dienstkonten.
Wenn Sie gcloud
-Befehle verwenden, installieren Sie die gcloud CLI.
Übertragungs-Agents installieren und ausführen
Wir empfehlen, mindestens drei Agents pro Agent-Pool zu installieren, idealerweise auf auf separaten Rechnern. Weitere Informationen dazu, wie Sie ermitteln können, wie viele Agents ausführen, siehe Leistung des Übertragungs-Agents maximieren
Geben Sie keine vertraulichen Daten wie personenidentifizierbare Informationen an (PII) oder Sicherheitsdaten in das Präfix der Agent-ID ein. Ressourcennamen können an die Namen anderer Google Cloud-Ressourcen weitergegeben und Google-internen Systemen außerhalb Ihres Projekts zu implementieren.So installieren und führen Sie Übertragungs-Agents aus:
Google Cloud Console
Rufen Sie in der Google Cloud Console die Seite Agent-Pools auf.
Wählen Sie den Agent-Pool aus, dem Sie den neuen Agent hinzufügen möchten.
Klicken Sie auf Agent installieren.
Folgen Sie der Anleitung, um den Agent zu installieren und auszuführen.
Weitere Informationen zu den Befehlszeilenoptionen des Agents finden Sie unter Agent-Befehlszeilenoptionen.
gcloud-CLI
Wenn Sie einen oder mehrere Agents mithilfe der gcloud CLI installieren möchten, führen Sie gcloud transfer agents install
aus:
gcloud transfer agents install --pool=POOL_NAME --count=NUM_AGENTS \
--mount-directories=MOUNT_DIRECTORIES
Das Tool führt Sie durch die erforderlichen Schritte zur Installation des Agents. Dieser Befehl installiert NUM_AGENTS Agents auf Ihrem Computer, die dem Poolnamen angegeben als POOL_NAME zugeordnet sind und authentifiziert die Agents mithilfe Ihrer gcloud
-Anmeldedaten. Der Poolname muss vorhanden sein oder ein Fehler wird zurückgegeben.
Das Flag --mount-directories
ist optional, wird aber dringend empfohlen. Das
value ist eine durch Kommas getrennte Liste von Verzeichnissen im Dateisystem, in die
um dem Agent Zugriff zu gewähren.
Wenn Sie dieses Flag weglassen, wird das gesamte Dateisystem im Agent-Container bereitgestellt. Weitere Informationen finden Sie unter
die
Referenz zu gcloud
.
S3-kompatible Quellen
Wenn Sie Agents zur Verwendung mit einer S3-kompatiblen Quelle installieren,
müssen Sie AWS-Anmeldedaten entweder als Umgebungsvariablen
AWS_ACCESS_KEY_ID
und AWS_SECRET_ACCESS_KEY
oder gespeichert als
Standardanmeldedaten in den Konfigurationsdateien Ihres Systems.
export AWS_ACCESS_KEY_ID=ID
export AWS_SECRET_ACCESS_KEY=SECRET
gcloud transfer agents install --pool=POOL_NAME \
--creds-file=/relative/path/to/service-account-key.json
Dienstkontoschlüssel verwenden
Verwenden Sie die Option --creds-file
, um Agents mit einem Dienstkontoschlüssel auszuführen:
gcloud transfer agents install --pool=POOL_NAME --count=NUM_AGENTS \
--creds-file=/relative/path/to/service-account-key.json
Weitere Informationen
Für eine vollständige Liste der optionalen Flags führen Sie gcloud transfer agents install --help
aus oder lesen Sie die Referenz zu gcloud transfer
.
docker run
Bevor Sie Agents mit docker run
installieren, folgen Sie der Anleitung zum
Installieren Sie Docker.
Mit dem Befehl docker run
wird ein Agent installiert. Um die Anzahl der Agents zu erhöhen
in Ihrem Pool, führen Sie diesen Befehl so oft wie nötig aus.
Beim Installieren von Agents können Sie sich mit Ihrem gcloud
authentifizieren
oder mit einem Dienstkonto.
Standardanmeldedaten
So lassen Sie zu, dass sich der Docker-Container bei Ihrem gcloud
-Standard authentifizieren kann
Anmeldedaten erstellen, ein Docker-Volume erstellen, das eine Datei mit Ihrer Anwendung enthält
Standardanmeldedaten verwenden, indem Sie den folgenden Befehl ausführen:
sudo docker run -ti --name gcloud-config google/cloud-sdk gcloud auth application-default login
Installieren Sie dann mit dem folgenden Befehl einen Agent.
Das Flag --volumes-from
, um das Anmeldedaten-Volume gcloud-config
bereitzustellen:
sudo docker run --ulimit memlock=64000000 -d --rm \ --volumes-from gcloud-config \ -v HOST_DIRECTORY:CONTAINER_DIRECTORY \ gcr.io/cloud-ingest/tsop-agent:latest \ --project-id=PROJECT_ID \ --hostname=$(hostname) \ --agent-pool=POOL_NAME
Dienstkontoauthentifizierung
Zum Installieren und Ausführen von Übertragungs-Agents docker run
mit einem Dienstkonto
Anmeldedaten, geben Sie den Pfad zu Ihrem Dienstkontoschlüssel im JSON-Format an
mit dem Flag --creds-file
.
Dem Pfad muss der String /transfer_root
vorangestellt werden.
Weitere Informationen finden Sie unter Dienstkontoschlüssel erstellen und verwalten finden Sie weitere Informationen zu Dienstkontoschlüsseln.
sudo docker run --ulimit memlock=64000000 -d --rm \ -v HOST_DIRECTORY:CONTAINER_DIRECTORY \ -v PATH/TO/KEY.JSON:PATH/TO/KEY.JSON \ gcr.io/cloud-ingest/tsop-agent:latest \ --project-id=PROJECT_ID \ --creds-file=/transfer_root/PATH/TO/KEY.JSON --hostname=$(hostname) \ --agent-pool=POOL_NAME
Optionen und Flags
Ersetzen Sie die Variablen in den obigen Beispielen durch Folgendes: Informationen:
HOST_DIRECTORY
ist das Verzeichnis auf dem Hostcomputer, aus dem Sie kopieren möchten. Sie können mehr als ein-v
-Flag verwenden , um weitere Verzeichnisse anzugeben, aus denen kopiert werden soll.CONTAINER_DIRECTORY
ist das Verzeichnis, das dem Agent-Container zugeordnet ist. Sie muss mitHOST_DIRECTORY
PROJECT_ID
ist der/die/das Projekt-ID auf dem die Übertragung gehostet wird.POOL_NAME
ist der Name des Agent-Pools, in dem der Installieren Sie diesen Agent. Wenn Sie dieses Flag weglassen, wird der Agent in Ihrem den Pooltransfer_service_default
des Projekts.
Der Befehl docker run
unterstützt zusätzliche Flags.
--enable-mount-directory
stellt das gesamte Dateisystem unter folgendem Pfad bereit:/transfer_root
-Verzeichnis im Container. Wenn--enable-mount-directory
angegeben ist, werden Verzeichnisbeschränkungen mit dem Flag-v
nicht angewendet.--creds-file=CREDENTIAL_FILE
gibt den Pfad zu Eine Dienstkonto-Datei mit Anmeldedaten im JSON-Format. Es sei denn, Sie verwenden--enable_mount_directory
müssen Sie Folgendes tun:- Stellen Sie die Anmeldedatendatei mit dem Flag
-v
bereit. - Stellen Sie dem Pfad
--creds-file
das Präfix/transfer_root
voran.
Beispiel:
-v /tmp/key.json:/tmp/key.json \ --creds-file=/transfer_root/tmp/key.json
- Stellen Sie die Anmeldedatendatei mit dem Flag
--enable-s3
gibt an, dass dieser Agent für Übertragungen aus S3-kompatibler Speicher. Vertreter Diese Option kann nicht für Übertragungen aus einer POSIX-Datei verwendet werden. Systeme.Wenn die Übertragung aus einem AWS S3- oder S3-kompatiblen Speicher erfolgt, übergeben Sie Zugriffsschlüssel-ID und geheimen Schlüssel mithilfe von Umgebungsvariablen:
-e AWS_ACCESS_KEY_ID=AWS_ACCESS_KEY_ID \ -e AWS_SECRET_ACCESS_KEY=AWS_SECRET_ACCESS_KEY
--env HTTPS_PROXY=PROXY
gibt einen Weiterleitungsproxy an in Ihrem Netzwerk. Der Wert vonPROXY
ist die HTTP-URL und Port des Proxyservers. Achten Sie darauf, dass Sie die HTTP-URL und eine HTTPS-URL, um zu vermeiden, dass Anfragen in TLS-Verschlüsselung doppelt verpackt werden. Doppelt verpackte Anfragen verhindern, dass der Proxyserver gültige ausgehende Anfragen.--agent-id-prefix=ID_PREFIX
gibt ein optionales Präfix an, das der Agent-ID vorangestellt wird, um zu helfen, den Agent oder seinen Computer in der Google Cloud Console identifiziert. Wenn ein Präfix verwendet wird, hat die Agent-ID das Formatprefix + hostname + Docker container ID
.--log-dir=LOGS_DIRECTORY
ändert das Verzeichnis in die der Agent Logs schreibt. Das Standardverzeichnis ist/tmp/
.Wenn Sie
--enable_mount_directory
nicht angegeben haben, müssen Sie/transfer_root
diesem Pfad voranstellen. Beispiel:/transfer_root/logs
.--max-physical-mem=MAX_MEMORY
: Agents werden standardmäßig auf mit maximal 8 GiB Systemspeicher. Wenn der Standardwert nicht zu Ihrer Umgebung passt, können Sie in den folgenden Formaten eine geeignete maximale Speichernutzung angeben:max-physical-mem
WertEinstellung für den maximalen Arbeitsspeicher 6g
6 Gigabyte 6gb
6 Gigabyte 6GiB
6 Gibibyte
Agent-Verbindungen bestätigen
So prüfen Sie, ob Ihre Agents verbunden sind:
Rufen Sie in der Google Cloud Console die Seite Agent-Pools auf.
Ihre Agent-Pools werden mit der Anzahl der verbundenen Agents angezeigt.
Wählen Sie einen Agent-Pool aus, um Details zu verbundenen Agents aufzurufen.
Wenn ein neuer Agent nicht innerhalb von zehn Minuten nach der Erstellung auf der Seite des Agent-Pools angezeigt wird, finden Sie weitere Informationen unter Agents sind nicht verbunden.
Agent-Aktivität überwachen
Sie können Cloud Monitoring-Benachrichtigungen verwenden, um die Agent-Aktivität zu überwachen.
Monitoring ist für project
, agent_pool
und agent_id
verfügbar
Dimensionen.
Mit diesen Monitoring-Daten können Sie Benachrichtigungen einrichten, um über potenzielle Probleme bei der Übertragung informiert zu werden. Erstellen Sie dazu eine Benachrichtigung für einen der folgenden Google Cloud-Messwerte:
Messwertname | Beschreibung | Empfohlene Anwendungsmöglichkeiten |
---|---|---|
storagetransfer.googleapis.com/agent/transferred_bytes_count | Gibt an, wie schnell ein bestimmter Agent Daten über alle von ihm bereitgestellten Jobs zu einem bestimmten Zeitpunkt verschiebt. | Benachrichtigung bei Leistungsrückgängen. |
storagetransfer.googleapis.com/agent/connected | Ein boolescher Wert, der true ist, für jeden Agent, von dem Google Cloud eine aktuelle Heartbeat-Nachricht erhalten hat. |
|
Agent beenden
Führen Sie zum Beenden eines Agents docker stop
für die Docker-Container-ID des Agents aus. So finden Sie
und beenden Sie den Agent:
Rufen Sie in der Google Cloud Console die Seite Agent-Pools auf.
Wählen Sie den Agent-Pool aus, der den zu beendenden Agent enthält.
Wählen Sie einen Agent aus der Liste aus. Im Feld Filter können Sie nach Präfixen, Agent-Status, Agent-Alter und mehr suchen.
Klicken Sie auf Agent beenden. Der Befehl
docker stop
mit der spezifischen Container-ID wird angezeigt.Führen Sie den Befehl auf dem Computer aus, auf dem der Agent ausgeführt wird. Ein erfolgreicher
docker stop
-Befehl gibt die Container-ID zurück.
Nach dem Beenden wird der Agent in der Liste der Agent-Pools als Nicht verbunden angezeigt.
Agent löschen
Um bestimmte Agents zu löschen, listen Sie auf, welche Agents auf Ihrem Computer ausgeführt werden:
docker container list --all --filter ancestor=gcr.io/cloud-ingest/tsop-agent
Übergeben Sie dann die Agent-IDs an transfer agents delete
:
gcloud transfer agents delete --ids=id1,id2,…
Verwenden Sie zum Löschen aller Agents, die auf dem Computer ausgeführt werden, eines der Flags --all
oder --uninstall
. Beide Flags löschen alle Agents auf dem Computer. Das --uninstall
-Flag deinstalliert zusätzlich das Agent-Docker-Image.
gcloud transfer agents delete --all
gcloud transfer agents delete --uninstall
Details zur Übertragung des Dateisystems
Inkrementelle Übertragungen
Der Storage Transfer Service beginnt mit allen Daten, die an der Quelle und am Ziel vorhanden sind, um festzustellen, welche Quelldateien seit der letzten Übertragung neu, aktualisiert oder gelöscht wurden. Dadurch soll die von Ihren Maschinen gesendete Datenmenge reduziert, die Bandbreite effektiv genutzt und die Übertragungszeiten reduziert werden.
Um festzustellen, ob eine Datei geändert wurde, prüfen wir die Datei der Quelldatei haben und mit dem Datum der letzten Änderung die beim letzten Kopieren der Datei erfasste Größe. Wenn wir neue oder geänderte kopieren wir die gesamte Datei an ihr Ziel. Weitere Informationen zu Details zur Datenkonsistenz
Standardmäßig erkennen wir keine Dateien, die aus der Quelle gelöscht wurden, aber nicht darauf reagieren. Wenn Sie beim Erstellen oder Bearbeiten die Sync-Option Zieldateien löschen wählen, die sich nicht auch in der Quelle befinden, wird bei Ihrer Übertragung das entsprechende Objekt am Ziel gelöscht.
Wenn Sie die Synchronisierungsoption Zieldateien löschen, die nicht auch in der Quelle sind auswählen, werden Dateien, die versehentlich an der Quelle gelöscht wurden, auch am Ziel gelöscht. Wenn Sie verhindern möchten, dass Datenverluste versehentlich gelöscht werden, empfehlen wir, die Objektversionierung im Ziel-Bucket zu aktivieren, wenn Sie diese Option verwenden möchten. Wenn Sie dann versehentlich eine Datei löschen, können Sie Ihre Objekte in Cloud Storage in einer älteren Version wiederherstellen.
Details zur Datenkonsistenz
Bei einem erfolgreichen Übertragungsvorgang werden alle Quelldateien übertragen, die während der gesamten Ausführungszeit des Vorgangs nicht geändert wurden. Quelldateien, die während einer Übertragung erstellt, aktualisiert oder gelöscht wurden, können diese Änderungen im Zieldatensatz enthalten.
Storage Transfer Service ermittelt anhand des Zeitpunkts und der Größe der letzten Änderung einer Datei,
geändert. Wenn eine Datei aktualisiert wird, ohne die Zeit der letzten Änderung zu ändern, oder
und Sie die Option delete-objects-from-source
aktivieren, können Daten verloren gehen.
von dieser Änderung erhalten.
Wenn Sie das Feature delete-objects-from-source
verwenden, empfehlen wir dringend, Schreibvorgänge in die Quelle für die Dauer der Übertragung einzufrieren, um vor Datenverlust zu schützen.
Führen Sie einen der folgenden Schritte aus, um Schreibvorgänge in der Quelle zu fixieren:
- Klonen Sie das zu übertragende Verzeichnis und verwenden Sie das geklonte als Übertragungsquelle.
- Anwendungen anhalten, die in das Quellverzeichnis schreiben
Wenn es wichtig ist, während einer Übertragung vorgenommene Änderungen zu erfassen, können Sie die Übertragung noch einmal ausführen oder das Quelldateisystem während der Ausführung als schreibgeschützt festlegen.
Da Cloud Storage nicht das Konzept von Verzeichnissen hat, ist die Quelle leer Verzeichnisse werden nicht übertragen.