Wichtige Begriffe

Damit Sie Cloud Storage effektiv nutzen können, sollten Sie sich mit einigen der Konzepte vertraut machen, auf denen der Dienst basiert. Auf dieser Seite erhalten Sie einen Überblick über wichtige Begriffe und Konzepte für Cloud Storage.

Eine Einführung in die Verwendung von Cloud Storage finden Sie unter Was ist Cloud Storage?.

Projekte

Alle Daten in Cloud Storage gehören zu einem Projekt. Ein Projekt umfasst mehrere Nutzer und APIs sowie Abrechnungs-, Authentifizierungs- und Monitoringeinstellungen für diese APIs. Sie können ein oder mehrere Projekte erstellen.

Buckets

Buckets sind die grundlegenden Container, die Ihre Daten enthalten. Alles, was Sie in Cloud Storage speichern, muss sich in einem Bucket befinden. Mit Buckets können Sie Ihre Daten organisieren und den Zugriff auf Ihre Daten steuern. Im Unterschied zu Verzeichnissen und Ordnern können Sie Buckets jedoch nicht verschachteln. Die Anzahl der Buckets, die Sie in einem Projekt oder an einem Standort haben können, ist zwar nicht begrenzt, doch es gibt Limits für die Rate, mit der Sie Buckets erstellen oder löschen können.

Wenn Sie einen Bucket erstellen, geben Sie ihm einen global eindeutigen Namen und einen geografischen Standort, an dem der Bucket und sein Inhalt gespeichert werden. Name und Standort des Buckets können nach dem Erstellen nicht mehr geändert werden. Sie können jedoch den Bucket löschen und neu erstellen, um ein ähnliches Ergebnis zu erzielen. Es gibt auch optionale Bucket-Einstellungen, die Sie beim Erstellen des Buckets konfigurieren und später ändern können.

Objekte

Objekte sind die einzelnen Daten, die Sie in Cloud Storage speichern. Die Anzahl der Objekte, die Sie in einem Bucket erstellen können, ist nicht begrenzt.

Objekte haben zwei Komponenten: Objektdaten und Objektmetadaten. Objektdaten sind normalerweise eine Datei, die Sie in Cloud Storage speichern möchten und vollständig in Cloud Storage undurchsichtig sind. Objektmetadaten bezeichnen eine Sammlung von Name/Wert-Paaren, die verschiedene Objektqualitäten beschreiben.

Objektnamen

Die Namen von Objekten werden in Cloud Storage als Objektmetadaten behandelt. Objektnamen können eine beliebige Kombination aus (UTF-8-codierten) Unicode-Zeichen enthalten, müssen eine Länge von weniger als 1.024 Byte haben und innerhalb eines Buckets eindeutig sein.

Cloud Storage verwendet zum Speichern von Objekten einen flachen Namespace. Somit betrachtet Cloud Storage alle Objekte in einem bestimmten Bucket als unabhängig und ohne hierarchische Beziehung. Der Einfachheit halber arbeiten Tools wie die Google Cloud Console und gsutil mit Objekten mit einem Schrägstrich (/) im Namen, als wären sie in einer virtuellen Hierarchie gespeichert.

So ließe sich ein Objekt /europe/france/paris.jpg nennen und ein anderes /europe/france/cannes.jpg. In der Cloud Console können Sie diese Objekte dann so öffnen, als befänden sie sich in einer hierarchischen Verzeichnisstruktur in den Ordnern europe und france.

Weitere Informationen zum Umbenennen eines Objekts finden Sie in den Benennungsrichtlinien für Objekte.

Unveränderlichkeit von Objekten

Objekte sind unveränderlich, d. h. ein hochgeladenes Objekt kann sich während seiner gesamten Speicherdauer nicht verändern. Die Speicherdauer eines Objekts ist die Zeit zwischen erfolgreicher Objekterstellung, wie z. B. Hochladen und erfolgreiche Objektlöschung. Das bedeutet in der Praxis, dass Sie keine inkrementellen Änderungen an Objekten vornehmen können, z. B. Anfüge- oder Kürzungsvorgänge. Es ist jedoch möglich, Objekte zu ersetzen, die in Cloud Storage gespeichert sind. Dies geschieht atomar: Bis zum Abschluss des neuen Uploads wird Lesern die alte Version des Objekts und nach Abschluss des Uploads die neue Version bereitgestellt. Ein einzelner Ersetzungsvorgang markiert also das Ende der Lebensdauer eines unveränderlichen Objekts und den Beginn der Lebensdauer eines neuen unveränderlichen Objekts.

Die Generierungsnummer für ein Objekt ändert sich jedes Mal, wenn Sie die Daten des Objekts ersetzen. Somit identifiziert die Generierungsnummer ein unveränderliches Objekt eindeutig.

Beachten Sie, dass beim schnellen Ersetzen desselben Objekts ein Limit von einem Mal pro Sekunde gilt. Wenn dasselbe Objekt öfter ersetzt wird, kann dies zu 429 Too Many Requests-Fehlern führen. Sie sollten Ihre Anwendung so konfigurieren, dass Daten für ein bestimmtes Objekt nicht öfter als einmal pro Sekunde hochgeladen und gelegentliche 429 Too Many Requests-Fehler mit dem abgeschnittenen exponentiellen Backoff bewältigt werden.

Ressourcen

Eine Ressource ist eine Entität innerhalb von Google Cloud. Jedes Projekt, jeder Bucket und jedes Objekt in Google Cloud ist eine Ressource, ebenso wie Compute Engine-Instanzen.

Ressourcennamen

Jede Ressource hat einen eindeutigen Namen, durch den sie identifiziert werden kann, ähnlich wie ein Dateiname. Buckets haben einen Ressourcennamen im Format projects/_/buckets/BUCKET_NAME, wobei BUCKET_NAME die ID des Buckets ist. Objekte haben einen Ressourcennamen im Format projects/_/buckets/BUCKET_NAME/objects/OBJECT_NAME, wobei OBJECT_NAME die ID des Objekts ist.

Die Kennung #NUMBER am Ende des Ressourcennamens weist auf eine bestimmte Generierung des Objekts hin. #0 ist eine spezielle Kennung für die zuletzt erstellte Version eines Objekts. Das Anfügen von #0 an einen Objektnamen ist nützlich, wenn dessen Ende ein String ist, der andernfalls als Generierungsnummer interpretiert würde.

Netzwerknutzung

Bei der Netzwerknutzung geht es um die Daten, die an oder von Cloud Storage gesendet werden.

Ausgehender Traffic bezeichnet Daten, die von Cloud Storage in HTTP-Antworten gesendet werden. Ein Beispiel für ausgehenden Traffic sind Daten oder Metadaten, die aus einem Cloud Storage-Bucket gelesen werden.

Eingehender Traffic bezeichnet Daten, die in HTTP-Anfragen an Cloud Storage gesendet werden. Ein Beispiel für eingehenden Traffic sind Daten oder Metadaten, die in einen Cloud Storage-Bucket geschrieben werden.

Weitere Informationen finden Sie unter Cloud Storage – Preise und Cloud Storage – Kontingente.

Geo-Redundanz

Georedundante Daten werden redundant an mindestens zwei geografisch getrennten Orten gespeichert, die mindestens 160 Kilometer voneinander entfernt sind. In Multi- oder Dual-Regionen gespeicherte Objekte sind aufgrund der Datenreplikation unabhängig von ihrer Speicherklasse georedundant.

  • Bei Dual-Regionen wird Georedundanz mithilfe von zwei bestimmten Regionen erreicht.

  • Die Georedundanz bei Multiregionen wird über eine Kombination von Rechenzentren innerhalb der angegebenen Multiregion erreicht. Diese kann Rechenzentren umfassen, die nicht ausdrücklich als verfügbare Regionen aufgeführt sind.

Georedundanz erfolgt asynchron, allerdings sind alle Cloud Storage-Daten nach dem Upload an mindestens einem geografischen Ort redundant. So sind beispielsweise alle Cloud Storage-Daten über mindestens zwei Zonen derselben Region redundant.

Die meisten Objekte sind zwar innerhalb von Minuten georedundant, doch kann die Replikation einiger Objekte viel länger dauern.

Georedundanz sorgt für maximale Verfügbarkeit Ihrer Daten, selbst wenn es zu großflächigen Störungen kommt, z. B. durch Naturkatastrophen. Im unwahrscheinlichen Fall eines regionenweiten Ausfalls bleiben Buckets an georedundanten Standorten verfügbar, ohne dass Speicherpfade geändert werden müssen. Beachten Sie, dass zum Erreichen eines unterbrechungsfreien Dienst auch andere Produkte wie Compute Engine-Instanzen so eingerichtet werden müssen, dass sie georedundant sind, .

Standardreplikation

Cloud Storage bietet ein Standardreplikationsverhalten, um Georedundanz für in Dual- und Multi-Regionen gespeicherte Daten zu unterstützen. Die Standardreplikation ist so konzipiert, dass 99,9% der neu geschriebenen Cloud Storage-Objekte asynchron mit einem Schreib-, Umschreib-, Kopier- oder Zusammensetzungsvorgang in eine separate Region innerhalb eines Ziels von einer Stunde repliziert werden.

Schnelle Replikation

Turboreplikation ist ein Premium-Feature, das für designierte Buckets mit zwei Regionen gegen eine zusätzliche Gebühr verfügbar ist. Dieses Feature bietet ein kürzeres, vorhersehbareres Recovery Point Objective (RPO), um das Risiko eines Datenverlusts zu verringern. Die Turboreplikation ist so konzipiert, dass 100 % der neu geschriebenen Cloud Storage-Objekte, die mit Schreib-, Umschreib-, Kopier- oder Zusammensetzungsvorgängen verknüpft sind, in einer separaten Region nach Möglichkeit innerhalb von 15 Minuten asynchron repliziert werden.

Nächste Schritte

Jetzt testen

Wenn Sie mit Google Cloud noch nicht vertraut sind, erstellen Sie ein Konto, um die Leistungsfähigkeit von Cloud Storage in der Praxis sehen und bewerten zu können. Neukunden erhalten außerdem ein Guthaben von 300 $, um Arbeitslasten auszuführen, zu testen und bereitzustellen.

Cloud Storage kostenlos testen