Best Practices für Cloud Storage

Diese Seite enthält einen Index der Best Practices für Cloud Storage. Sie können die hier erfassten Informationen als Kurzreferenz dafür verwenden, was beim Erstellen einer Anwendung, die Cloud Storage verwendet, zu beachten ist.

Für den Einstieg in Cloud Storage ist diese Seite nicht geeignet, da hier nicht die Grundlagen der Nutzung von Cloud Storage beschrieben werden. Wenn Sie ein neuer Nutzer sind, empfehlen wir Ihnen, mit Objektspeicher mit der Google Cloud Console erkennen oder Objektspeicher mit dem gcloud-Tool erkennen zu beginnen.

Benennung

Informationen zu den Anforderungen und Überlegungen für Namen finden Sie unter Bucket-Benennung und Benennungsrichtlinien für Objekte.

Traffic

Führen Sie eine Überschlagsschätzung des Trafficaufkommens durch, das an Cloud Storage gesendet wird. Berücksichtigen Sie dabei insbesondere Folgendes:
- Vorgänge pro Sekunde: Wie viele Vorgänge pro Sekunde erwarten Sie für Buckets und Objekte sowie für das Erstellen, Aktualisieren und Löschen?
- Bandbreite: Wie viele Daten werden in welchem Zeitrahmen gesendet? Sie können ein Tool wie Wolfram Alpha verwenden, um Fehler bei Berechnungen zu vermeiden.
- Cachesteuerung: Durch die Angabe von Cache-Control-Metadaten bei öffentlich zugänglichen Objekten verringert die Leselatenz bei häufig genutzten oder häufig aufgerufenen Objekten. Eine Anleitung zum Festlegen von Objektmetadaten wie Cache-Control finden Sie unter Metadaten anzeigen und bearbeiten.
Entwickeln Sie Ihre Anwendung so, dass Trafficspitzen auf ein Minimum reduziert werden. Wenn es in der Anwendung Clients gibt, die Aktualisierungen durchführen, verteilen Sie diese über den Tag.
Beachten Sie beim Entwerfen von Anwendungen für hohe Anfrageraten die Ratenbegrenzungen für bestimmte Vorgänge. Beachten Sie die Bandbreitenlimits für bestimmte Arten von ausgehendem Traffic und folgen Sie den Richtlinien für die Anforderungsrate und Zugriffsverteilung. Achten Sie insbesondere auf Autoscaling und die Notwendigkeit, die Anforderungsraten schrittweise zu erhöhen, um eine optimale Leistung zu erzielen.
Beachten Sie bei der Fehlerbehandlung Folgendes:
- Achten Sie darauf, dass Ihre Anwendung eine Wiederholungsstrategie verwendet, um Probleme aufgrund hoher Trafficspitzen zu vermeiden.
- Wiederholen Sie den Vorgang mit einer neuen Verbindung und lösen Sie den Domainnamen eventuell noch einmal auf. Dadurch wird eine "Server Stickiness" vermieden, bei der wiederholt versucht wird, über denselben Pfad zu laufen, und dieselbe fehlerhafte Komponente wie bei der ersten Anfrage durchlaufen wird.
Wenn Ihre Anwendung latenzabhängig ist, sollten Sie abgesicherte Anfragen verwenden. Mit abgesicherten Anfragen können Sie den Vorgang schneller wiederholen und die Extremwertlatenz verringern. Hierbei wird die Frist für Anfragen allerdings nicht verkürzt, was dazu führen kann, dass Anfragen vorzeitig ablaufen. Weitere Informationen finden Sie unter The Tail at Scale.
Bestimmen Sie das Leistungsniveau, das Nutzer von Ihrer Anwendung erwarten. Diese Informationen sind nützlich bei der Wahl einer Speicheroption und Region, wenn Sie neue Buckets erstellen. Beispiel: Es kann für Analyseanwendungen vorteilhaft sein, Rechenressourcen und Cloud Storage-Buckets am selben Standort zu platzieren.

Standorte und Datenspeicheroptionen

Informationen dazu, wie Sie Ihre Daten am besten speichern, finden Sie in den Themen Speicherklasse und Bucket-Standort.

ACLs und Zugriffssteuerung

Cloud Storage-Anfragen beziehen sich auf die Namen von Buckets und Objekten. Selbst wenn ACLs verhindern, dass nicht autorisierte Dritte auf Buckets oder Objekte zugreifen, könnten diese versuchen, Anfragen mit Bucket- oder Objektnamen zu senden, um anhand der Fehlermeldungen festzustellen, ob diese existieren. Auf diese Weise können Informationen in Bucket- oder Objektnamen bekannt werden. Wenn Sie Bedenken hinsichtlich der Vertraulichkeit Ihrer Bucket- oder Objektnamen haben, sollten Sie geeignete Vorkehrungen treffen, wie zum Beispiel:
- Bucket- und Objektnamen wählen, die schwer zu erraten sind. Beispiel: Der Bucket-Name mybucket-gtbytul3 ist ausreichend willkürlich gewählt, sodass unbefugte Dritte ihn nicht so einfach erraten und keine anderen Bucket-Namen daraus ableiten können.
- Keine vertraulichen Informationen als Bestandteile von Bucket- oder Objektnamen verwenden. Beispiel: Anstatt den Bucket mysecretproject-prodbucket zu nennen, nennen Sie ihn somemeaninglesscodename-prod. In manchen Anwendungen kann es sinnvoll sein, vertrauliche Metadaten in benutzerdefinierten Cloud Storage-Headern wie x-goog-meta beizubehalten, statt die Metadaten in Objektnamen zu codieren.
Es ist besser, Gruppen zu verwenden, statt eine große Anzahl an Nutzern explizit aufzulisten. Gruppen lassen sich nicht nur besser skalieren, sie bieten auch eine sehr effiziente Möglichkeit, die Zugriffssteuerung für eine große Anzahl von Objekten gleichzeitig zu aktualisieren. Außerdem ist diese Lösung wirtschaftlicher, da Sie nicht für jedes einzelne Objekt eine Anfrage senden müssen, um die ACLs zu ändern.
Prüfen und beachten Sie die Best Practices für die Zugriffssteuerung.
Das Zugriffssteuerungssystem von Cloud Storage bietet die Möglichkeit, bestimmte Objekte öffentlich lesbar zu machen. Sie sollten sich sehr sicher sein, dass Objekte, die Sie mit dieser Berechtigung schreiben, öffentlich verfügbar sein sollen. Sobald sie "veröffentlicht" wurden, können Daten im Internet an viele Orte kopiert werden. Daher ist es praktisch unmöglich, später die Kontrolle über den Lesezugriff auf ein Objekt wiederherzustellen, das mit dieser Berechtigung geschrieben wurde.
Das Zugriffssteuerungssystem von Cloud Storage bietet außerdem die Möglichkeit, für Buckets einen öffentlichen Schreibzugriff zu gewähren. Diese Bucket-Konfiguration kann zwar für verschiedene Zwecke nützlich sein, dennoch empfehlen wir, diese Berechtigung nicht zu verwenden. Sie kann missbraucht werden, um illegale Inhalte, Viren und andere Malware zu verbreiten. Der Bucket-Inhaber ist für die in seinen Buckets gespeicherten Inhalte rechtlich und finanziell verantwortlich.

Wenn Sie Inhalte auf sichere Weise Nutzern zur Verfügung stellen möchten, die kein Nutzerkonto haben, sollten Sie signierte URLs verwenden. Mit signierten URLs können Sie zum Beispiel einen Link zu einem Objekt zur Verfügung stellen und die Nutzer Ihrer Anwendung müssen sich für den Zugriff auf dieses Objekt nicht bei Cloud Storage authentifizieren. Wenn Sie eine signierte URL erstellen, bestimmen Sie die Art (Lesen, Schreiben, Löschen) und die Dauer der Zugriffs.

Datenuploads

Wenn Sie XHR-Rückrufe (XMLHttpRequest) verwenden, um Fortschrittsaktualisierungen zu erhalten, vermeiden Sie es, die Verbindung zu trennen und neu aufzubauen, wenn Sie feststellen, dass der Vorgang ins Stocken geraten ist. Auf diese Weise wird bei Netzwerküberlastung ein falsch-positiver Feedback Loop generiert. Bei Netzwerküberlastung können XHR-Rückrufe hinter die Bestätigungsaktivität (ACK/NACK) aus dem Uploadstream zurückgestellt werden. Wird die Verbindung unter diesen Voraussetzungen getrennt und neu aufgebaut, wird genau in diesem Engpass noch mehr Netzwerkkapazität beansprucht.
Für Uploadtraffic wird empfohlen, ausreichende Zeitlimits einzurichten. Richten Sie für mehr Komfort für die Endnutzer einen clientseitigen Timer ein, der das Statusfenster des Clients mit einer Meldung aktualisiert (z. B. "Netzwerk überlastet"), wenn die Anwendung längere Zeit keinen XHR-Rückruf erhalten hat. Vermeiden Sie es, die Verbindung einfach zu trennen und es noch einmal zu versuchen, wenn dieses Problem auftritt.
Durch Aktivierung der gzip-Komprimierung kann die für jede Anfrage benötigte Bandbreite einfach und bequem reduziert werden. Auch wenn die Dekomprimierung der Ergebnisse zusätzliche CPU-Zeit kostet, lohnt sie sich verglichen mit den Netzwerkkosten durchaus.

Ein Objekt, das im gzip-Format hochgeladen wurde, kann im Allgemeinen auch im gzip-Format bereitgestellt werden. Vermeiden Sie jedoch den Upload von Inhalten, bei denen sowohl content-encoding: gzip als auch ein content-type komprimiert sind, da dies zu unerwartetem Verhalten führen kann.
Wir empfehlen die Verwendung fortsetzbarer Uploads, mit denen Sie die Übertragung von Daten auch dann fortsetzen können, wenn ein Kommunikationsfehler den Datenfluss unterbrochen hat. Sie können auch mehrteilige XML API-Uploads verwenden, um Teile einer Datei parallel hochzuladen, wodurch die Zeit für den Gesamtupload möglicherweise reduziert wird.

Daten löschen

Richtlinien und Überlegungen zum Löschen von Daten finden Sie unter Objekte löschen. Sie können auch Features zum Steuern von Datenlebenszyklen verwenden, um zu verhindern, dass Ihre Daten von Ihrer Anwendungssoftware oder von Nutzern fälschlicherweise gelöscht werden.