Seleziona e implementa una strategia di archiviazione

Last reviewed 2023-07-17 UTC

Questo documento nel framework dell'architettura Google Cloud fornisce le best practice per eseguire il deployment del sistema in base allo spazio di archiviazione. Scoprirai come selezionare una strategia di archiviazione e come gestire lo spazio di archiviazione, i pattern di accesso e i carichi di lavoro.

Per facilitare lo scambio di dati ed eseguire il backup e l'archiviazione dei dati in modo sicuro, le organizzazioni devono scegliere un piano di archiviazione basato su carico di lavoro, operazioni di input/output al secondo (IOPS), latenza, frequenza di recupero, località, capacità e formato (blocco, file e oggetto).

Cloud Storage offre servizi di archiviazione di oggetti affidabili e sicuri, tra cui:

In Google Cloud, le IOPS scalano in base allo spazio di archiviazione di cui hai eseguito il provisioning. I tipi di archiviazione come Persistent Disk richiedono la replica e il backup manuali perché operano a livello di zona o di regione. Al contrario, l'archiviazione di oggetti è ad alta disponibilità e replica automaticamente i dati in una singola regione o in più regioni.

Tipo di archiviazione

Questa sezione fornisce le best practice per la scelta di un tipo di archiviazione per supportare il tuo sistema.

Valuta le opzioni per le esigenze di archiviazione con prestazioni elevate

Valuta i dischi permanenti o le unità a stato solido (SSD) locali per le applicazioni di calcolo che richiedono un'archiviazione ad alte prestazioni. Cloud Storage è un archivio di oggetti immutabile con controllo delle versioni. L'utilizzo di Cloud Storage con Cloud CDN consente di ottimizzare i costi, soprattutto per gli oggetti statici a cui si accede di frequente.

Filestore supporta applicazioni multi-scrittura che richiedono spazio condiviso ad alte prestazioni. Filestore supporta anche le applicazioni legacy e moderne che richiedono operazioni su file simili a POSIX tramite montaggi NFS (Network File System).

Cloud Storage supporta casi d'uso come la creazione di data lake e la gestione dei requisiti di archiviazione. Prendi decisioni di compromesso in base a come scegli la classe di Cloud Storage, a causa dei costi di accesso e recupero, soprattutto quando configuri i criteri di conservazione. Per ulteriori informazioni, consulta Progettare una strategia di archiviazione ottimale per il carico di lavoro cloud.

Per impostazione predefinita, tutte le opzioni di archiviazione sono criptate at-rest e in transito mediante chiavi gestite da Google. Per i tipi di archiviazione come Persistent Disk e Cloud Storage, puoi fornire la tua chiave o gestirla tramite Cloud Key Management Service (Cloud KMS). Stabilisci una strategia per la gestione di queste chiavi prima di utilizzarle nei dati di produzione.

Scegli i servizi Google Cloud per supportare la progettazione dello spazio di archiviazione

Per informazioni sui servizi Google Cloud che supportano la progettazione dello spazio di archiviazione, utilizza la seguente tabella:

Servizio Google Cloud Description
Cloud Storage Consente l'archiviazione e il recupero a livello globale di qualsiasi quantità di dati in qualsiasi momento. Puoi utilizzare Cloud Storage per scenari diversi, tra cui pubblicazione di contenuti di siti web, archiviazione di dati e ripristino di emergenza o distribuzione agli utenti di oggetti di dati di grandi dimensioni tramite download diretto.

Per ulteriori informazioni, consulta le seguenti risorse:
Persistent Disk Archiviazione a blocchi ad alte prestazioni per Google Cloud. Persistent Disk fornisce spazio di archiviazione SSD e su disco rigido (HDD) che puoi collegare alle istanze in esecuzione in Compute Engine o Google Kubernetes Engine (GKE).
  • I dischi regionali offrono archiviazione durevole e replica dei dati tra due zone nella stessa regione. Se hai bisogno di IOPS più elevate e bassa latenza, Google Cloud offre Filestore.
  • Le unità SSD locali sono fisicamente collegate al server che ospita l'istanza della macchina virtuale. Puoi usare le unità SSD locali come spazio su disco temporaneo.
Filestore Un servizio gestito di archiviazione di file per applicazioni che richiedono un'interfaccia di file system e un file system condiviso per i dati. Filestore offre agli utenti un'esperienza fluida per il supporto di dispositivi NAS (Network Attached Storage) gestiti con le loro istanze di Compute Engine e GKE.
Cloud Storage for Firebase Creato per gli sviluppatori di app che hanno bisogno di archiviare e pubblicare contenuti generati dagli utenti, come foto o video. Tutti i file sono archiviati nei bucket di Cloud Storage, quindi sono accessibili sia da Firebase che da Google Cloud.

Scegli una strategia di archiviazione

Per selezionare una strategia di archiviazione che soddisfi i requisiti dell'applicazione, utilizza la seguente tabella:

Caso d'uso Suggerimenti
Vuoi archiviare i dati su larga scala al minor costo e accedere alle prestazioni di accesso non è un problema. Cloud Storage
Stai eseguendo applicazioni di computing che richiedono archiviazione immediata.

Per ulteriori informazioni, consulta Ottimizzazione delle prestazioni di dischi permanenti e SSD locali.
Persistent Disk o SSD locale
Stai eseguendo carichi di lavoro ad alte prestazioni che richiedono l'accesso in lettura e scrittura allo spazio condiviso. Filestore
Hai casi d'uso di computing ad alte prestazioni (HPC) o computing ad alta velocità effettiva (HTC). Uso dei cluster per il computing tecnico su larga scala nel cloud

Scegli l'archiviazione dei dati attivi o ad accesso sporadico in base alle esigenze di accesso allo spazio di archiviazione

Una classe di archiviazione è una parte dei metadati utilizzata da ogni oggetto. Per i dati pubblicati con una tariffa elevata e ad alta disponibilità, utilizza la classe Standard Storage. Per i dati a cui si accede raramente e che possono tollerare una disponibilità leggermente inferiore, utilizza la classe Nearline Storage, Coldline Storage o Archive Storage. Per ulteriori informazioni sulle considerazioni relative ai costi per la scelta di una classe di archiviazione, consulta i prezzi di Cloud Storage.

Valuta la località di archiviazione e le esigenze di protezione dei dati per Cloud Storage

Per un bucket Cloud Storage situato in una regione, i dati contenuti al suo interno vengono automaticamente replicati tra le zone all'interno della regione. La replica dei dati tra le zone protegge i dati in caso di errore a livello di zona all'interno di una regione.

Cloud Storage offre inoltre località ridondanti tra regioni, il che significa che i dati vengono replicati in più data center geograficamente separati. Per ulteriori informazioni, consulta Località dei bucket.

Usa Cloud CDN per migliorare la distribuzione di oggetti statici

Per ottimizzare i costi del recupero degli oggetti e ridurre al minimo la latenza dell'accesso, utilizza Cloud CDN. Cloud CDN utilizza il bilanciatore del carico delle applicazioni esterno di Cloud Load Balancing per fornire routing, controllo di integrità e supporto degli indirizzi IP anycast. Per ulteriori informazioni, consulta Configurazione di Cloud CDN con bucket Cloud.

Modello di accesso allo spazio di archiviazione e tipo di carico di lavoro

Questa sezione fornisce le best practice per la scelta dei pattern di accesso allo spazio di archiviazione e dei tipi di carichi di lavoro per il supporto del sistema.

Usa Persistent Disk per supportare un accesso allo spazio di archiviazione ad alte prestazioni

I modelli di accesso ai dati dipendono da come progetti le prestazioni del sistema. Cloud Storage offre archiviazione scalabile, ma non è la scelta ideale quando esegui carichi di lavoro di computing intensivo che richiedono l'accesso a una velocità effettiva elevata a grandi quantità di dati. Per un accesso allo spazio di archiviazione ad alte prestazioni, utilizza Persistent Disk.

Utilizza il backoff esponenziale quando implementi la logica per i nuovi tentativi

Utilizza il backoff esponenziale quando implementi la logica dei nuovi tentativi per gestire gli errori 5XX, 408 e 429. Viene eseguito il provisioning di ogni bucket Cloud Storage con capacità di I/O iniziale. Per ulteriori informazioni, consulta le linee guida per tasso di richieste e distribuzione degli accessi. Pianifica un incremento graduale delle richieste ripetute.

Gestione dell'archiviazione

Questa sezione fornisce le best practice per la gestione dello spazio di archiviazione al fine di supportare il tuo sistema.

Assegna nomi univoci a ogni bucket

Rendi univoco il nome di ogni bucket nello spazio dei nomi di Cloud Storage. Non includere informazioni sensibili nel nome del bucket. Scegli nomi difficili da indovinare per bucket e oggetti. Per ulteriori informazioni, consulta le linee guida per la denominazione dei bucket e le linee guida per la denominazione degli oggetti.

Mantieni privati i bucket Cloud Storage

A meno che non ci sia un motivo di natura aziendale, assicurati che il bucket Cloud Storage non sia accessibile pubblicamente o in modo anonimo. Per ulteriori informazioni, consulta la Panoramica del controllo dell'accesso.

Assegna nomi casuali agli oggetti per distribuire il carico in modo uniforme

Assegna nomi casuali agli oggetti per facilitare le prestazioni ed evitare l'hotspotting. Dove possibile, usa un prefisso randomizzato per gli oggetti. Per ulteriori informazioni, consulta Utilizzare una convenzione di denominazione che distribuisca il carico in modo uniforme tra gli intervalli chiave.

Applica la prevenzione dell'accesso pubblico

Per impedire l'accesso a livello di organizzazione, cartella, progetto o bucket, utilizza la prevenzione dell'accesso pubblico. Per ulteriori informazioni, consulta Utilizzo della prevenzione dell'accesso pubblico.

Passaggi successivi

Scopri di più sui servizi di database di Google Cloud e sulle best practice, tra cui:

Esplora altre categorie nel framework dell'architettura come affidabilità, eccellenza operativa e sicurezza, privacy e conformità.