Progetta una strategia di archiviazione ottimale per il tuo carico di lavoro cloud

Last reviewed 2024-05-29 UTC

Questa guida ti aiuta a valutare i requisiti di archiviazione del tuo carico di lavoro cloud, comprendere le opzioni di archiviazione disponibili in Google Cloud e progettare che fornisca un valore aziendale ottimale.

Per un riepilogo visivo dei principali suggerimenti di progettazione, consulta diagramma ad albero decisionale.

Panoramica del processo di progettazione

In qualità di Cloud Architect, quando pianifichi l'archiviazione per un carico di lavoro cloud, devi avere considerare per prima cosa le caratteristiche funzionali del carico di lavoro, vincoli, requisiti di resilienza, aspettative di prestazioni e obiettivi di costo. Poi devi esaminare i servizi e le funzionalità di archiviazione disponibili in Google Cloud. Poi, in base ai tuoi requisiti e alle opzioni disponibili, e selezionare i servizi e le funzionalità di archiviazione di cui hai bisogno.

Il seguente diagramma mostra questo processo di progettazione in 3 fasi:

Approccio graduale alla progettazione dell'archiviazione per i carichi di lavoro cloud.

Definisci i tuoi requisiti

Usa i questionari in questa sezione per definire i requisiti chiave di archiviazione il carico di lavoro di cui vuoi eseguire il deployment in Google Cloud.

Linee guida per la definizione dei requisiti di archiviazione

Quando rispondi ai questionari, tieni presente le seguenti linee guida:

  • Definisci i requisiti in modo granulare

    Ad esempio, se la tua applicazione ha bisogno di un file basato su Network File System (NFS) di archiviazione, identifica la versione NFS richiesta.

  • Valutare i requisiti futuri

    Ad esempio, l'implementazione attuale potrebbe servire gli utenti di paesi in Asia, ma potresti pianificare l'espansione dell'attività in altri continenti. In questo considerare gli eventuali requisiti normativi relativi allo spazio di archiviazione territori aziendali.

  • Valutare opportunità e requisiti specifici per il cloud

    • Sfrutta le opportunità specifiche del cloud.

      Ad esempio, per ottimizzare il costo di archiviazione per i dati archiviati in Cloud Storage, puoi controllare la durata dell'archiviazione utilizzando i dati dei criteri di conservazione e delle configurazioni del ciclo di vita.

    • Considera i requisiti specifici del cloud.

      Ad esempio, i dati on-premise potrebbero trovarsi in un unico data center, e potresti dover replicare i dati di cui è stata eseguita la migrazione le località di Google Cloud per la ridondanza.

Questionari

I questionari che seguono non sono elenchi di controllo esaustivi per la pianificazione. Utilizza le funzionalità di come punto di partenza per analizzare sistematicamente tutti i requisiti di archiviazione del carico di lavoro di cui vuoi eseguire il deployment in Google Cloud.

Valuta le caratteristiche del carico di lavoro

  • Che tipo di dati devi archiviare?

    Esempi

    • Contenuti di siti web statici
    • Backup e archivi per il ripristino di emergenza
    • Audit log per la conformità
    • Oggetti di dati di grandi dimensioni che gli utenti scaricano direttamente
    • Dati transazionali
    • Dati non strutturati ed eterogenei

  • Quanta capacità hai bisogno? Considera il tuo presente e il tuo futuro i tuoi requisiti.

  • La capacità dovrebbe scalare automaticamente con l'utilizzo?

  • Quali sono i requisiti di accesso? Ad esempio, se i dati sono accessibili dall'esterno di Google Cloud?

  • Quali sono i pattern di lettura-scrittura previsti?

    Esempi

    • Scritture e letture frequenti
    • Scritture frequenti, ma letture occasionali
    • Scritture e letture occasionali
    • Scritture occasionali, ma letture frequenti

  • Il carico di lavoro ha bisogno di un accesso basato su file, ad esempio utilizzando NFS?

  • Più client devono poter leggere o scrivere dati contemporaneamente?

Identificare i vincoli di sicurezza

  • Quali sono i tuoi requisiti per la crittografia dei dati? Ad esempio, devi utilizzare che controlli?

  • Ci sono requisiti di residenza dei dati?

Definire i requisiti di resilienza dei dati

  • Il tuo carico di lavoro ha bisogno di una memorizzazione nella cache a bassa latenza o di spazio temporaneo?
  • Hai bisogno di replicare i dati nel cloud per la ridondanza?
  • Hai bisogno di una rigorosa coerenza di lettura e scrittura per i set di dati replicati?

Impostare le aspettative di rendimento

  • Qual è la frequenza di I/O richiesta?

  • Di quali livelli di velocità effettiva di lettura e scrittura ha bisogno la tua applicazione?

  • Per quali ambienti hai bisogno di archiviazione? Per un determinato carico di lavoro, necessita di archiviazione ad alte prestazioni per l'ambiente di produzione, ma e scegliere un'opzione con prestazioni inferiori per gli ambienti non di produzione.

Rivedi le opzioni di archiviazione

Google Cloud offre servizi per l'archiviazione di tutte le chiavi formati: blocco, file e oggetto. Esaminare e valutare le funzionalità, il design e i relativi vantaggi dei servizi disponibili per ogni spazio formato.

Panoramica

Archiviazione a blocchi

I dati archiviati nell'archiviazione a blocchi sono suddivisi in blocchi, ciascuno memorizzato come blocco separato con un indirizzo univoco. Applicazioni per accedere ai dati, facendo riferimento agli indirizzi dei blocchi appropriati. Blocca l'archiviazione è ottimizzata per carichi di lavoro con elevato numero di IOPS, come le transazioni e l'elaborazione dei dati. È simile alla SAN (Storage Area Network) on-premise sistemi DAS (Direct Attached Storage).

Le opzioni di archiviazione a blocchi di Google Cloud fanno parte dal servizio Compute Engine.

Opzione Panoramica
Persistent Disk Unità a disco rigido (HDD) e unità a stato solido (SSD) per applicazioni aziendali e di database distribuite VM di Compute Engine e cluster di Google Kubernetes Engine (GKE).
Hyperdisk di Google Cloud Archiviazione di rete veloce e ridondante per VM di Compute Engine, con prestazioni e volumi configurabili che possono essere viene ridimensionato.
SSD locale Archiviazione a blocchi temporanea collegata in locale per prestazioni elevate diverse applicazioni.

Archiviazione di file

I dati sono organizzati e rappresentati in una gerarchia di file che sono archiviati in cartelle, come accade per lo spazio di archiviazione (NAS). I file system possono essere montati sui client utilizzando protocolli come NFS e Server Message Block (SMB). Le applicazioni accedono ai dati utilizzando il nome file e il percorso della directory pertinenti.

Google Cloud offre una gamma di servizi per l'archiviazione dei file.

Soluzione Panoramica
Google Cloud Filestore

File server NFSv3 per VM di Compute Engine e di cluster Google Kubernetes Engine.

Puoi scegliere un livello di servizio (di base, a livello di zona regionale) in base al tuo caso d'uso.

Google Cloud NetApp Volumes Archiviazione basata su file con NFSv3, NFSv4.1 o SMB.
Altre opzioni Consulta: Riepilogo delle opzioni del file server.

Archiviazione di oggetti

I dati vengono archiviati come oggetti in una gerarchia piatta di bucket. A ogni oggetto viene assegnato un ID univoco globale. Gli oggetti possono avere assegnati dal sistema e definiti dall'utente per aiutarti a organizzare per gestire i dati. Le applicazioni accedono ai dati facendo riferimento agli ID oggetto, tramite le API REST o le librerie client. L'archiviazione di oggetti è simile SAN on-premise in termini di capacità di scalabilità, ma è più facile meno costoso.

Cloud Storage offre costi contenuti, elevata durabilità e nessun limite e archiviazione di oggetti per diversi tipi di dati. I dati archiviati È possibile accedere a Cloud Storage ovunque, all'interno al di fuori di Google Cloud. La ridondanza facoltativa tra le regioni offre la massima affidabilità. Puoi selezionare una classe di archiviazione adatta i requisiti di conservazione dei dati e frequenza di accesso.

Analisi comparata

La tabella seguente fornisce un'analisi comparativa delle funzionalità chiave di archiviazione di Google Cloud.

Persistent Disk Hyperdisk SSD locale Filestore Google Cloud NetApp Volumes Cloud Storage
Capacità

Da 10 GiB a 64 TiB per disco

257 TiB per VM

Da 4 GiB a 64 TiB per disco

512 TiB per VM

375 GiB per disco

12 TiB per VM

1-100 TiB per istanza Filestore (il valore minimo e massimo di archiviazione e gli incrementi di scalabilità variano livello di servizio)

2-500 TiB per pool di archiviazione

Da 100 GiB a 100 TiB per volume

Nessun limite inferiore o superiore
Scalabilità
  • Scale up
  • Aggiungi e rimuovi dischi
  • Scala automaticamente utilizzando gruppi di istanze gestite
Scala prestazioni e capacità in modo dinamico Non scalabile
  • Livello base: scale up
  • Livelli di zona e regionali: scale up e scale down
Scale up e scale down Scalabilità automatica in base all'utilizzo
Condivisione
Condivisione limitata
    .
  • Sola lettura: più VM
  • Multiwriter: 2 VM
Non condivisibile Non condivisibile Montabile su più VM di Compute Engine, client remoti e Cluster GKE Montabile su più VM di Compute Engine e GKE cluster
  • Leggi e scrivi ovunque
  • Si integra con Cloud CDN e con CDN di terze parti
Chiavi di crittografia
Uno dei seguenti:
  • Chiavi di proprietà di Google e gestite da Google
  • chiavi gestite dal cliente
  • chiavi fornite dal cliente
Uno dei seguenti:
  • Chiavi di proprietà di Google e gestite da Google
  • chiavi gestite dal cliente
  • chiavi fornite dal cliente
Chiavi di proprietà di Google e gestite da Google
  • Chiavi di proprietà di Google e gestite da Google (tutti i livelli di servizio)
  • Chiavi gestite dal cliente (livelli di zona e di regione)
Uno dei seguenti:
  • Chiavi di proprietà di Google e gestite da Google
  • chiavi gestite dal cliente
Uno dei seguenti:
  • Chiavi di proprietà di Google e gestite da Google
  • chiavi gestite dal cliente
  • chiavi fornite dal cliente
Persistenza
Durata del disco Durata del disco Temporaneo (i dati rimangono attivi fino all'arresto o all'eliminazione della VM) Durata dell'istanza Filestore Durata del volume Durata del bucket
Disponibilità
A livello di zona A livello di zona
  • Disponibilità a livello regionale per istanze di livello regionale, a livello di zona disponibilità per le istanze di livello base e di zona
  • Istantanee per istanze di livello a livello di zona e di regione
  • Backup
Rendimento
Scalare lineare prestazioni elevate in base alle dimensioni del disco e al numero di CPU Scalabilità dinamica, archiviazione permanente ad alte prestazioni Archiviazione scratch ad alte prestazioni

Prestazioni scalabili

Le aspettative dipendono dal livello di servizio

Scalabilità automatica delle velocità di lettura e scrittura e ridistribuzione del carico dinamico
Gestione
Formatta e monta manualmente Formatta e monta manualmente Formattazione, stripe e montaggio manuale Completamente gestito Completamente gestito Completamente gestito
Carichi di lavoro
  • Applicazioni ad alta intensità di IOPS o sensibili alla latenza
  • Database
  • Spazio di archiviazione condiviso di sola lettura
  • Backup rapidi e durevoli delle VM
  • Carichi di lavoro che richiedono prestazioni elevate
  • Analisi dello scale out
  • Database ottimizzati per Flash
  • Hot-cache per l'analisi
  • Disco temporaneo
  • File system on-premise "lift and shift"
  • File di configurazione condivisi
  • Strumenti e utilità comuni
  • Log centralizzati
  • File system on-premise "lift and shift"
  • File di configurazione condivisi
  • Strumenti e utilità comuni
  • Log centralizzati
  • Carichi di lavoro Windows
  • Video in streaming
  • Raccolta di asset multimediali
  • Data lake a velocità effettiva elevata
  • Backup e archivi
  • Contenuti long-tail

Scegli un'opzione di archiviazione

La scelta di un'opzione di archiviazione è suddivisa in due parti:

  • Decidere i servizi di archiviazione necessari.
  • Scegliere le funzionalità e le opzioni di progettazione richieste in un determinato servizio.

    Esempi di funzionalità di progettazione e funzionalità specifiche per i servizi

    Persistent Disk

    • Regione e zona del deployment
    • Replica a livello di regione
    • Tipo, dimensione e IOPS del disco (per disco permanente con carico estremo)
    • Chiavi di crittografia: di proprietà di Google e di Google, del cliente o fornito dal cliente
    • Pianificazione snapshot

    Hyperdisk

    • Zona di deployment
    • Tipo, dimensione e IOPS del disco
    • Chiavi di crittografia: di proprietà di Google e di Google, del cliente o fornito dal cliente
    • Pianificazione snapshot

    Filestore

    • Regione e zona del deployment
    • Livello istanza
    • Capacità
    • Intervallo IP: allocato automaticamente o personalizzato
    • Controllo degli accessi

    NetApp Volumes

    • Regione di deployment
    • Livello di servizio per il pool di archiviazione
    • Capacità di pool e volume
    • Protocollo volume
    • Regole di esportazione del volume

    Cloud Storage

    • Località: più regioni, due regioni, una singola regione
    • Classe di archiviazione: Standard, Nearline Coldline, Archive
    • Controllo dell'accesso: uniforme o granulare
    • Chiavi di crittografia: di proprietà di Google e di Google, del cliente o fornito dal cliente
    • Criterio di conservazione

Suggerimenti sullo spazio di archiviazione

Utilizza i seguenti suggerimenti come punto di partenza per scegliere lo spazio di archiviazione e le funzionalità che soddisfano i tuoi requisiti. Questi consigli sono presentati anche come albero decisionale più avanti in questo documento.

  • Per le applicazioni che richiedono accesso basato su file, scegli un file adatto di archiviazione dati in base ai requisiti per il protocollo di accesso, la disponibilità e le prestazioni.

    Protocollo di accesso Consiglio
    NFSv3
    • Se hai bisogno di una disponibilità a livello regionale, usa Filestore Regionale.
    • Se la disponibilità a livello di zona è sufficiente, ma hai bisogno di prestazioni elevate, utilizza Zonale Filestore.
    • Altrimenti, usa Filestore Basic NetApp Volumes.

    Per ulteriori informazioni sulle differenze tra Filestore i livelli di servizio, vedi Livelli di servizio.

    SMB o NFSv4.1 Usa NetApp Volumes.

  • Per i carichi di lavoro che richiedono spazio di archiviazione principale con prestazioni elevate, SSD locali, dischi permanenti o Hyperdisk a seconda in base ai tuoi requisiti.

    Requisito Consiglio
    Cache o disco temporaneo rapido

    Utilizza dischi SSD locali (temporanei).

    IOPS sequenziali Utilizza dischi permanenti con il tipo di disco pd-standard.
    Carico di lavoro ad alta intensità di IOPS Utilizza dischi permanenti con il tipo di disco pd-extreme o pd-ssd.
    Equilibrio tra rendimento e costi Utilizza dischi permanenti con il tipo di disco pd-balanced.
    Prestazioni e capacità scalabili in modo dinamico

    Usa Hyperdisk.

    Scegli un tipo di Hyperdisk adatto:

    • La velocità effettiva Hyperdisk è consigliata per lo scale out analisi, unità di dati per app sensibili ai costi e cold storage.
    • Hyperdisk Extreme è consigliato per carichi di lavoro che richiedono un I/O elevato, ad esempio database ad alte prestazioni.

    • A seconda dei requisiti di ridondanza, scegli tra a livello di zona e i dischi permanenti a livello di regione.
      Requisito Consiglio
      Ridondanza all'interno di una singola zona in una regione Usa dischi permanenti o hyperdisk a livello di zona.
      Ridondanza in più zone all'interno di una regione Usa dischi permanenti a livello di regione.
      Per un'analisi comparativa dettagliata, consulta Opzioni Persistent Disk
  • Per l'archiviazione su scala illimitata e disponibile a livello globale, usa di archiviazione ideale in Cloud Storage.

    In base alla frequenza di accesso ai dati e alla durata dell'archiviazione, scegli un'opzione appropriata per la classe Cloud Storage.

    Requisito Consiglio>
    La frequenza di accesso varia oppure il periodo di conservazione dei dati non è noto o non prevedibili. Utilizza la funzionalità Autoclass per trasferire automaticamente gli oggetti di un bucket all'archiviazione appropriata in base al modello di accesso di ciascun oggetto.
    Archiviazione di dati a cui si accede di frequente, tra cui analisi a velocità effettiva elevata, data lake, siti web, video in streaming e app mobile.

    Utilizza la Classe di archiviazione Standard.

    Per memorizzare nella cache i dati a cui si accede di frequente e pubblicarli da posizioni vicini ai client, usano Cloud CDN.

    Archiviazione a basso costo per dati a cui si accede raramente che possono essere archiviati almeno 30 giorni (ad esempio, backup e contenuti multimediali long-tail). Utilizza la Classe di archiviazione Nearline.
    Archiviazione a basso costo per dati a cui si accede raramente che possono essere archiviati almeno 90 giorni (ad esempio, ripristino di emergenza). Utilizza la Coldline.
    Archiviazione al minor costo per i dati a cui si accede raramente che possono essere archiviati per almeno 365 giorni, inclusi gli archivi normativi. Utilizza la Classe di archiviazione Archive.

    Per un'analisi comparativa dettagliata, consulta Classi Cloud Storage.

Opzioni di trasferimento dati

Dopo aver scelto i servizi di archiviazione Google Cloud appropriati, per eseguire il deployment per eseguire carichi di lavoro, devi trasferire i dati in Google Cloud. I dati da trasferire potrebbero esistere on-premise o su altre piattaforme cloud.

Per trasferire dati in Google Cloud, puoi utilizzare i seguenti metodi:

  • Trasferire dati online utilizzando Storage Transfer Service: Automatizza il trasferimento di grandi quantità di dati tra l'archiviazione di oggetti e file quali Cloud Storage, Amazon S3, servizi di archiviazione di Azure, e le origini dati on-premise.
  • Trasferisci i dati offline utilizzando Transfer Appliance: Trasferisci e carica grandi quantità di dati offline su Google Cloud in situazioni in cui la connettività di rete e la larghezza di banda non sono disponibili, sono limitate o costoso.
  • Carica dati in Cloud Storage: carica i dati online su nei bucket Cloud Storage utilizzando la console Google Cloud gcloud CLI, API Cloud Storage o librerie client.

Quando scegli un metodo di trasferimento dei dati, considera fattori quali dimensioni dei dati, limiti di tempo, disponibilità della larghezza di banda, obiettivi di costo e requisiti di sicurezza e conformità. Per saperne di più sulla pianificazione e l'implementazione dei trasferimenti di dati a Google Cloud, consulta Eseguire la migrazione a Google Cloud: trasferire set di dati di grandi dimensioni.

Albero decisionale opzioni di archiviazione

Il seguente diagramma ad albero decisionale ti guida in Google Cloud dei suggerimenti sullo spazio di archiviazione discussi in precedenza:

Visualizza un'immagine più grande

Albero decisionale per selezionare una strategia di archiviazione.

Passaggi successivi

Collaboratori

Autore: Kumar Dhanagopal | Sviluppatore di soluzioni cross-product

Altri collaboratori: