Progetta una strategia di archiviazione ottimale per il tuo carico di lavoro cloud

Last reviewed 2024-10-22 UTC

Questa guida ti aiuta a valutare i requisiti di archiviazione del tuo carico di lavoro cloud, a comprendere le opzioni di archiviazione disponibili in Google Cloud e a progettare una strategia di archiviazione che offra un valore commerciale ottimale.

Per un riepilogo visivo dei principali consigli di progettazione, consulta il diagramma di albero decisionale.

Per informazioni sulla selezione dei servizi di archiviazione per i carichi di lavoro di AI e ML, consulta Progettare lo spazio di archiviazione per i carichi di lavoro di AI e ML in Google Cloud.

Panoramica del processo di progettazione

In qualità di architetto del cloud, quando pianifichi lo spazio di archiviazione per un carico di lavoro cloud, devi prima considerare le caratteristiche funzionali del carico di lavoro, i vincoli di sicurezza, i requisiti di resilienza, le aspettative di prestazioni e gli obiettivi di costo. Successivamente, devi esaminare i servizi e le funzionalità di archiviazione disponibili in Google Cloud. Poi, in base ai tuoi requisiti e alle opzioni disponibili, seleziona i servizi e le funzionalità di archiviazione di cui hai bisogno. Il seguente diagramma illustra questa procedura di progettazione in tre fasi:

Approccio graduale alla progettazione dello spazio di archiviazione per i carichi di lavoro cloud.

Definisci i tuoi requisiti

Utilizza i questionari in questa sezione per definire i requisiti di archiviazione principali del carico di lavoro che vuoi eseguire in Google Cloud.

Linee guida per la definizione dei requisiti di archiviazione

Quando rispondi ai questionari, tieni presenti le seguenti linee guida:

  • Definire i requisiti in modo granulare

    Ad esempio, se la tua applicazione richiede lo stoccaggio di file basato su Network File System (NFS), identifica la versione NFS richiesta.

  • Valutare i requisiti futuri

    Ad esempio, l'implementazione attuale potrebbe servire gli utenti dei paesi asiatici, ma potresti pianificare di espandere l'attività in altri continenti. In questo caso, tieni conto di eventuali requisiti normativi relativi allo spazio di archiviazione dei nuovi territori aziendali.

  • Valutare opportunità e requisiti specifici del cloud

    • Sfrutta le opportunità specifiche del cloud.

      Ad esempio, per ottimizzare il costo di archiviazione dei dati archiviati in Cloud Storage, puoi controllare la durata dell'archiviazione utilizzando i criteri di conservazione dei dati e le configurazioni del ciclo di vita.

    • Considera i requisiti specifici del cloud.

      Ad esempio, i dati on-premise potrebbero esistere in un unico data center e potresti dover replicare i dati di cui è stata eseguita la migrazione in due località Google Cloud per la ridondanza.

Questionari

I questionari che seguono non sono elenchi di controllo esaustivi per la pianificazione. Utilizzale come punto di partenza per analizzare sistematicamente tutti i requisiti di archiviazione del carico di lavoro che vuoi implementare in Google Cloud.

Valuta le caratteristiche del carico di lavoro

  • Di che tipo di dati hai bisogno di archiviare?

    Esempi

    • Contenuti di siti web statici
    • Backup e archivi per il ripristino di emergenza
    • Audit log per la conformità
    • Oggetti di dati di grandi dimensioni scaricati direttamente dagli utenti
    • Dati transazionali
    • Dati non strutturati ed eterogenei

  • Quanta capacità ti serve? Tieni conto dei tuoi requisiti attuali e futuri.

  • La capacità deve essere scalata automaticamente in base all'utilizzo?

  • Quali sono i requisiti di accesso? Ad esempio, i dati devono essere accessibili dall'esterno di Google Cloud?

  • Quali sono i pattern di lettura/scrittura previsti?

    Esempi

    • Scritture e letture frequenti
    • Scritture frequenti, ma letture occasionali
    • Scritture e letture occasionali
    • Scritture occasionali, ma letture frequenti

  • Il carico di lavoro richiede l'accesso basato su file, ad esempio utilizzando NFS?

  • Più client devono essere in grado di leggere o scrivere dati contemporaneamente?

Identifica i vincoli di sicurezza

  • Quali sono i tuoi requisiti di crittografia dei dati? Ad esempio, hai bisogno di utilizzare chiavi che controlli?

  • Esistono requisiti di residenza dei dati?

Definisci i requisiti di resilienza dei dati

  • Il tuo workload ha bisogno di spazio di lavoro o memorizzazione nella cache a bassa latenza?
  • Devi replicare i dati nel cloud per la ridondanza?
  • Hai bisogno di una coerenza di lettura/scrittura rigorosa per i set di dati replicati?

Impostare le aspettative di rendimento

  • Qual è la frequenza di I/O richiesta?

  • Quali livelli di throughput in lettura e scrittura sono necessari per la tua applicazione?

  • Per quali ambienti hai bisogno di spazio di archiviazione? Per un determinato carico di lavoro, potresti avere bisogno di uno spazio di archiviazione ad alte prestazioni per l'ambiente di produzione, ma potresti scegliere un'opzione con prestazioni inferiori per gli ambienti non di produzione.

Esamina le opzioni di archiviazione

Google Cloud offre servizi di archiviazione per tutti i principali formati di archiviazione: blocchi, file e oggetti. Esamina e valuta le funzionalità, le opzioni di design e i vantaggi relativi dei servizi disponibili per ogni formato di archiviazione.

Panoramica

Archiviazione a blocchi

I dati archiviati nell'archiviazione a blocchi sono suddivisi in blocchi, ognuno memorizzato come blocco separato con un indirizzo univoco. Le applicazioni accedono ai dati facendo riferimento agli indirizzi dei blocchi appropriati. L'archiviazione a blocchi è ottimizzata per carichi di lavoro con un numero elevato di operazioni in IOPS, come l'elaborazione delle transazioni. È simile alle SAN (Storage Area Network) on-premise e ai sistemi DAS (Directly Attached Storage).

Le opzioni di archiviazione a blocchi in Google Cloud fanno parte del servizio Compute Engine.

Opzione Panoramica
Persistent Disk Unità disco rigido (HDD) e unità a stato solido (SSD) dedicate per applicazioni aziendali e di database di cui è stato eseguito il deployment su VM Compute Engine e cluster Google Kubernetes Engine (GKE).
Hyperdisk di Google Cloud Archiviazione di rete rapida e ridondante per le VM di Compute Engine, con prestazioni configurabili e volumi ridimensionabili in modo dinamico.
SSD locale Archiviazione a blocchi temporanea collegata in locale per applicazioni ad alte prestazioni.

Archiviazione di file

I dati sono organizzati e rappresentati in una gerarchia di file che vengono archiviati in cartelle, in modo simile al NAS (Network Attached Storage) on-premise. I file system possono essere montati sui client utilizzando protocolli come NFS e Server Message Block (SMB). Le applicazioni accedono ai dati utilizzando il nome file e il percorso della directory pertinenti.

Google Cloud offre una gamma di soluzioni completamente gestite e di terze parti per l'archiviazione dei file.

Soluzione Panoramica
Filestore

Archiviazione basata su file che utilizza file server NFS per VM Compute Engine e cluster Google Kubernetes Engine.

Puoi scegliere un livello di servizio (base, zonale o regionale) adatto al tuo caso d'uso.

Parallelstore

File system parallelo a bassa latenza per AI, computing ad alte prestazioni (HPC) e applicazioni che richiedono un uso intensivo dei dati.

NetApp Volumes

Archiviazione basata su file che utilizza NFS o SMB.

Puoi scegliere un livello di servizio (Flex, Standard, Premium o Extreme) adatto al tuo caso d'uso.

Altre opzioni Consulta Riepilogo delle opzioni del file server.

Archiviazione di oggetti

I dati vengono archiviati come oggetti in una gerarchia piatta di bucket. A ogni oggetto viene assegnato un ID univoco a livello globale. Gli oggetti possono avere metadati assegnati dal sistema e definiti dall'utente per aiutarti a organizzare e gestire i dati. Le applicazioni accedono ai dati facendo riferimento agli ID oggetto, utilizzando API REST o librerie client.

Cloud Storage fornisce archiviazione di oggetti a basso costo, altamente durevole e senza limiti per diversi tipi di dati. Puoi accedere ai dati archiviati in Cloud Storage da qualsiasi luogo, all'interno e all'esterno di Google Cloud. La ridondanza facoltativa tra regioni offre la massima affidabilità. Puoi selezionare una classe di archiviazione adatta ai tuoi requisiti di conservazione dei dati e frequenza di accesso.

Analisi comparativa

La tabella seguente elenca le funzionalità principali dei servizi di archiviazione in Google Cloud.

Persistent Disk Hyperdisk SSD locale Filestore Parallelstore NetApp Volumes Cloud Storage
Capacità

Da 10 GiB a 64 TiB per disco

257 TiB per VM

Da 4 GiB a 64 TiB per disco

512 TiB per VM

Da 10 TiB a 1 PiB per pool di archiviazione

375 GiB per disco

12 TiB per VM

1-100 TiB per istanza 12-100 TiB

Da 1 TiB a 10 PiB per pool di archiviazione

Da 1 GiB a 100 TiB per volume

Nessun limite minimo o massimo
Scalabilità
Scale up Non scalabile
  • Di base: esegui lo scale up
  • A livello di zona e di regione: scale up e scale down
Non scalabile Scale up e scale down Scalabilità automatica in base all'utilizzo
Condivisione
Supportato Supportato Non condivisibile Montabile su più VM Compute Engine, client remoti e cluster GKE Montabili su più VM Compute Engine e cluster GKE. Montabile su più VM Compute Engine e cluster GKE
  • Lettura/scrittura da qualsiasi luogo
  • Si integra con Cloud CDN e CDN di terze parti
Opzioni di chiave di crittografia
  • Chiavi di proprietà di Google e gestite da Google
  • Gestita dal cliente
  • Fornita dal cliente
  • Chiavi di proprietà di Google e gestite da Google
  • Gestita dal cliente
  • Fornita dal cliente
Chiavi di proprietà di Google e gestite da Google
  • Chiavi di proprietà di Google e gestite da Google
  • Gestita dal cliente (livelli zonale e regionale)
Chiavi di proprietà di Google e gestite da Google
  • Chiavi di proprietà di Google e gestite da Google
  • Gestita dal cliente
  • Chiavi di proprietà di Google e gestite da Google
  • Gestita dal cliente
  • Fornita dal cliente
Persistenza
Durata del disco Durata del disco Temporanea (i dati vengono persi quando la VM viene arrestata o eliminata) Durata dell'istanza Filestore Effimero (i dati vengono persi quando l'istanza viene eliminata) Durata del volume Durata del bucket
Disponibilità
  • A livello di zona
  • Clonazione dei dischi
  • A livello di zona
    • A livello di regione o di zona in base al livello
    • Istantanee per i livelli zonale e regionale
    • Backup
    A livello di zona
    Prestazioni
    Scalabilità lineare in base alle dimensioni del disco e al numero di CPU Archiviazione permanente con scaling dinamico Spazio di archiviazione scratch ad alte prestazioni Scalabilità lineare con capacità di provisioning

    Prestazioni scalabili

    Le aspettative dipendono dal livello di servizio

    Scalabilità automatica delle frequenze di lettura/scrittura e ridistribuzione dinamica del carico
    Gestione
    Formattazione e montaggio manuale Formattazione e montaggio manuale Formattazione, suddivisione in strisce e montaggio manuali Completamente gestito Completamente gestito Completamente gestito Completamente gestito

    La tabella seguente elenca i tipi di carichi di lavoro per i quali è appropriata ciascuna opzione di archiviazione Google Cloud:

    Opzione di archiviazione Tipi di workload
    Persistent Disk
    • Applicazioni che richiedono un elevato numero di operazioni IOPS o sensibili alla latenza
    • Database
    • Spazio di archiviazione di sola lettura condiviso
    • Backup rapidi e durevoli delle VM
    Hyperdisk
    • Carichi di lavoro ad alte prestazioni
    • Dati e analisi di scale out
    SSD locale
    • Database ottimizzati per Flash
    • Memorizzazione nella cache ad accesso frequente per l'analisi
    • Disco temporaneo
    Filestore
    • Migrazione lift and shift dei file system on-premise
    • File di configurazione condivisi
    • Strumenti e utilità comuni
    • Log centralizzati
    Parallelstore
    • Carichi di lavoro di AI e ML
    • HPC (computing ad alte prestazioni)
    NetApp Volumes
    • File system on-premise lift and shift
    • File di configurazione condivisi
    • Strumenti e utilità comuni
    • Log centralizzati
    • Carichi di lavoro Windows
    Cloud Storage
    • Video in streaming
    • Raccolte di asset multimediali
    • Data lake ad alta velocità effettiva
    • Backup e archivi
    • Contenuti long-tail

    Scegli un'opzione di archiviazione

    La selezione di un'opzione di archiviazione prevede due passaggi:

    • Decidere quali servizi di archiviazione ti servono.
    • Scegliere le funzionalità e le opzioni di design richieste in un determinato servizio.

      Esempi di funzionalità e opzioni di design specifiche per il servizio

      Persistent Disk

      • Regione e zona di deployment
      • Replica regionale
      • Tipo, dimensioni e IOPS del disco (per il disco permanente con carico estremo)
      • Chiavi di crittografia: di proprietà di Google e gestite da Google, gestite dal cliente o fornite dal cliente
      • Pianificazione snapshot

      Hyperdisk

      • Zona di deployment
      • Tipo di disco, dimensioni, velocità effettiva (per Hyperdisk Throughput) e IOPS (per Hyperdisk Extreme)
      • Chiavi di crittografia: di proprietà di Google e gestite da Google, gestite dal cliente o fornite dal cliente
      • Pianificazione snapshot

      Filestore

      • Regione e zona di deployment
      • Livello istanza
      • Capacità
      • Intervallo IP: allocato automaticamente o personalizzato
      • Controllo degli accessi

      NetApp Volumes

      • Regione di deployment
      • Livello di servizio per il pool di archiviazione
      • Capacità del pool e del volume
      • Protocollo del volume
      • Regole di esportazione dei volumi

      Cloud Storage

      • Località: multiregione, due regioni, singola regione
      • Classe di archiviazione: Standard, Nearline, Coldline, Archive
      • Controllo dell'accesso: uniforme o granulare
      • Chiavi di crittografia: di proprietà di Google e gestite da Google, gestite dal cliente o fornite dal cliente
      • Criterio di conservazione

    Consigli per lo spazio di archiviazione

    Utilizza i seguenti consigli come punto di partenza per scegliere i servizi e le funzionalità di archiviazione che soddisfano i tuoi requisiti. Per indicazioni specifiche per i workload di AI e ML, consulta Progettare lo spazio di archiviazione per i workload di AI e ML in Google Cloud.

    I consigli generali per lo spazio di archiviazione sono inoltre presentati come albero decisionale più avanti in questo documento.

    • Per le applicazioni che richiedono un file system parallelo, utilizza Parallelstore.

    • Per le applicazioni che richiedono accesso basato su file, scegli un servizio di archiviazione file adatto in base ai tuoi requisiti per protocollo di accesso, disponibilità e prestazioni.

      Protocollo di accesso Consiglio
      NFS
      • Se hai bisogno di disponibilità a livello di regione e prestazioni elevate che si adattano alla capacità, utilizza Filestore Regional.
      • Se la disponibilità a livello di zona è sufficiente, ma hai bisogno di prestazioni elevate che si adattino alla capacità, utilizza Filestore Zonal o NetApp Volumes Premium o Extreme.
      • In caso contrario, utilizza Filestore Basic o NetApp Volumes.

      Per informazioni sulle differenze tra i livelli di servizio Filestore, consulta livelli di servizio.

      PMI Utilizza NetApp Volumes.

    • Per i carichi di lavoro che richiedono un'archiviazione principale con prestazioni elevate, utilizza SSD locale, Persistent Disk o Hyperdisk a seconda delle tue esigenze.

      Requisito Consiglio
      Disco temporaneo rapido o cache rapida

      Utilizza dischi SSD locali (temporanei).

      IOPS sequenziali Utilizza i dischi permanenti con il tipo di disco pd-standard.
      Carico di lavoro ad alta intensità di IOPS Utilizza i dischi permanenti con il tipo di disco pd-extreme o pd-ssd.
      Equilibrio tra prestazioni e costi Utilizza i dischi permanenti con il tipo di disco pd-balanced.
      Scala le prestazioni e la capacità in modo dinamico

      Utilizza Hyperdisk.

      Scegli un tipo di Hyperdisk adatto:

      • Hyperdisk Balanced è consigliato per i carichi di lavoro di uso generico e le applicazioni altamente disponibili che richiedono l'accesso in scrittura condiviso.
      • Hyperdisk Extreme è consigliato per i carichi di lavoro che necessitano di un'I/O elevata, ad esempio i database ad alte prestazioni.
      • La velocità effettiva Hyperdisk è consigliata per le analisi con scale out, le unità di dati per le app sensibili ai costi e per lo spazio di archiviazione a freddo.
      • Hyperdisk ML è consigliato per i carichi di lavoro di ML che richiedono un'elevata velocità effettiva per più VM in modalità di sola lettura.

      Per ulteriori informazioni, consulta Informazioni su HyperDisk di Google Cloud.

      • A seconda dei requisiti di ridondanza, scegli tra i dischi zonali e regionali.
        Requisito Consiglio
        Ridondanza all'interno di una singola zona in una regione Utilizza dischi permanenti o Hyperdisk a livello di zona.
        Ridondanza in più zone all'interno di una regione Utilizza i dischi permanenti regionali.
        Per un'analisi comparativa dettagliata, consulta Opzioni di Persistent Disk.
    • Per uno spazio di archiviazione scalabile e disponibile a livello globale, utilizza Cloud Storage.

      A seconda della frequenza di accesso ai dati e della durata dell'archiviazione, scegli una classe Cloud Storage appropriata.

      Requisito Consiglio>
      La frequenza di accesso varia o il periodo di conservazione dei dati è sconosciuto o non prevedibile. Utilizza la funzionalità Autoclass per eseguire automaticamente la transizione degli oggetti in un bucket alle classi di archiviazione appropriate in base al pattern di accesso di ciascun oggetto.
      Spazio di archiviazione per i dati a cui si accede di frequente, tra cui analisi ad alta produttività, data lake, siti web, video in streaming e app mobile.

      Utilizza la classe di archiviazione Standard.

      Per memorizzare nella cache i dati a cui si accede di frequente e servirli da località vicine ai client, utilizza Cloud CDN.

      Archiviazione a basso costo per dati a cui si accede con poca frequenza che possono essere archiviati per almeno 30 giorni (ad esempio backup e contenuti multimediali long-tail). Utilizza la classe di archiviazione Nearline.
      Archiviazione a basso costo per dati a cui si accede con poca frequenza che possono essere archiviati per almeno 90 giorni (ad esempio per il ripristino di emergenza). Utilizza la classe di archiviazione Coldline.
      Spazio di archiviazione a costo più basso per i dati a cui si accede di rado che possono essere archiviati per almeno 365 giorni, inclusi gli archivi normativi. Utilizza la classe di archiviazione Archive.

      Per un'analisi comparativa dettagliata, consulta Classi di Cloud Storage.

    Opzioni di trasferimento dei dati

    Dopo aver scelto i servizi di archiviazione Google Cloud appropriati, per eseguire il deployment e gestire i carichi di lavoro, devi trasferire i dati su Google Cloud. I dati che devi trasferire potrebbero trovarsi on-premise o su altre piattaforme cloud.

    Per trasferire i dati in Google Cloud puoi utilizzare i seguenti metodi:

    • Trasferisci i dati online utilizzando Storage Transfer Service: Automatizza il trasferimento di grandi quantità di dati tra sistemi di archiviazione di oggetti e file, tra cui Cloud Storage, Amazon S3, servizi di archiviazione Azure e origini dati on-premise.
    • Trasferisci i dati offline utilizzando Transfer Appliance: trasferisci e carica grandi quantità di dati offline su Google Cloud in situazioni in cui la connettività di rete e la larghezza di banda non sono disponibili, sono limitate o sono costose.
    • Carica i dati su Cloud Storage: carica i dati online nei bucket Cloud Storage utilizzando la console Google Cloud, gcloud CLI, le API Cloud Storage o le librerie client.

    Quando scegli un metodo di trasferimento dei dati, tieni conto di fattori quali dimensioni dei dati, vincoli di tempo, disponibilità della larghezza di banda, obiettivi di costo e requisiti di sicurezza e conformità. Per informazioni sulla pianificazione e sull'implementazione dei trasferimenti di dati in Google Cloud, consulta Eseguire la migrazione a Google Cloud: trasferire i set di dati di grandi dimensioni.

    Albero decisionale delle opzioni di archiviazione

    Il seguente diagramma di albero decisionale ti guida nei consigli per lo archiviazione su Google Cloud discussi in precedenza. Per indicazioni specifiche per i carichi di lavoro di AI e ML, consulta Progettare lo spazio di archiviazione per i carichi di lavoro di AI e ML in Google Cloud.

    Visualizzare un'immagine più grande

    Albero decisionale per selezionare una strategia di archiviazione.

    Passaggi successivi

    Collaboratori

    Autore: Kumar Dhanagopal | Sviluppatore di soluzioni cross-product

    Altri collaboratori: