Scegliere tra archiviazione SSD e HDD

Quando crei un'istanza Bigtable, scegli se i relativi cluster devono memorizzare i dati su unità a stato solido (SSD) o unità disco rigido (HDD):

  • Lo spazio di archiviazione SSD è la scelta più efficiente e conveniente per la maggior parte dei casi d'uso.
  • A volte lo spazio di archiviazione su HDD è appropriato per set di dati di grandi dimensioni che non sono sensibili alla latenza o a cui si accede raramente.

Indipendentemente dal tipo di archiviazione scelto, i dati vengono archiviati su un file system distribuito e replicato che si estende su molti dischi fisici.

Le linee guida riportate in questa pagina possono aiutarti a scegliere tra SSD e HDD.

In caso di dubbi, scegli l'archiviazione SSD

Esistono diversi motivi per cui in genere è meglio utilizzare lo spazio di archiviazione SSD per il tuo cluster Bigtable:

  • Le unità SSD sono notevolmente più veloci e hanno prestazioni più prevedibili rispetto alle unità HDD. In un cluster Bigtable, l'archiviazione SSD offre latenze notevolmente inferiori sia per le letture sia per le scritture rispetto all'archiviazione HDD.
  • La velocità effettiva dell'HDD è molto più limitata rispetto a quella dell'SSD. In un cluster che utilizza lo spazio di archiviazione HDD, è possibile raggiungere la velocità effettiva massima prima che l'utilizzo della CPU raggiunga il 100%, una situazione che puoi monitorare utilizzando la metrica carico del disco. Per aumentare il throughput, devi aggiungere altri nodi, ma il costo dei nodi aggiuntivi potrebbe superare i risparmi derivanti dall'utilizzo dello spazio di archiviazione HDD. Lo spazio di archiviazione SSD non ha questa limitazione, perché offre molto più throughput per nodo. In genere, un cluster che utilizza lo spazio di archiviazione SSD raggiunge il throughput massimo solo quando utilizza tutta la CPU e la memoria disponibili.
  • Le letture di singole righe su HDD sono molto lente. A causa del tempo di ricerca del disco, l'archiviazione HDD supporta solo il 5% delle righe lette al secondo dell'archiviazione SSD. Le scansioni con più righe di grandi dimensioni, invece, non sono interessate in modo così negativo.
  • I risparmi sui costi derivanti dall'utilizzo di HDD sono minimi rispetto al costo dei nodi nel tuo cluster Bigtable, a meno che tu non stia archiviando grandi quantità di dati. Per questo motivo, come regola generale, non dovresti prendere in considerazione l'utilizzo dell'archiviazione su HDD, a meno che tu non stia archiviando almeno 10 TB di dati e il tuo carico di lavoro non sia sensibile alla latenza.

Un potenziale svantaggio dello spazio di archiviazione SSD è che richiede più nodi nei cluster in base alla quantità di dati archiviati. In pratica, però, potresti aver bisogno di questi nodi aggiuntivi per consentire ai tuoi cluster di tenere il passo con il traffico in entrata, non solo per supportare la quantità di dati che stai archiviando.

Casi d'uso per lo spazio di archiviazione su HDD

Lo spazio di archiviazione su HDD è adatto per i casi d'uso che soddisfano tutti i seguenti criteri:

  • Prevedi di archiviare almeno 10 TB di dati.
  • Non utilizzerai i dati per supportare un'applicazione rivolta agli utenti o sensibile alla latenza.
  • Il tuo carico di lavoro rientra in una delle seguenti categorie:

    • Carichi di lavoro batch con letture e scritture e non più di letture random occasionali di un numero ridotto di righe o letture punto.
    • Archiviazione dei dati, in cui scrivi grandi quantità di dati e raramente li leggi.

Ad esempio, se prevedi di archiviare dati storici estesi per un numero elevato di dispositivi di rilevamento remoto e poi di utilizzarli per generare report giornalieri, il risparmio sui costi per lo spazio di archiviazione su HDD potrebbe giustificare il compromesso prestazionale. D'altra parte, se prevedi di utilizzare i dati per visualizzare una dashboard in tempo reale, probabilmente non ha senso utilizzare lo spazio di archiviazione su HDD: in questo caso le letture sarebbero molto più frequenti e le letture che non sono scansioni sono molto più lente con lo spazio di archiviazione su HDD.

Passare dallo spazio di archiviazione SSD a quello HDD e viceversa

Quando crei un'istanza Bigtable, la scelta dell'archiviazione su SSD o HDD per l'istanza è definitiva. Non puoi utilizzare la console Google Cloud per modificare il tipo di archiviazione utilizzato per l'istanza.

Se vuoi modificare il tipo di archiviazione su cui è archiviata una tabella, utilizza la funzionalità di backup:

  1. Crea o pianifica di utilizzare un'istanza che utilizzi il tipo di archiviazione che preferisci.
  2. Crea un backup della tabella.
  3. Ripristina dal backup in una nuova tabella nell'altra istanza.

Passaggi successivi

Crea un'istanza con archiviazione SSD o HDD.