Scegli tra archiviazione SSD e HDD

Quando crei un'istanza Bigtable, scegli se i relativi cluster archiviano i dati su unità a stato solido (SSD) o dischi rigidi (HDD):

  • L'archiviazione SSD è la scelta più efficiente e conveniente per la maggior parte dei casi d'uso.
  • L'archiviazione HDD è talvolta appropriata per set di dati di grandi dimensioni che non sono sensibili alla latenza o a cui si accede raramente.

Indipendentemente dal tipo di archiviazione che scegli, i tuoi dati vengono archiviati in un file system replicato distribuito che si estende su molte unità fisiche.

Le linee guida in questa pagina possono aiutarti a scegliere tra SSD e HDD.

In caso di dubbi, scegli l'archiviazione SSD

Esistono diversi motivi per cui in genere è preferibile utilizzare l'archiviazione SSD per il cluster Bigtable:

  • L'SSD è molto più veloce e ha prestazioni più prevedibili rispetto all'HDD. In un cluster Bigtable, l'archiviazione SSD offre latenze significativamente inferiori per letture e scritture rispetto all'archiviazione HDD.
  • La velocità effettiva HDD è molto più limitata rispetto a quella SSD. In un cluster che usa l'archiviazione HDD, è possibile raggiungere la velocità effettiva massima prima che l'utilizzo della CPU raggiunga il 100%, situazione che puoi monitorare con la metrica carico del disco. Per aumentare la velocità effettiva, è necessario aggiungere più nodi, ma il costo dei nodi aggiuntivi potrebbe superare i risparmi derivanti dall'utilizzo dell'archiviazione HDD. L'archiviazione SSD non ha questa limitazione, poiché offre una velocità effettiva molto maggiore per nodo: in genere, un cluster che utilizza l'archiviazione SSD raggiunge la velocità effettiva massima solo quando utilizza tutta la CPU e la memoria disponibili.
  • Le letture delle singole righe su HDD sono molto lente. A causa del tempo di ricerca del disco, l'archiviazione HDD supporta solo il 5% delle righe lette al secondo. Tuttavia, le scansioni su più righe di grandi dimensioni non subiscono l'impatto negativo.
  • Il risparmio sui costi dell'HDD è minimo rispetto al costo dei nodi nel cluster Bigtable, a meno che non si stia archiviando grandi quantità di dati. Per questo motivo, come regola generale, non dovresti considerare l'utilizzo dell'archiviazione HDD, a meno che tu non stia archiviando almeno 10 TB di dati e il tuo carico di lavoro non sia sensibile alla latenza.

Un potenziale svantaggio dell'archiviazione SSD è che richiede più nodi nei cluster in base alla quantità di dati archiviati. In pratica, tuttavia, potresti aver bisogno di quei nodi aggiuntivi in modo che i tuoi cluster possano tenere il passo con il traffico in entrata, non solo per supportare la quantità di dati che stai archiviando.

Casi d'uso dell'archiviazione HDD

L'archiviazione HDD è adatta per casi d'uso che soddisfano tutti i seguenti criteri:

  • Prevedi di archiviare almeno 10 TB di dati.
  • Non utilizzerai questi dati per supportare un'applicazione rivolta agli utenti o sensibile alla latenza.
  • Il carico di lavoro rientra in una delle seguenti categorie:

    • Carichi di lavoro in batch con scansioni e scritture e non più di letture casuali occasionali di un numero ridotto di righe o letture di punti.
    • Archiviazione dei dati, che prevede la scrittura di grandi quantità di dati e la loro lettura raramente.

Ad esempio, se prevedi di archiviare dati storici estesi per un numero elevato di dispositivi di rilevamento remoto e quindi di utilizzarli per generare report giornalieri, il risparmio sui costi dell'archiviazione HDD potrebbe giustificare un compromesso in termini di prestazioni. D'altra parte, se prevedi di utilizzare i dati per visualizzare una dashboard in tempo reale, probabilmente non ha senso utilizzare l'archiviazione HDD: in questo caso le letture sarebbero molto più frequenti e le letture che non sono scansioni sono molto più lente con l'archiviazione HDD.

Passare dall'archiviazione SSD a quella HDD e viceversa

Quando crei un'istanza Bigtable, la scelta dell'archiviazione SSD o HDD per l'istanza è definitiva. Non puoi utilizzare la console Google Cloud per modificare il tipo di archiviazione utilizzato per l'istanza.

Se vuoi modificare il tipo di archiviazione in cui è archiviata una tabella, utilizza la funzionalità di backup:

  1. Crea o pianifica di utilizzare un'istanza che utilizza il tipo di archiviazione che preferisci.
  2. Crea un backup della tabella.
  3. Ripristina dal backup a una nuova tabella nell'altra istanza.

Passaggi successivi

Crea un'istanza con spazio di archiviazione SSD o HDD.