Scegli tra archiviazione SSD e HDD
Quando crei un'istanza Bigtable, scegli se i relativi cluster archiviano i dati su unità a stato solido (SSD) o dischi rigidi (HDD):
- L'archiviazione SSD è la scelta più efficiente e conveniente per la maggior parte dei casi d'uso.
- L'archiviazione HDD è talvolta appropriata per set di dati di grandi dimensioni che non sono sensibili alla latenza o a cui si accede raramente.
Indipendentemente dal tipo di archiviazione che scegli, i tuoi dati vengono archiviati in un file system replicato distribuito che si estende su molte unità fisiche.
Le linee guida in questa pagina possono aiutarti a scegliere tra SSD e HDD.
In caso di dubbi, scegli l'archiviazione SSD
Esistono diversi motivi per cui in genere è preferibile utilizzare l'archiviazione SSD per il cluster Bigtable:
- L'SSD è molto più veloce e ha prestazioni più prevedibili rispetto all'HDD. In un cluster Bigtable, l'archiviazione SSD offre latenze significativamente inferiori per letture e scritture rispetto all'archiviazione HDD.
- La velocità effettiva HDD è molto più limitata rispetto a quella SSD. In un cluster che usa l'archiviazione HDD, è possibile raggiungere la velocità effettiva massima prima che l'utilizzo della CPU raggiunga il 100%, situazione che puoi monitorare con la metrica carico del disco. Per aumentare la velocità effettiva, è necessario aggiungere più nodi, ma il costo dei nodi aggiuntivi potrebbe superare i risparmi derivanti dall'utilizzo dell'archiviazione HDD. L'archiviazione SSD non ha questa limitazione, poiché offre una velocità effettiva molto maggiore per nodo: in genere, un cluster che utilizza l'archiviazione SSD raggiunge la velocità effettiva massima solo quando utilizza tutta la CPU e la memoria disponibili.
- Le letture delle singole righe su HDD sono molto lente. A causa del tempo di ricerca del disco, l'archiviazione HDD supporta solo il 5% delle righe lette al secondo. Tuttavia, le scansioni su più righe di grandi dimensioni non subiscono l'impatto negativo.
- Il risparmio sui costi dell'HDD è minimo rispetto al costo dei nodi nel cluster Bigtable, a meno che non si stia archiviando grandi quantità di dati. Per questo motivo, come regola generale, non dovresti considerare l'utilizzo dell'archiviazione HDD, a meno che tu non stia archiviando almeno 10 TB di dati e il tuo carico di lavoro non sia sensibile alla latenza.
Un potenziale svantaggio dell'archiviazione SSD è che richiede più nodi nei cluster in base alla quantità di dati archiviati. In pratica, tuttavia, potresti aver bisogno di quei nodi aggiuntivi in modo che i tuoi cluster possano tenere il passo con il traffico in entrata, non solo per supportare la quantità di dati che stai archiviando.
Casi d'uso dell'archiviazione HDD
L'archiviazione HDD è adatta per casi d'uso che soddisfano tutti i seguenti criteri:
- Prevedi di archiviare almeno 10 TB di dati.
- Non utilizzerai questi dati per supportare un'applicazione rivolta agli utenti o sensibile alla latenza.
Il carico di lavoro rientra in una delle seguenti categorie:
- Carichi di lavoro in batch con scansioni e scritture e non più di letture casuali occasionali di un numero ridotto di righe o letture di punti.
- Archiviazione dei dati, che prevede la scrittura di grandi quantità di dati e la loro lettura raramente.
Ad esempio, se prevedi di archiviare dati storici estesi per un numero elevato di dispositivi di rilevamento remoto e quindi di utilizzarli per generare report giornalieri, il risparmio sui costi dell'archiviazione HDD potrebbe giustificare un compromesso in termini di prestazioni. D'altra parte, se prevedi di utilizzare i dati per visualizzare una dashboard in tempo reale, probabilmente non ha senso utilizzare l'archiviazione HDD: in questo caso le letture sarebbero molto più frequenti e le letture che non sono scansioni sono molto più lente con l'archiviazione HDD.
Passare dall'archiviazione SSD a quella HDD e viceversa
Quando crei un'istanza Bigtable, la scelta dell'archiviazione SSD o HDD per l'istanza è definitiva. Non puoi utilizzare la console Google Cloud per modificare il tipo di archiviazione utilizzato per l'istanza.
Se vuoi modificare il tipo di archiviazione in cui è archiviata una tabella, utilizza la funzionalità di backup:
- Crea o pianifica di utilizzare un'istanza che utilizza il tipo di archiviazione che preferisci.
- Crea un backup della tabella.
- Ripristina dal backup a una nuova tabella nell'altra istanza.
Passaggi successivi
Crea un'istanza con spazio di archiviazione SSD o HDD.