Choisir entre le stockage SSD et HDD

Lorsque vous créez une instance Cloud Bigtable, vous devez choisir si ses clusters stockent les données sur des disques durs SSD ou HDD :

  • Le stockage SSD constitue le choix le plus efficace et le plus rentable dans la plupart des cas.
  • Le stockage HDD est parfois approprié pour de très grands ensembles de données (>10 To) non sensibles à la latence ou rarement utilisés.

Quel que soit le type de stockage que vous choisissez, vos données sont stockées sur un système de fichiers répliqués et distribués qui englobe de nombreux disques physiques.

Les consignes décrites sur cette page peuvent vous aider à choisir entre un stockage SSD et HDD.

En cas de doute, choisir le stockage SSD

En règle générale, il est recommandé d'utiliser le stockage SSD pour votre cluster Bigtable, et ce pour plusieurs raisons :

  • Les disques durs SSD sont nettement plus rapides et offrent des performances plus prévisibles que les disques durs HDD. Dans un cluster Bigtable, le stockage SSD présente des latences bien plus faibles pour les lectures et les écritures que le stockage HDD.
  • Le débit du disque dur HDD est beaucoup plus limité que celui du disque dur SSD. Dans un cluster qui utilise le stockage HDD, il est possible d'atteindre le débit maximal avant que l'utilisation du processeur n'atteigne 100 %, une situation que vous pouvez surveiller à l'aide de la métrique de charge du disque. Pour augmenter le débit, vous devez ajouter d'autres nœuds. En revanche, le coût des nœuds supplémentaires est susceptible de dépasser les économies que vous avez réalisées grâce à l'utilisation du stockage HDD. Cette limite ne s'applique pas au stockage SSD, car il offre beaucoup plus de débit par nœud. En règle générale, un cluster qui utilise le stockage SSD n'atteint un débit maximal que lorsqu'il utilise toute la capacité du processeur et de la mémoire disponible.
  • Les lectures de lignes individuelles sont très lentes sur un disque dur HDD. En raison du temps de recherche du disque, le stockage HDD n'accepte que 5 % du nombre de lignes de lecture par seconde du stockage SSD. Cependant, les analyses à grande échelle sur plusieurs lignes ne sont pas affectées de manière aussi défavorable.
  • Les économies réalisées grâce au stockage HDD sont minimes par rapport au coût des nœuds du cluster Bigtable, à moins que vous ne stockiez de très grandes quantités de données. En règle générale, nous vous déconseillons donc d'utiliser le stockage HDD, sauf si vous stockez au moins 10 To de données.

L'un des inconvénients potentiels du stockage SSD est qu'il nécessite des nœuds supplémentaires dans les clusters en fonction de la quantité de données que vous stockez. En pratique, vous aurez sans doute besoin de ces nœuds supplémentaires pour que les clusters puissent suivre le trafic entrant, et pas uniquement pour stocker vos données.

Cas d'utilisation du stockage HDD

Le stockage HDD convient aux cas d'utilisation qui respectent les critères suivants :

  • Vous prévoyez de stocker au moins 10 To de données.
  • Vous n'utilisez pas les données pour sauvegarder une application destinée aux utilisateurs ou sensible à la latence.
  • Votre charge de travail doit correspondre à l'une des catégories suivantes :

    • Charges de travail par lot avec des analyses et des écritures, et quelques lectures aléatoires occasionnelles d'un petit nombre de lignes ou de lectures de points.
    • Archivage des données vous permettant d'écrire de très grandes quantités de données rarement lues.

Par exemple, si vous envisagez de stocker des données d'historique complètes pour un grand nombre de périphériques de détection à distance, puis de les utiliser pour générer des rapports quotidiens, les économies de coûts liées au stockage HDD peuvent justifier le compromis de performances. Par ailleurs, si vous prévoyez d’utiliser les données pour afficher un tableau de bord en temps réel, l’utilisation du stockage HDD ne serait probablement d'aucune utilité. Les opérations de lecture sont beaucoup plus fréquentes et lentes dans ce cas.

Basculer entre le stockage SSD et HDD

Lorsque vous créez une instance et un cluster Bigtable, le choix du stockage SSD ou HDD est définitif pour le cluster. Vous ne pouvez pas utiliser Google Cloud Console pour modifier le type de stockage utilisé pour le cluster.

Si vous devez convertir un cluster HDD existant en SSD, ou inversement, vous pouvez exporter les données de l'instance existante et les importer dans une nouvelle instance. Vous pouvez également exécuter une tâche Dataflow ou Hadoop MapReduce pour copier les données d'une instance à une autre. N'oubliez pas que la migration d'une instance entière prend du temps. Il vous faudra peut-être ajouter des nœuds à vos clusters Bigtable avant de migrer votre instance.

Étape suivante

Créez une instance avec un stockage SSD ou HDD.