Une cartographie Google Cloud : Un arbre de décision pour choisir le stockage cloud le plus adapté à votre workload
Alicia Williams
Developer Advocate, Google Cloud
Priyanka Vergadia
Developer Advocate, Google Cloud
Google Cloud propose un large portfolio de solutions de stockage cloud pour répondre à chaque besoin spécifique, du stockage par blocs pour les applications hautes performances au stockage objet pour la diffusion de contenus médias ou les applications IA et ML en passant par le stockage de fichiers pour des workloads exigeants à écritures simultanées sans oublier le stockage spécialisé pour les datalakes et les entrepôts de données.
Nous poursuivons notre exploration de la richesse de Google Cloud. Après un premier arbre de décision consacré aux données et à l’analytique, voici un second guide pour vous aider à sélectionner les services de stockage Cloud les mieux adaptés à vos besoins spécifiques.
Un arbre de décision pour choisir le bon stockage sur Google Cloud. Cliquez pour télécharger et agrandir !
Examinons d’un peu plus près ces différents types de stockage et les options proposées par Google Cloud dans chaque catégorie :
Stockage par blocs
Le stockage par blocs suppose un stockage et un accès aux données avec des blocs de taille fixe. C’est le type de stockage historiquement utilisé par les baies SAN dans les datacenters. Cette méthode est particulièrement adaptée aux applications nécessitant un stockage haute performance avec une latence minimale, tel que des bases de données et des applications exigeant une réactivité quasi instantanée (moins d'une milliseconde), un grand nombre d'opérations par seconde, un débit élevé, ou une combinaison de ces caractéristiques.
Google Cloud propose plusieurs options de stockage par blocs :
- SSD local : stockage temporaire haute performance directement rattaché aux machines virtuelles. Idéal pour les workloads intensifs requérant une latence minimale et un nombre élevé d'opérations par seconde.
- Disque persistant : stockage durable et fiable pouvant être dynamiquement associé ou dissocié des machines virtuelles.
- Hyperdisk : conçu pour optimiser les coûts des analyses de données à grande échelle et d’autres workloads exigeant de très hauts débits ou un grand nombre d'opérations par seconde (IOPS).
Stockage objet
Le stockage objet permet de stocker les données sous forme d'objets distincts, chacun accompagné de métadonnées et d'un identifiant unique. Cette approche est particulièrement adaptée aux applications nécessitant un stockage très évolutif (à l'échelle des pétaoctets, voire exaoctets) et durable. Parmi les cas d’usages typiques, on peut notamment citer les CDN (Content Diffusion Network) de diffusion multimédia, la reprise après sinistre, le stockage de sauvegardes pour les applications n'utilisant pas Cloud Storage, l'analyse de données ou encore les workloads d’IA et ML.
- Dans l'environnement Google Cloud, le service idéal pour le stockage objet est Cloud Storage. Fortement évolutif et hautement disponible, Cloud Storage propose notamment la redondance et l’accessibilité sur plusieurs régions ainsi qu’une durabilité des données annuelle de 99,99999999999% (soit 11 neufs après la virgule).
Stockage fichiers en mode NFS et à écritures simultanées
NFS (Network File Storage) et « Multi-Writer File Storage » sont des systèmes de fichiers permettant à plusieurs utilisateurs et machines virtuelles de simultanément accéder et modifier des fichiers. NFS autorise l'accès concurrent en lecture et écriture aux fichiers partagés entre plusieurs clients, tandis que « Multi-Writer File Storage » (ou système de fichiers à écritures simultanées) permet l'écriture simultanée par plusieurs clients ou nœuds, caractéristique indispensable pour la collaboration en temps réel, les systèmes de gestion de versions et l'informatique distribuée.
Google Cloud propose plusieurs options :
- Filestore : Service de stockage de fichiers entièrement managé, Filestore combine la compatibilité NFS et les fonctionnalités d’écritures simultanées. Il permet de créer des partages de fichiers NFS hautement disponibles et évolutifs, s'intégrant parfaitement aux solutions « compute » de Google Cloud, dont Google Kubernetes Engine (GKE) et Google Cloud VMware Engine. Filestore permet ainsi à plusieurs conteneurs et « pods » d'accéder, de partager et d'écrire simultanément sur le même système de fichiers.
- Google Cloud NetApp Volumes : cette solution est également un service de stockage de fichiers entièrement managé offrant des performances élevées. Il permet de migrer et d'exécuter des applications et des workloads existants dans Google Cloud, sans nécessiter de refonte.
Stockage SMB
Le stockage SMB (Server Message Block) est un protocole de partage de fichiers en réseau couramment utilisé dans les environnements Windows. Il permet un partage de fichiers fluides entre les machines virtuelles connectées au réseau.
- Google Cloud NetApp Volumes : en plus de prendre en charge le protocole NFS et d'offrir le support d’un double protocole, NetApp Volumes permet l'utilisation du protocole SMB pour provisionner le stockage de fichiers dans votre environnement applicatif.
Datalakes et entrepôts de données
Les datalakes et les entrepôts de données permettent de consolider les données provenant de multiples sources, facilitant ainsi leur intégration et offrant une vue unifiée des données de l'organisation. Ils permettent aux entreprises d'effectuer des analyses complexes et d'obtenir des insights à partir de grands volumes de données structurées et non structurées, tout en servant de solide fondation aux workloads ML et IA.
Google Cloud propose des solutions pour chaque usage :
- Si votre priorité est l'analyse de données structurées, la BI et le reporting, optez pour BigQuery. Service managé d’entrepôt de données serverless, BigQuery permet de stocker, interroger et analyser des jeux de données volumineux avec des performances élevées et une grande évolutivité, en utilisant des requêtes SQL.
- Pour construire un pur datalake, préférez Cloud Storage, solution de stockage évolutive et durable pour les données brutes, prenant en charge l'ingestion et le stockage de données structurées, semi-structurées et non structurées dans leur format d'origine. Il s'intègre parfaitement aux autres services Google Cloud. Par exemple, BigQuery a la capacité d'interroger directement les données stockées dans Cloud Storage, agissant ainsi comme moteur d'analyse pour votre datalake.
Pour en savoir plus sur l'intégration de ces solutions dans les processus d'ingestion, de traitement, de stockage, de gouvernance, d'orchestration et d'exploitation des données sur Google Cloud, nous vous invitons à consulter notre précédent « arbre de décision » consacré aux workloads de données et analytiques.
Pour aller plus loin…
Google Cloud a une solution pour chacun de vos besoins de stockage, que ce soit du stockage par blocs, objets, fichiers ou pour entreposer vos données. Notre arbre décisionnel devrait vous aider à y voir plus clair et à choisir la solution la plus adaptée à vos projets. N'hésitez pas à le garder sous la main, il pourrait vous être très utile à l’avenir ! Et rendez-vous sur ce Blog pour découvrir d’autres guides à même de vous aider dans vos choix de solutions cloud.
Dernière chose, n’hésitez pas à donner votre avis sur cet article et sur cet arbre décisionnel en nous rejoignant sur notre canal Cloud Discord. Assurez-vous d’avoir rejoint les groupes Innovators et Google Developers Discord au préalable.