Google Cloud pour les professionnels des centres de données : Stockage

Cet article décrit les services de stockage sur Google Cloud et les compare avec les modèles de stockage traditionnels. Les types de stockage suivants et leurs équivalents dans le cloud sont présentés :

  • Stockage sur disque, y compris le stockage en attachement direct (DAS), le stockage en réseau (NAS) et les réseaux de stockage (SAN)
  • Stockage d'objets
  • Stockage d'archives, y compris les baies de stockage et les supports à bande magnétique

Principaux composants de stockage

Cette section propose une brève présentation des principaux composants de stockage fournis par Google Cloud.

Stockage de blocs

Google Cloud propose deux types de stockage de blocs. Les deux types de disques sont intégrés dans Compute Engine, le produit IaaS (Infrastructure-as-a-Service) de Google Cloud, et peuvent être installés sur des instances de machines virtuelles (VM) Compute Engine :

  • Les disques persistants, qui sont des volumes de stockage en réseau que vous pouvez associer à vos instances de VM.
  • Les disques SSD locaux, qui sont directement associés à la machine physique sur laquelle votre instance de VM est exécutée.

Disques persistants

Les disques persistants sont des volumes de stockage de blocs virtuels. Lorsque vous créez une instance de VM, celle-ci comprend un seul disque persistant de démarrage qui contient le système d'exploitation de la machine. Vous pouvez associer jusqu'à 128 volumes ou 257 To de disques persistants, en fonction du type de machine de votre VM.

Les performances des disques persistants dépendent du type de disque, de sa taille et du débit maximal de l'instance de VM à laquelle le disque est associé. Chaque disque persistant peut être un HDD ou un SSD, et chaque type possède les mêmes caractéristiques de performances généralement associées à son équivalent physique. les disques persistants HDD standards sont efficaces et économiques pour le traitement des opérations de lecture/écriture séquentielles, tandis que les disques persistants SSD sont plus adaptés à des taux élevés d'IOPS aléatoires. Les performances d'un disque persistant donné augmentent en fonction de la taille du disque jusqu'à ce que vous atteigniez les limites de débit de l'instance de VM associée.

Les machines contenant les disques persistants sont hébergées en colocation dans la même zone que celles qui contiennent vos instances de VM. Elles sont connectées à la structure réseau de Google. Les réseaux de Google peuvent généralement offrir plus d'un pétabit par seconde de bande passante de bissection totale, ce qui permet de garantir que ces disques persistants en réseau ont un débit et des propriétés d'E/S comparables à ceux des disques associés localement.

Bien que les disques persistants soient disponibles dans la zone dans laquelle ils résident, ils ne sont pas répliqués sur toutes les zones. Si l'instance de VM associée à un disque persistant est mise hors ligne, ce disque persistant conserve ses données mais devient inaccessible. Pour garantir la haute disponibilité lors de l'utilisation de disques persistants, vous devez l'activer entre les régions et les zones dans lesquelles la charge de travail est exécutée. Pour plus d'informations sur les régions et les zones, consultez la page Régions et zones.

SSD local

Les disques SSD locaux sont physiquement associés à la même machine hôte que l'instance de VM Compute Engine. Ils ont un débit supérieur et une latence moindre par rapport aux disques persistants standards ou aux disques persistants SSD. Cependant, les disques SSD locaux présentent quelques restrictions :

  • Les disques SSD locaux sont moins flexibles que les disques persistants. La taille des disques SSD locaux est limitée à 375 Go, à la différence des disques persistants. Vous pouvez associer jusqu'à huit volumes à une instance de VM à cœur non partagé, et vous ne pouvez pas associer de disques SSD locaux à une instance de VM à cœur partagé. De plus, vous ne pouvez pas utiliser de disque SSD local en tant que périphérique de démarrage.
  • Les disques SSD locaux ne sont généralement pas persistants. Bien que vos données persistent si vous redémarrez l'instance de VM, elles seront perdues en cas d'arrêt de l'instance.

Stockage d'objets

Cloud Storage est un service gratuit de stockage d'objets hébergé qui vous permet de stocker et d'accéder à un grand nombre d'objets binaires, ou blobs, de différentes tailles. Les buckets Cloud Storage sont l'option de stockage la plus évolutive et durable disponible sur Google Cloud. Si vos applications ne nécessitent pas de stockage de blocs, nous vous recommandons vivement de stocker vos données dans un bucket Cloud Storage.

Cloud Storage propose quatre classes de stockage principales. Toutes les classes de stockage Cloud Storage offrent un accès rapide à toutes les données, et elles sont compatibles avec le même ensemble d'appels d'API :

  • Standard est la classe Cloud Storage qui offre la plus haute disponibilité dans un emplacement donné. Elle est idéale pour le stockage de contenus à grande échelle et la diffusion de fichiers multimédias. Lorsqu'elle est utilisée dans la même région que vos ressources de calcul, elle est idéale pour l'analyse de données, le machine learning et les charges de travail de calcul telles que le traitement multimédia.
  • Nearline, Coldline et Archive offrent un stockage économique pour les données auxquelles vous ne comptez pas accéder régulièrement, telles que les données de sauvegarde, de reprise après sinistre et d'archivage.

Comparaison des modèles de service

Cette section compare les modèles de stockage de centres de données les plus courants avec les offres de stockage Google Cloud, et explique en quoi les services cloud diffèrent des technologies traditionnelles des centres de données.

Stockage en attachement direct (DAS)

Dans un centre de données, le stockage en attachement direct (DAS), parfois appelé disque local, est un volume physique directement associé à un serveur physique. Ce volume peut être associé en interne, comme avec un disque de démarrage, ou en externe, comme avec un disque dur externe. Si vous souhaitez autoriser d'autres serveurs à accéder aux données d'un disque local, vous devez autoriser explicitement le système d'exploitation du serveur à partager le disque sur le réseau.

Dans le cloud, disque local et DAS ne sont pas nécessairement synonymes. Sur Google Cloud, par exemple, les charges de travail typiquement destinées à des disques locaux peuvent être exécutées sur des disques SSD locaux et des disques persistants :

  • Les disques persistants, même s'ils sont associés au réseau en arrière-plan, sont la solution par défaut qui équivaut au stockage DAS sur Compute Engine. Les deux types de disques persistants offrent de solides performances pour leurs cas d'utilisation respectifs. Ils sont également moins coûteux que les disques SSD locaux, et représentent un choix pertinent pour la plupart des charges de travail.
  • Les disques SSD locaux sont comparables au stockage en attachement direct traditionnel et constituent un bon choix pour les charges de travail qui nécessitent des performances de stockage élevées. Cependant, les disques SSD locaux ne sont pas persistants. Ils ne peuvent servir de disques de démarrage et ne doivent pas être utilisés pour des charges de travail qui nécessitent un stockage local persistant.

Stockage en réseau (NAS)

Dans un centre de données, un périphérique de stockage en réseau (NAS), également appelé serveur de stockage, permet aux applications de lire et de mettre à jour les fichiers partagés sur plusieurs machines. En règle générale, un serveur utilise un protocole permettant aux machines clientes d'installer un système de fichiers et d'accéder aux fichiers comme s'ils étaient hébergés localement.

Google Cloud propose Filestore, une solution de serveur de fichiers native en tant que service. Les experts de ces équipes œuvrent de différentes manières. Pour plus d'informations, consultez la section Serveurs de stockage sur Compute Engine.

Réseau de stockage (SAN)

Dans un centre de données, un réseau de stockage (SAN) est une unité de stockage distante qui offre un accès au niveau des blocs ainsi qu'une couche de gestion interne, via laquelle vous pouvez fournir des numéros d'unités logiques (LUN) individuels aux ressources. Lorsqu'ils se connectent à un réseau SAN, les utilisateurs installent le réseau SAN en tant que disque plutôt que de se connecter à un serveur auquel des disques sont associés, comme ce serait le cas pour un serveur de stockage.

Sur Google Cloud, les charges de travail en environnement SAN peuvent être exécutées sur des disques persistants. Dans cet environnement, les disques persistants sont analogues aux volumes de disques logiques auxquels vous auriez accès via des numéros d'unité logique (LUN) de périphériques et sont provisionnés de la même manière. Comme pour les volumes de disques logiques basés sur LUN, vous pouvez installer plusieurs disques persistants sur une seule instance de VM. Vous pouvez également installer un seul disque persistant en lecture seule sur plusieurs instances de machine virtuelle.

Les disques persistants se situent dans une zone donnée, ce qui signifie que vous pouvez continuer à vous servir du zonage LUN pour restreindre l'accès à la machine si nécessaire.

Lorsque vous déplacez votre réseau de stockage vers Google Cloud, vous bénéficiez également d'avantages supplémentaires propres au cloud :

  • Un SAN basé sur un disque persistant n'a presque pas de plafond de stockage. Vous pouvez provisionner de nouveaux disques persistants à la volée sans vous soucier de manquer d'espace de stockage physique. Toutefois, les instances de VM individuelles sont limitées à 128 disques persistants ou à 64 To de stockage de blocs.
  • Vous n'avez pas à vous soucier des contraintes physiques liées au matériel, par exemple l'optimisation du nombre d'instances de VM que vous pouvez connecter à un LUN donné.
  • Les disques persistants étant répliqués par défaut, vous n'avez pas besoin de choisir un niveau RAID optimal.

Stockage d'archives

Dans un centre de données, vous utilisez des types de support de stockage d'archives standards, tels qu'un support à bande magnétique ou une baie de stockage (ou les deux), pour les données d'archives devant être conservées à long terme à des fins commerciales ou juridiques. Chacun de ces types de stockage a ses inconvénients :

  • Les baies de stockage peuvent être coûteuses. Outre le coût initial du matériel lui-même, si votre règle de sauvegarde exige que les données soient déplacées hors site, vous devrez peut-être conserver les sauvegardes dans un deuxième centre de données. Cette situation entraîne des coûts supplémentaires, car vous devez établir et maintenir la connectivité à ce centre de données.
  • Les supports à bande magnétique sont plus économiques qu'une baie de stockage, mais ils demandent davantage de travail d'administration. Pour gérer efficacement vos archives sur bande, vous avez besoin d'un serveur de catalogue qui vous permet de suivre l'historique de vos bandes, d'une bibliothèque de bandes et d'un administrateur système pour gérer la bibliothèque et les importations/exportations associées. Certaines entreprises doivent également faire appel à un fournisseur externe capable d'effectuer des collectes et des livraisons de bandes régulières et sécurisées.

Lorsque vous passez au cloud, cet investissement en matériel et en ressources humaines est réduit. Par exemple, sur Google Cloud, vous pouvez remplacer ces deux méthodes par les stockages Cloud Storage Nearline, Cloud Storage Coldline et Cloud Storage Archive, qui proposent des solutions tendant progressivement vers le stockage à froid. Cloud Storage Nearline est conçu pour les données auxquelles vous comptez accéder moins d'une fois par mois. Cloud Storage Coldline est conçu pour les données auxquelles vous comptez accéder moins d'une fois par trimestre. Cloud Storage Archive est conçu pour les données auxquelles vous comptez accéder moins d'une fois par an.

Cloud Storage Nearline, Cloud Storage Coldline et Cloud Storage Archive permettent de résoudre bon nombre des problèmes qui affectent les méthodes de stockage d'archives traditionnelles. Par exemple, contrairement aux supports à bande magnétique, ces trois catégories de stockage sont durables et fiables. Vous n'avez pas à vous soucier de l'état de fonctionnement de votre bande, ni de la récupération de votre bande sur une installation hors site, ni de celle des données réparties sur plusieurs bandes. De plus, vous n'avez plus à vous charger de la réplication des données. Par défaut, chaque classe de stockage Cloud Storage réplique vos données pour en garantir la durabilité et la disponibilité.

En outre, Cloud Storage Nearline, Cloud Storage Coldline et Cloud Storage Archive offrent une faible latence, comparable à celle d'une baie de stockage sur site, permettant de récupérer votre premier octet de données en moins d'une seconde. Contrairement aux baies de stockage, ces solutions n'entraînent aucuns frais matériels initiaux ni aucun contrat de maintenance coûteux. Avec Cloud Storage, vous ne payez que ce que vous consommez.

Enfin, Cloud Storage s'intègre à plusieurs systèmes de gestion de catalogue courants. Avec ce modèle, vous pouvez continuer à utiliser votre logiciel actuel et envoyer vos nouvelles sauvegardes d'archivage vers Cloud Storage Nearline, Cloud Storage Coldline ou Cloud Storage Archive. Pour plus d'informations, consultez la page Partenaires Cloud Storage.

Coûts

Disques persistants et disques SSD locaux

Les disques SSD locaux et les disques persistants Compute Engine sont facturés par Go et par mois. Pour plus d'informations sur la tarification des disques persistants et des disques SSD locaux, consultez la page Tarifs des disques persistants.

Cloud Storage Standard

Le modèle de tarification de Cloud Storage diffère grandement de celui du stockage traditionnel dans un centre de données. Dans un centre de données, vous devez acheter votre matériel de stockage NAS ou SAN en amont, tandis que Cloud Storage facture à l'utilisation. Vous êtes facturé pour la quantité de données que vous stockez par mois, le volume de sortie réseau, le volume de transfert de données entre les emplacements et le nombre de requêtes API effectuées. Vous n'avez pas à vous soucier des contrats de maintenance ni des coûts associés aux éventuelles pannes matérielles susceptibles de survenir lorsque vous achetez votre propre matériel.

Pour en savoir plus sur les tarifs de Cloud Storage, consultez la page Tarifs de Cloud Storage.

Cloud Storage Nearline, Cloud Storage Coldline et Cloud Storage Archive.

Comme pour la classe de stockage Cloud Storage Standard, la facturation de Cloud Storage Nearline, Cloud Storage Coldline et Cloud Storage Archive se fait en fonction de la quantité de données stockées par mois, de la sortie réseau et du transfert de données. En tant que classes d'archives, les trois appliquent également des frais d'extraction de stockage et une période de stockage minimale. Si vous supprimez ou modifiez vos données avant la fin de la période de stockage minimale, vous devrez vous acquitter du reste de la période. Par exemple, si vous supprimez un objet cinq jours après l'avoir stocké dans Cloud Storage Nearline, les 25 jours de stockage restants pour cet objet vous seront facturés.

Pour plus d'informations sur les tarifs de Cloud Storage Nearline, Cloud Storage Coldline et Cloud Storage Archive, consultez la page Tarifs de Cloud Storage.

Et ensuite ?

Étape suivante : Gestion sur Google Cloud