Disponibilité et durabilité des données

Cette page traite des concepts liés à la disponibilité et à la durabilité des données dans Cloud Storage, y compris la manière dont Cloud Storage stocke les données de manière redondante, le comportement de réplication par défaut pour les emplacements birégionaux et multirégionaux, et la fonctionnalité de réplication turbo pour birégionaux.

Concepts clés

  • Cloud Storage est conçu pour offrir une durabilité annuelle de 99,999999999 % (onze fois le chiffre 9).

    • Pour ce faire, Cloud Storage utilise le codage d'effacement et stocke les données de manière redondante sur plusieurs disques situés dans différentes zones de disponibilité.

    • Cloud Storage stocke de manière redondante les objets qui y sont écrits dans au moins deux zones de disponibilité différentes avant de considérer l'écriture comme réussie.

    • Les sommes de contrôle sont stockées et régulièrement revalidées afin de vérifier de manière proactive l'intégrité de toutes les données au repos ainsi que de détecter toute corruption des données en transit. Si nécessaire, des corrections sont appliquées automatiquement grâce aux données redondantes.

  • La disponibilité mensuelle des données stockées dans Cloud Storage dépend de la classe de stockage des données et du type d'emplacement du bucket. Pour en savoir plus, consultez la section Classes de stockage disponibles.

  • Les objets stockés dans un bucket birégional ou un multirégional sont stockés de manière redondante dans au moins deux zones géographiques distinctes.

    • Pour les emplacements birégionaux, vous sélectionnez les régions spécifiques dans lesquelles vos objets sont stockés.

    • Pour les emplacements multirégionaux, les centres de données spécifiques utilisés pour le stockage des données sont déterminés par Cloud Storage si nécessaire, mais sont situés dans la limite géographique de l'emplacement multirégional et sont séparés par au moins 100 miles. Cela permet une redondance entre les régions pour un coût de stockage inférieur à celui des emplacements birégionaux.

    • Dans le cas peu probable d'une panne à l'échelle de la région, par exemple en cas de catastrophe naturelle, les buckets birégionaux et multirégionaux restent disponibles, sans qu'il soit nécessaire de modifier les chemins de stockage.

  • Les objets stockés dans des buckets birégionaux et multirégionaux sont généralement répliqués sur des emplacements géographiques à l'aide de la réplication par défaut.

    • Si l'un des emplacements où un objet est stocké devient indisponible après son importation, mais avant qu'il ne soit répliqué vers le deuxième emplacement, la cohérence forte de Cloud Storage garantit que les versions obsolètes de l'objet ne sont pas diffusées et que les écrasements ultérieurs ne sont pas annulés lorsque la région redevient disponible.

    • Les objets stockés dans des emplacements birégionaux peuvent éventuellement utiliser la réplication turbo pour obtenir une réplication plus rapide et plus prévisible entre les régions.

  • Pour obtenir une redondance entre une paire de régions non disponible en tant que zone birégionale, envisagez de créer un bucket distinct dans chaque région et d'utiliser des transferts basés sur des événements du service de transfert de stockage pour conserver les buckets synchronisés.

Redondance entre les régions

Là où les modèles de stockage traditionnels s'appuient souvent sur une approche active-passive avec des emplacements géographiques "principaux" et "secondaires", Cloud Storage fournit une architecture en mode actif/actif basée sur un bucket unique avec redondance entre les régions. Cela simplifie le processus de reprise après sinistre en éliminant la nécessité de faire répliquer les données d'un bucket à un autre par les utilisateurs ou de basculer manuellement vers le bucket secondaire en cas de temps d'arrêt de la région principale.

Cloud Storage comprend toujours l'état actuel d'un bucket et diffuse de manière transparente les objets d'une région disponible, si nécessaire. Par conséquent, les buckets birégionaux et multirégionaux sont conçus pour avoir un RTO de zéro et les défaillances régionales temporaires sont normalement invisibles pour utilisateurs ; En cas de panne régionale, les buckets birégionaux continuent de diffuser automatiquement toutes les données ayant été répliquées entre les régions.

Cependant, la redondance entre les régions se produit de manière asynchrone. Par conséquent, toutes les données dont la réplication entre les régions n'est pas achevée avant l'indisponibilité d'une région sont inaccessibles jusqu'à ce que la région en panne soit de nouveau en ligne. Des données risquent d'être perdues dans le cas très peu probable de destruction physique de la région.

La réplication par défaut dans Cloud Storage est conçue pour fournir une redondance entre les régions pour 99,9% des objets nouvellement écrits dans un délai d'une heure et 100% des objets nouvellement écrits dans un délai de 12 heures. Les nouveaux objets incluent les importations, les réécritures, les copies et les compositions.

Réplication turbo

La réplication turbo permet d'accélérer la redondance entre les régions pour les données de vos buckets birégionaux, ce qui réduit le risque d'exposition aux pertes de données et permet d'assurer la continuité des services à la suite d'une panne régionale.

  • Lorsqu'elle est activée, la réplication turbo est conçue pour répliquer 100% des objets nouvellement écrits dans les deux régions qui constituent l'emplacement birégional dans l'objectif de point de reprise de 15 minutes, quelle que soit la taille de l'objet.

Notez que même pour la réplication par défaut, la réplication de la plupart des objets se termine en quelques minutes.

Tandis que la redondance entre régions et la réplication turbo contribuent à assurer la continuité des activités et la reprise après sinistre (BCDR), les administrateurs doivent planifier et mettre en œuvre une architecture BCDR complète qui est adaptée à leur charge de travail.

Pour plus d'informations, consultez le guide par étapes sur la conception de la reprise après sinistre pour les applications dans Google Cloud.

Limites

  • La réplication turbo n'est disponible que pour les buckets situés dans des emplacements birégionaux.

  • La réplication turbo ne peut pas être gérée via l'API XML, y compris pour la création d'un bucket avec la réplication turbo activée.

  • Lorsque la réplication turbo est activée sur un bucket, un délai de 10 secondes peut être nécessaire avant qu'elle ne s'applique aux nouveaux objets.

  • Les écritures d'objets qui ont commencé avant l'activation de la réplication turbo sur un bucket sont répliquées sur plusieurs régions au taux de réplication par défaut.

    • La composition d'objets qui utilise des objets sources écrits à l'aide de la réplication par défaut au cours des 12 dernières heures crée un objet composite qui utilise également la réplication par défaut.

Surveillance des performances

Cloud Storage surveille les objets non répliqués les plus anciens. Si un objet reste non répliqué plus longtemps que la durée de son RPO (objectif de point de récupération), il est considéré comme étant hors RPO. Chaque minute au cours de laquelle un ou plusieurs objets sont hors RPO est comptabilisée comme une minute de comportement défaillant.

Par exemple, si un objet a généré 20 minutes de comportement défaillant de 9h00 à 9h20 et qu'un autre objet a généré 10 minutes de comportement défaillant de 9h15 à 9h25, on considère que deux objets sont hors RPO pour le mois en question. Le nombre total de minutes de comportement défaillant pour le mois est de 25 minutes car de 9h00 à 9h25, au moins un objet était hors RPO.

  • Pour les buckets utilisant la réplication turbo, le RPO pour les objets est de 15 minutes.

Dans la console Google Cloud, le graphique Nombre de minutes hors RPO vous permet de surveiller les minutes de comportement défaillant au cours des 30 derniers jours pour votre bucket. Cet indicateur de niveau de service permet de surveiller la conformité du temps de réplication mensuel du bucket. De même, le graphique Réplications d'objets avec turbo suit les réplications d'objets qui ont lieu dans le RPO. Cet indicateur de niveau de service permet de surveiller la conformité du volume de réplication mensuel du bucket. Pour en savoir plus, consultez les pages Surveillance Cloud Storage et Contrat de niveau de service Cloud Storage.

Étapes suivantes