Présentation des ensembles de données

Cette page offre un aperçu des ensembles de données dans BigQuery.

Ensembles de données

Un ensemble de données est contenu dans un projet spécifique. Les ensembles de données sont des conteneurs de niveau supérieur utilisés pour organiser et contrôler l'accès à vos tables et vues. Une table ou une vue doit appartenir à un ensemble de données. Vous devez donc créer au moins un ensemble de données avant de charger des données dans BigQuery. Utilisez le format projectname.datasetname pour qualifier entièrement un nom d'ensemble de données lorsque vous utilisez GoogleSQL, ou le format projectname:datasetname pour qualifier entièrement un nom d'ensemble de données lorsque vous utilisez l'outil de ligne de commande bq.

Emplacement

Lorsque vous créez un ensemble de données, vous spécifiez une zone pour stocker vos données BigQuery. Pour obtenir la liste des emplacements des ensembles de données BigQuery, consultez Emplacements BigQuery. Une fois que vous avez créé l'ensemble de données, l'emplacement ne peut plus être modifié , mais vous pouvez copier l'ensemble de données dans différents emplacements, ou le déplacer (recréer) manuellement dans un autre emplacement.

BigQuery traite les requêtes dans le même emplacement que l'ensemble de données contenant les tables que vous interrogez. BigQuery stocke vos données dans la zone sélectionnée conformément aux Conditions spécifiques au service.

Conservation des données

Les ensembles de données utilisent la fonctionnalité temporelle conjointement avec la période de sécurité pour conserver les données supprimées et modifiées pendant une courte période, au cas où vous auriez besoin de les récupérer. Pour en savoir plus, consultez la page Conservation des données avec la fonctionnalité temporelle et de sécurité.

Modèles de facturation du stockage

Le stockage des données BigQuery peut vous être facturé en octets logiques ou physiques (compressés), ou en combinaison des deux. Le modèle de facturation du stockage que vous choisissez détermine vos tarifs de stockage. Le modèle de facturation du stockage que vous choisissez n'a aucune incidence sur les performances de BigQuery. Quel que soit le modèle de facturation que vous choisissez, vos données sont stockées sous forme d'octets physiques.

Vous définissez le modèle de facturation du stockage au niveau de l'ensemble de données. Si vous ne spécifiez pas de modèle de facturation du stockage lorsque vous créez un ensemble de données, la facturation du stockage logique est utilisée par défaut. Toutefois, vous pouvez modifier le modèle de facturation du stockage d'un ensemble de données après l'avoir créé. Une fois que vous avez modifié le modèle de facturation du stockage d'un ensemble de données, vous devez attendre 14 jours avant de pouvoir le modifier à nouveau.

Lorsque vous modifiez le modèle de facturation d'un ensemble de données, la prise en compte de la modification prend 24 heures. Les tables ou les partitions de tables du stockage à long terme ne sont pas réinitialisées sur le stockage actif lorsque vous modifiez le modèle de facturation d'un ensemble de données. Les performances et la latence des requêtes ne sont pas affectées par la modification du modèle de facturation d'un ensemble de données.

Les ensembles de données utilisent la fonctionnalité temporelle et le stockage préventif pour la conservation des données. Les fonctionnalités temporelles et le stockage de sécurité sont facturés séparément au tarif de stockage actif lorsque vous utilisez la facturation du stockage physique, mais sont inclus dans le tarif de base qui vous est facturé lorsque vous utilisez la facturation du stockage logique. Vous pouvez modifier la fenêtre de fonctionnalité temporelle que vous utilisez pour un ensemble de données afin d'équilibrer les coûts de stockage physique et la conservation des données. Vous ne pouvez pas modifier l'intervalle de prévention des défaillances. Pour en savoir plus sur la conservation des données des ensembles de données, consultez la page Conservation des données avec la fonctionnalité temporelle et de sécurité. Pour en savoir plus sur la prévision des coûts de stockage, consultez la page Prévoir la facturation du stockage.

Vous ne pouvez pas inscrire un ensemble de données à la facturation du stockage physique si votre organisation dispose d'anciens engagements d'emplacements à tarifs forfaitaires situés dans la même région que cet ensemble de données. Cela ne s'applique pas aux engagements souscrits avec une édition BigQuery.

Ensembles de données externes

En plus des ensembles de données BigQuery, vous pouvez créer des ensembles de données externes, qui sont des liens vers des sources de données externes:

Notez que les ensembles de données externes sont également appelés ensembles de données fédérés. Les deux termes sont utilisés de manière interchangeable.

Une fois créés, les ensembles de données externes contiennent des tables provenant d'une source de données externe référencée. Les données de ces tables ne sont pas copiées dans BigQuery, mais interrogées chaque fois qu'elles sont utilisées. Pour en savoir plus, consultez la section Requêtes fédérées Spanner.

Limites

Les ensembles de données BigQuery sont soumis aux limitations suivantes :

  • L'emplacement de l'ensemble de données ne peut être défini qu'au moment de la création. Une fois l'ensemble de données créé, l'emplacement ne peut plus être modifié.
  • Toutes les tables référencées dans une requête doivent être stockées dans des ensembles de données situés au même emplacement.
  • Les ensembles de données externes ne sont pas compatibles avec l'expiration des tables, les réplicas, le voyage dans le temps, la collation par défaut, le mode d'arrondi par défaut ni l'option d'activation ou de désactivation de la casse des noms de tables.

  • Lorsque vous copiez une table, les ensembles de données contenant la table source et la table de destination doivent se trouver au même emplacement.

  • Les noms d'ensembles de données doivent être uniques pour chaque projet.

  • Une fois que vous avez modifié le modèle de facturation du stockage d'un ensemble de données, vous devez attendre 14 jours avant de pouvoir le modifier à nouveau.

  • Vous ne pouvez pas enregistrer un ensemble de données à la facturation du stockage physique si vous avez d'anciens engagements d'emplacements à tarifs forfaitaires situés dans la même région que cet ensemble de données.

Quotas

Pour plus d'informations sur les quotas et les limites des ensembles de données, consultez la page Quotas et limites.

Tarifs

La création, la mise à jour et la suppression d'un ensemble de données ne sont pas facturées.

Pour en savoir plus sur les tarifs de BigQuery, consultez la section Tarifs.

Sécurité

Pour savoir comment contrôler l'accès aux ensembles de données dans BigQuery, consultez la page Contrôler l'accès aux ensembles de données. Pour en savoir plus sur le chiffrement des données, consultez la page Chiffrement au repos.

Étapes suivantes