Présentation de BigQuery

BigQuery est un entrepôt de données d'entreprise entièrement géré, qui vous aide à gérer et analyser vos données grâce à des fonctionnalités intégrées telles que le machine learning, l'analyse géospatiale et l'informatique décisionnelle. L'architecture sans serveur de BigQuery vous permet d'utiliser des requêtes SQL pour répondre à des questions cruciales pour votre organisation, sans aucune infrastructure à gérer. Les requêtes fédérées vous permettent de lire des données provenant de sources externes, tandis que la diffusion en streaming permet de mettre à jour des données en continu. Le moteur d'analyse distribué et évolutif de BigQuery vous permet d'interroger des téraoctets en quelques secondes et des pétaoctets en quelques minutes.

L'architecture de BigQuery se compose de deux parties : une couche de stockage qui ingère, stocke et optimise les données, et une couche de calcul qui fournit des fonctionnalités d'analyse. Ces couches de calcul et de stockage fonctionnent efficacement indépendamment les unes des autres, grâce au réseau de Google à l'échelle du pétaoctet qui permet la communication nécessaire entre elles.

Les anciennes bases de données doivent généralement partager des ressources pour les opérations de lecture/écriture et les opérations d'analyse. Cela peut entraîner des conflits de ressources et ralentir les requêtes lorsque les données sont écrites ou lues dans l'espace de stockage. Les pools de ressources partagées peuvent être davantage sollicités lorsque des ressources sont nécessaires pour des tâches de gestion de base de données, telles que l'attribution ou la révocation d'autorisations. La séparation des couches de calcul et de stockage par BigQuery permet à chaque couche d'allouer des ressources de manière dynamique sans affecter les performances ni la disponibilité de l'autre.

L'architecture BigQuery sépare les ressources avec un réseau pétabit.

Ce principe de séparation permet à BigQuery d'innover plus rapidement, car les améliorations de stockage et de calcul peuvent être déployées indépendamment, sans temps d'arrêt ni impact négatif sur les performances du système. Il est également essentiel de proposer un entrepôt de données sans serveur entièrement géré dans lequel l'équipe d'ingénieurs BigQuery gère les mises à jour et la maintenance. En conséquence, vous n'avez pas besoin de provisionner ou de faire évoluer manuellement les ressources, ce qui vous permet de vous concentrer sur la génération de valeur plutôt que sur les tâches traditionnelles de gestion de base de données.

Les interfaces BigQuery incluent l'interface de la console Google Cloud et l'outil de ligne de commande BigQuery. Les développeurs et les data scientists peuvent utiliser des bibliothèques clientes dans les langages de programmation familiers, y compris Python, Java, JavaScript et Go, ainsi que l'API REST et l'API RPC de BigQuery, pour transformer et gérer les données. Les pilotes ODBC et JDBC permettent d'interagir avec des applications existantes, y compris des outils et des utilitaires tiers.

En tant qu'analyste de données, ingénieur de données, administrateur d'entrepôt de données ou data scientist, BigQuery vous aide à charger, traiter et analyser des données afin d'éclairer des décisions commerciales critiques.

Premiers pas avec BigQuery

Vous pouvez commencer à explorer BigQuery en quelques minutes. Profitez du niveau d'utilisation gratuit ou du bac à sable gratuit de BigQuery pour commencer à charger et à interroger des données.

  1. Bac à sable BigQuery : lancez-vous dans le bac à sable BigQuery, sans risque et sans frais.
  2. Guide de démarrage rapide de la console Google Cloud : familiarisez-vous avec la puissance de la console BigQuery.
  3. Ensembles de données publics : découvrez les performances de BigQuery en explorant de grands volumes de données réelles issues du programme d'ensembles de données publics.

Explorer BigQuery

L'infrastructure sans serveur de BigQuery vous permet de vous concentrer sur vos données plutôt que sur la gestion des ressources. BigQuery combine un entrepôt de données cloud et de puissants outils d'analyse.

Stockage BigQuery

BigQuery stocke les données dans un format de stockage en colonnes optimisé pour les requêtes analytiques. BigQuery présente les données sous forme de tables, de lignes et de colonnes, et est entièrement compatible avec la sémantique des transactions de base de données (ACID). Le stockage BigQuery est automatiquement répliqué sur plusieurs emplacements afin de fournir une haute disponibilité.

Pour en savoir plus, consultez la page Présentation du stockage BigQuery.

Analyses BigQuery

L'analyse descriptive et l'analyse prescriptive incluent l'informatique décisionnelle, l'analyse ad hoc, les analyses géospatiales et le machine learning. Vous pouvez interroger les données stockées dans BigQuery ou exécuter des requêtes sur des données où qu'elles soient hébergées, à l'aide de tables externes ou de requêtes fédérées, y compris dans Cloud Storage, Bigtable, Spanner ou dans des feuilles de calcul Google Sheets stockées dans Google Drive.

  • Requêtes SQL standard ANSI (Compatibilité SQL:2011), y compris la gestion des jointures, des champs imbriqués et répétés, des fonctions d'analyse et d'agrégation, des requêtes à plusieurs instructions, et de diverses fonctions spatiales avec l'analyse géospatiale (systèmes d'informations géographiques).
  • Création de vues pour partager votre analyse.
  • Compatibilité avec les outils d'informatique décisionnelle, y compris BI Engine avec Looker Studio, Looker, Google Sheets et des outils tiers tels que Tableau et Power BI.
  • BigQuery ML fournit des données analytiques de machine learning et prédictives.
  • BigQuery Studio (preview) propose des fonctionnalités telles que les notebooks Python et le contrôle des versions pour les notebooks et les requêtes enregistrées. Ces fonctionnalités vous aident à exécuter vos workflows d'analyse de données et de machine learning (ML) dans BigQuery plus facilement.
  • Interrogation de données en dehors de BigQuery avec des tables externes et des requêtes fédérées.

Pour en savoir plus, consultez la page de présentation des analyses BigQuery.

Administration de BigQuery

BigQuery offre une gestion centralisée des données et des ressources de calcul, tandis que la gestion de l'authentification et des accès (IAM) vous aide à sécuriser ces ressources avec le modèle d'accès utilisé dans Google Cloud. Les bonnes pratiques de sécurité de Google Cloud fournissent une approche solide mais flexible qui peut inclure une sécurité périmétrique traditionnelle, ou une approche plus complexe et plus précise de défense en profondeur.

  • La section Présentation de la sécurité et de la gouvernance des données vous aide à comprendre la gouvernance des données et les contrôles dont vous pourriez avoir besoin pour sécuriser vos ressources BigQuery.
  • Les tâches sont des actions que BigQuery exécute en votre nom pour charger, exporter, interroger ou copier des données.
  • Les réservations vous permettent de basculer entre la tarification à la demande et la tarification basée sur la capacité.

Pour en savoir plus, consultez la page Présentation de l'administration de BigQuery.

Ressources BigQuery

Explorez les ressources BigQuery :

API, outils et documentations de références

Documentation de référence pour les développeurs et les analystes BigQuery :

Rôles et ressources BigQuery

BigQuery répond aux besoins des professionnels du traitement des données ayant les rôles et responsabilités suivants.

Analyste de données

Conseils à suivre pour effectuer les tâches suivantes :

Pour découvrir les fonctionnalités d'analyse de données de BigQuery directement dans la console Google Cloud, cliquez sur Visite guidée.

Visite guidée

Administrateur de données

Conseils à suivre pour effectuer les tâches suivantes :

Pour en savoir plus, consultez la page Présentation de l'administration de BigQuery.

Pour découvrir les fonctionnalités d'administration des données de BigQuery directement dans la console Google Cloud, cliquez sur Visite guidée.

Visite guidée

Data scientist

Conseils d'utilisation pour l'utilisation des tâches de machine learning de BigQuery ML pour effectuer les opérations suivantes :

Développeur de données

Conseils à suivre pour effectuer les tâches suivantes :

Tutoriels vidéo BigQuery

Les tutoriels vidéo ci-dessous vous aideront à démarrer avec BigQuery :

Fonction

Description

Premiers pas avec BigQuery (17:18) Présentation qui résume ce qu'est BigQuery et comment l'utiliser. Les segments incluent : les pipelines ETL, la tarification et l'optimisation, BigQuery ML et BI Engine, ainsi qu'une démonstration de BigQuery dans la console Google Cloud.
Qu'est-ce que BigQuery ? (4:39) Découvrez comment BigQuery est conçu pour ingérer et stocker de grandes quantités de données afin d'aider aussi bien les analystes que les développeurs
Utiliser le bac à sable BigQuery (3:05) Configurez un bac à sable BigQuery pour exécuter des requêtes sans avoir besoin d'une carte de crédit.
Poser des questions, exécuter des requêtes (5:11) Écrire et exécuter des requêtes SQL dans l'interface utilisateur de BigQuery, et choisir un numéro de maillot gagnant
Charger des données dans BigQuery (5:31) Comment ingérer et analyser des données en temps réel, ou réaliser une analyse par lot unique des données (et chats contre chiens en bonus)
Visualiser les résultats de requêtes (5:38) Utilité de la visualisation des données pour rendre les ensembles de données complexes plus faciles à comprendre et à intégrer
Gérer les accès avec IAM (5:23) Permettre à d'autres utilisateurs d'interroger vos ensembles de données dans BigQuery avec des autorisations IAM et un contrôle des accès
Enregistrer et partager des requêtes (6:17) Enregistrer et partager vos requêtes dans BigQuery en toute simplicité
Protéger les données sensibles à l'aide des vues autorisées (7:12) Partager facilement des ensembles de données avec différents utilisateurs en définissant des contrôles d'accès personnalisés
Interroger des données externes avec BigQuery (5:49) Configurer une source de données externe dans BigQuery et interroger des données à partir de Cloud Storage, Cloud SQL, Google Drive et plus encore
Que sont les fonctions définies par l'utilisateur ? (4:59) Créer des fonctions définies par l'utilisateur (UDF) pour l'analyse d'ensembles de données dans BigQuery

Étape suivante