Google BigQuery

Entrepôt de données cloud rapide, hautement adaptable, économique et entièrement géré, destiné à l'analyse de données et doté de fonctionnalités de machine learning intégrées

Profiter d'un essai gratuit

BigQuery est l'entrepôt de données d'entreprise sans serveur et hautement adaptable de Google, conçu pour augmenter la productivité de vos analystes de données, à un rapport prix-performances inégalé. Comme il n'y a pas d'infrastructure à gérer, vous pouvez vous concentrer sur l'analyse des données pour dégager des insights pertinents grâce au langage SQL qui vous est familier, sans avoir besoin d'un administrateur de base de données.

Analysez toutes vos données en créant un entrepôt logique sur un stockage en colonnes géré, ainsi que des données issues d'espaces de stockage d'objets et de feuilles de calcul. Créez et opérationnalisez des solutions de machine learning à l'aide de requêtes SQL simples. Partagez des insights facilement et en toute sécurité au sein de votre organisation et au-delà, sous forme d'ensembles de données, de requêtes, de feuilles de calcul et de rapports. BigQuery permet aux organisations de capturer et d'analyser des données en temps réel grâce à sa puissante capacité d'ingestion de flux pour que leurs insights soient toujours à jour. Le service est gratuit jusqu'à 1 To de données analysées par mois et 10 Go de données stockées.

Soyez opérationnel rapidement

Configurez votre entrepôt de données en quelques secondes et commencez à interroger vos données immédiatement. BigQuery exécute des requêtes SQL ultrarapides de l'ordre de plusieurs gigaoctets ou pétaoctets de données, et permet de facilement associer des ensembles de données publics ou commerciaux à vos données. Éliminez le travail fastidieux de provisionnement et réduisez les temps d'arrêt avec une infrastructure sans serveur qui gère l'ensemble de la maintenance continue, y compris les correctifs et les mises à jour. BigQuery emploie le langage SQL conforme à la norme ANSI qui vous est familier. Il fournit des pilotes ODBC et JDBC afin de faciliter et d'accélérer l'intégration à vos données.

Soyez opérationnel rapidement

Évoluez avec une fluidité parfaite

Épargnez-vous la planification de la capacité de l'entrepôt de données et développez-vous à l'infini avec un scaling flexible et sans limites. BigQuery répond aux défis de l'analyse en temps réel en exploitant l'infrastructure sans serveur de Google, qui tire parti de l'autoscaling et de l'ingestion de flux hautes performances pour charger les données. Grâce au stockage en colonnes géré, à l'exécution massivement parallèle et aux optimisations automatiques des performances de BigQuery, tous vos utilisateurs peuvent analyser les données de façon simple et simultanée, indépendamment du nombre d'utilisateurs ou de la taille des données.

Évoluez avec une fluidité parfaite

Accélérez l'interprétation des données grâce à une analyse performante

Dégagez plus rapidement des insights de vos données sans avoir à copier ni à déplacer ces dernières. Google BigQuery vous permet de bénéficier d'une vue globale et complète en interrogeant de manière transparente les données situées dans le stockage en colonnes géré de BigQuery, Cloud Storage, Cloud Bigtable, Sheets et Drive. BigQuery s'intègre aux outils ETL existants comme Informatica et Talend pour enrichir les données que vous utilisez déjà. Compatible de manière native avec les outils de veille stratégique populaires tels que Tableau, MicroStrategy, Looker ou Data Studio, BigQuery permet à chacun de créer facilement des rapports et des tableaux de bord de qualité. Ingérez et visualisez automatiquement les annonces Google et les données marketing à l'aide du service de transfert de données BigQuery pour configurer en quelques clics un entrepôt de données marketing puissant.

Accélérez l'interprétation des données grâce à une analyse performante

Protégez vos données d'entreprise et vos investissements

Bénéficiez de performances, d'une sécurité et de fonctionnalités inégalées, pour un coût adapté à votre budget. Grâce à la réplication automatique des données pour la reprise après sinistre et la haute disponibilité du traitement, sans frais supplémentaires, BigQuery vous affranchit des opérations sur les données. Il inclut un contrat de niveau de service de 99,9 %, et respecte les principes du bouclier de protection des données UE-États-Unis (Privacy Shield). BigQuery permet de maintenir facilement une sécurité renforcée grâce à un contrôle précis de la gestion de l'authentification et des accès. Les données de BigQuery sont toujours chiffrées, qu'elles soient au repos ou en transit.

Protégez vos données d'entreprise et vos investissements

BigQuery MLBÊTA

Avec BigQuery ML, les data scientists et les analystes de données peuvent créer et opérationnaliser des modèles de ML sur des données structurées ou semi-structurées à l'échelle mondiale en utilisant des requêtes SQL simples directement dans BigQuery, et ce en un temps record.

BigQuery ML

Démocratisez l'analyse prédictive

Créez, testez et opérationnalisez des modèles de ML personnalisés à l'aide du langage SQL qui vous est familier. Les étapes d'extraction de caractéristiques, de sélection des modèles et d'ajustement des hyperparamètres étant automatisées, la création de modèles est plus simple que jamais. Stockez des modèles entraînés au sein de BigQuery, et partagez-les facilement avec les autres parties prenantes pour une collaboration transparente.

Accélérez l'acquisition d'informations

Concevez des modèles de ML en quelques minutes seulement, au lieu de plusieurs jours ou semaines, directement dans BigQuery. Plus besoin d'échantillonner ou de déplacer d'importantes quantités de données hors de leur entrepôt pour effectuer l'entraînement. En outre, BigQuery ML vous permet de mettre à jour automatiquement les modèles de ML entraînés en fonction des modifications apportées aux données sous-jacentes, ce qui vous évite d'avoir à les réentraîner manuellement.

Évoluez sans compromis

Exploitez la puissance de l'architecture sans serveur de BigQuery et tout le potentiel de Google Cloud pour entraîner des modèles de ML avec plusieurs pétaoctets de données en quelques minutes : un temps record comparé aux systèmes traditionnels. Les analystes de données et les data scientists citoyens de votre organisation peuvent ainsi collaborer et créer des solutions de ML très facilement. BigQuery ML vous permet de compiler des solutions d'analyse prédictive critiques sans le moindre compromis.

Fonctionnalités de BigQuery

Entrepôt de données d'entreprise rapide, hautement adaptable, économique et entièrement géré, destiné à l'analyse de données

Entrepôt de données sans serveur
L'entreposage de données sans serveur vous apporte les ressources dont vous avez besoin, quand vous en avez besoin. Avec BigQuery, vous pouvez vous concentrer sur vos données et vos analyses, sans vous soucier de la gestion des ressources informatiques ni de leur dimensionnement.
Analyse en temps réel
L'API d'insertion de flux ultrarapide de BigQuery constitue une base solide pour l'analyse en temps réel. En rendant vos données d'entreprise les plus récentes immédiatement disponibles, BigQuery vous permet d'analyser immédiatement ce qu'il se passe.
Haute disponibilité automatique
La réplication gratuite des données et des calculs sur plusieurs emplacements signifie que vos données peuvent être interrogées même en cas de défaillance critique. BigQuery fournit de manière transparente et automatique un stockage répliqué et durable, ainsi qu'une haute disponibilité, sans frais ni configuration supplémentaires.
Langage SQL standard
BigQuery est compatible avec un dialecte SQL standard conforme à la norme ANSI:2011, ce qui réduit le besoin de réécrire du code et vous permet de tirer parti des fonctionnalités avancées du SQL. Il fournit des pilotes ODBC et JDBC gratuits pour garantir l'interaction de vos applications actuelles avec son puissant moteur.
Requêtes fédérées et entreposage de données logique
BigQuery élimine les cloisonnements entre les données pour que vous puissiez analyser tous vos éléments de données au même endroit. Grâce à de puissantes requêtes fédérées, BigQuery peut traiter des données situées dans un espace de stockage d'objets (Cloud Storage), dans des bases de données transactionnelles (Cloud Bigtable) ou dans des feuilles de calcul disponibles dans Google Drive, sans les dupliquer. Un seul outil vous permet d'interroger toutes vos sources de données.
Séparation du stockage et des calculs
BigQuery vous permet de contrôler précisément les coûts et l'accès. Grâce à la séparation entre les ressources de stockage et de calcul, vous payez uniquement ce que vous utilisez. Vous avez la possibilité de choisir les solutions de stockage et de traitement qui conviennent à votre entreprise, et de contrôler l'accès à chacune d'elles.
Sauvegarde automatique et restauration facile
BigQuery réplique automatiquement les données et conserve un historique des modifications sur sept jours, ce qui réduit les inquiétudes liées aux modifications inattendues. Il est ainsi possible de restaurer et de comparer facilement des données sauvegardées à différents moments.
Fonctions et types de données géospatiaux
Avec BigQuery GISBÊTA, les fonctions SIG les plus couramment utilisées sont compatibles avec le langage SQL au sein même de votre entrepôt de données. Comme les formats WKT et GeoJSON acceptent les points, lignes, polygones et multipolygones, vous pouvez simplifier vos analyses géospatiales, consulter vos données géolocalisées de façons inédites, ou vous ouvrir à de tout nouveaux secteurs d'activité grâce à la puissance de BigQuery.
Service de transfert de données
BigQuery facilite la prise en main de l'entreposage, même si vos données proviennent d'une application SaaS. Le service de transfert de données BigQuery transfère automatiquement les données de vos sources externes, comme Google Marketing Platform, Google Ads ou YouTube, vers BigQuery, de manière programmée et gérée.
Intégration à un écosystème de big data
Avec Cloud Dataproc et Cloud Dataflow, BigQuery s'intègre à l'écosystème de big data Apache, ce qui permet aux charges de travail Hadoop/Spark et Beam existantes de lire ou d'écrire des données directement depuis BigQuery. Ce dernier vous permet de tirer le meilleur parti de vos données structurées en facilitant l'analyse SQL et l'intégration à vos tâches de big data existantes, pour que vous ne perdiez pas le travail déjà effectué.
Évolutivité à l'échelle du pétaoctet
BigQuery est rapide et facile à utiliser, quel que soit le volume de données. Avec BigQuery, vous obtenez d'excellentes performances, tout en sachant que vous pouvez évoluer de façon fluide pour stocker et analyser plus de pétaoctets sans avoir à acheter plus de capacité.
Modèles tarifaires flexibles
BigQuery vous permet de choisir le modèle tarifaire qui vous convient le mieux. Grâce aux tarifs à la demande, vous payez uniquement le stockage et les calculs que vous utilisez. Avec les tarifs forfaitaires, les utilisateurs ayant un volume de requêtes important ou les grandes entreprises peuvent choisir un coût mensuel fixe pour l'analyse. Pour en savoir plus, consultez la page relative aux tarifs de BigQuery.
Chiffrement des données et sécurité
Bénéficiez d'un contrôle total sur l'accès aux données stockées dans BigQuery. Grâce à Cloud IAM, BigQuery vous permet de maintenir facilement une sécurité renforcée à l'aide d'un contrôle précis de la gestion de l'authentification et des accès. De plus, les données sont toujours chiffrées, qu'elles soient au repos ou en transit.
Localité des données
Stockez vos données BigQuery en Europe, au Japon et aux États-Unis tout en continuant à bénéficier d'un service entièrement géré. BigQuery vous donne la possibilité de contrôler la position géographique des données, sans avoir à configurer ni à gérer des clusters et d'autres ressources informatiques dans la région en question.
Base pour l'IA
BigQuery constitue une base solide et flexible pour le machine learning et l'intelligence artificielle. Le service vous permet non seulement d'utiliser le ML sur vos données à l'aide de BigQuery ML, mais grâce à son intégration à Cloud ML Engine et à TensorFlow, vous pouvez aussi entraîner des modèles puissants à partir de données structurées. En outre, la capacité de BigQuery à transformer et à analyser les données permet de les préparer pour le machine learning.
Base pour la veille stratégique
BigQuery constitue le pilier de l'entreposage de données appliqué aux solutions de veille stratégique modernes. Il permet d'intégrer, de transformer, d'analyser et de visualiser de données, ainsi que de créer de rapports en toute transparence à l'aide d'outils proposés par Google et ses partenaires technologiques.
Ingestion flexible des données
Chargez vos données depuis Cloud Storage ou importez-les en flux continu dans BigQuery à une vitesse de plusieurs milliers de lignes par seconde pour les analyser en temps réel. Des outils d'intégration de données familiers, comme Informatica, Talend ou autres, sont compatibles par défaut.
Gouvernance des données
Grâce à l'intégration à Cloud IAM, BigQuery permet un contrôle ultraprécis de l'accès aux données et un contrôle basé sur les rôles de l'API. Avec BigQuery et Cloud IAM, vous avez la certitude que vos données sont à l'abri de tout accès non autorisé.
Interaction automatisée
BigQuery fournit une API REST afin de simplifier l'accès programmatique et l'intégration des applications. Pour faciliter la tâche des programmeurs de tout type, BigQuery propose des bibliothèques clientes en C#, Go, Java, Node.js, PHP, Python et Ruby. Les utilisateurs professionnels peuvent accéder à BigQuery à partir de Google Sheets via Google Apps Script.
Surveillance et journalisation complètes avec Stackdriver
BigQuery fournit des fonctionnalités complètes de surveillance, de journalisation et d'alerte par le biais des journaux d'audit Stackdriver. Les ressources BigQuery peuvent être surveillées d'un coup d'œil, et BigQuery peut servir de dépôt pour les journaux provenant des services ou applications utilisant Stackdriver Logging.
Maîtrise des coûts
BigQuery fournit des systèmes de maîtrise des coûts qui vous permettent de plafonner vos dépenses quotidiennes. En savoir plus sur la maîtrise des coûts

Architecture de la solution d'entreposage de données

Solutions BigQuery et cas d'utilisation

Système de gestion d'inventaire en temps réel
Internet des objets
Analyse d'événements et de journaux à grande échelle
Marketing numérique prédictif
Distribution de données avec des ensembles de données commerciaux
Ensembles de données publics

Tarifs de BigQuery

Dans BigQuery, le stockage et l'interrogation de données ainsi que les importations en flux continu sont payants, mais pas le chargement et l'exportation de données. Pour en savoir plus sur les tarifs appliqués, consultez la grille tarifaire.
Fonctionnalité Prix
Stockage 0,02 $ par Go et par mois
0,01 $ par Go et par mois pour un stockage à long terme
Insertions en flux continu 0,01 $ par tranche de 200 Mo
Chargement, copie ou exportation de données
Opérations associées aux métadonnées
Gratuit
Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page relative aux SKU de Cloud Platform s'appliquent.

Lorsque vous analysez des données, vous avez le choix entre deux modes de facturation :

Type d'abonnement Prix
Facturation à l'utilisation 5 $ par To
Premier téraoctet (1 To) par mois gratuit*
Tarifs forfaitaires À partir de 40 000 $/mois pour 2 000 emplacements dédiés
En savoir plus sur les tarifs forfaitaires

BigQuery ML (aperçu des tarifs)

Les tarifs pour la création de modèles et la réalisation de prédictions avec BigQuery sont calculés en fonction de votre type d'abonnement BigQuery :
Type d'abonnement Modèles de machine learning Prix
Facturation à l'utilisation Régression linéaire
Régression logistique
5 $ par Go de données d'entraînement et par modèle créé**
Les 10 premiers Go de données d'entraînement chaque mois sont gratuits

5 $ par To de données pour les requêtes de prédiction et d'évaluation
Tarifs forfaitaires Régression linéaire
Régression logistique
La création de modèles et la prédiction consomment normalement les emplacements actuels, jusqu'au 31 juillet 2019

Obtenez plus d'informations concernant les tarifs de BigQuery ML.

Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page relative aux SKU de Cloud Platform s'appliquent.

* Le premier téraoctet (1 To) de données traitées chaque mois par BigQuery est gratuit.
** Les 10 premiers Go de données utilisées chaque mois lors de l'exécution d'instructions CREATE Model sont gratuits.
Remarque : Les Règles relatives aux quotas de BigQuery s'appliquent à ces opérations.

Partenaires BigQuery

BigQuery libère tout le potentiel de l'entreposage de données dans le cloud pour un large éventail d'outils et partenaires. De l'intégration à l'analyse des données, les partenaires Google Cloud ont incorporé BigQuery à des outils de pointe permettant de charger, de transformer et de visualiser les données. Les clients peuvent ainsi tirer parti de l'agilité, des performances et de la facilité d'utilisation de BigQuery pour fournir des insights plus rapides et plus efficaces.

Intégration des données

Veille stratégique et visualisation des données

Sélection de blogs sur BigQuery

Combler le fossé entre données et insights
Sudhir Hasbe, directeur de la gestion des produits, big data GCP
Comment faire appel à BigQuery pour traiter vos données d'entreprise depuis Sheets
Dan McClary, chef de produit
Les rouages de BigQuery
Jordan Tigani, responsable technique BigQuery, et Tino Tereshko, chef de projet technique BigQuery
Pensez chiffres plutôt que fonctionnalités lorsque vous estimez la valeur du big data
ESG
Anatomie d'une requête BigQuery
Jordan Tigani, responsable technique BigQuery, et Tino Tereshko, chef de projet technique BigQuery
BigQuery continue de définir le concept de gestion intégrale
Tino Tereshko, chef de projet technique BigQuery
Historique des tests de tri à très grande échelle de Google
Marian Dvorsky, ingénieur logiciel, Google Cloud Platform
Présentation de Capacitor, le format de stockage en colonnes nouvelle génération de BigQuery
Posté par Mosha Pasumansky, responsable technique Dremel/BigQuery
Exécution de requêtes en mémoire dans BigQuery
Posté par Hossein Ahmadi, responsable technique BigQuery
Super Size It : comment Motorola a transformé son entreposage et son analyse de données avec Google Cloud Platform
Posté par Alex Barrett, rédacteur, blog Google Cloud Platform

Pour lire d'autres articles de blog et en savoir plus sur BigQuery, consultez le blog sur le big data et le machine learning de Google Cloud. Vous pouvez également nous suivre sur Twitter : @GCPDataML.

Les produits figurant sur cette page sont proposés en version alpha ou bêta, ou en accès anticipé. Pour en savoir plus sur les étapes de lancement de nos produits, cliquez ici.

Envoyer des commentaires concernant…