Présentation d'Analytics Hub

Analytics Hub est une plate-forme d'échange de données qui vous permet de partager des données et des insights à grande échelle à travers les limites organisationnelles grâce à un framework de sécurité et de confidentialité robuste. Avec Analytics Hub, vous pouvez découvrir une bibliothèque de données préparées par différents fournisseurs de données et y accéder. Cette bibliothèque inclut également des ensembles de données fournis par Google.

Par exemple, en utilisant Analytics Hub, vous pouvez enrichir vos initiatives d'analyse et de ML avec des ensembles de données tiers ou fournis par Google.

En tant qu'utilisateur d'Analytics Hub, vous pouvez effectuer les tâches suivantes :

  • En tant qu'éditeur Analytics Hub, vous pouvez monétiser vos données en les partageant avec votre réseau partenaire ou au sein de votre propre organisation en temps réel. Les fiches vous permettent de partager des données sans les répliquer. Vous pouvez créer un catalogue de sources de données prêtes pour l'analyse, avec des autorisations précises qui vous permettent de fournir les données au public auxquelles elles sont destinées. Vous pouvez également gérer les abonnements et afficher les métriques d'utilisation de vos fiches.

  • En tant qu'abonné Analytics Hub, vous pouvez découvrir les données que vous recherchez, combiner des données partagées avec vos données existantes et exploiter les fonctionnalités intégrées de BigQuery. Lorsque vous vous abonnez à une fiche, un ensemble de données associé est créé dans votre projet. Vous pouvez gérer vos abonnements à l'aide de la ressource Abonnement, qui stocke les informations pertinentes sur l'abonné et représente la connexion entre l'éditeur et l'abonné.

  • En tant que lecteur Analytics Hub, vous pouvez parcourir les ensembles de données auxquels vous avez accès dans Analytics Hub et demander à l'éditeur l'accès aux données partagées.

  • En tant qu'administrateur Analytics Hub, vous pouvez créer des échanges de données permettant le partage de données, puis accorder des autorisations aux éditeurs et aux abonnés pour accéder à ces échanges de données.

Pour en savoir plus sur les rôles utilisateur Analytics Hub, consultez la section Configurer les rôles Analytics Hub.

Architecture

Analytics Hub est basé sur un modèle de publication et d'abonnement à des ensembles de données BigQuery. La séparation du calcul et du stockage dans l'architecture de BigQuery permet aux éditeurs de données de partager des données avec autant d'abonnés qu'ils le souhaitent sans avoir à effectuer plusieurs copies des données. Le stockage des données est facturé aux éditeurs, tandis que les abonnés ne paient que pour les requêtes exécutées sur les données partagées. Les workflows pour les éditeurs et pour les abonnés dans Analytics Hub sont expliqués en détail dans les sections suivantes.

Workflow pour les éditeurs

Le schéma suivant décrit la façon dont les éditeurs interagissent avec Analytics Hub :

Interaction entre les éditeurs Analytics Hub et Analytics Hub.
Figure 1. Workflow pour les éditeurs Analytics Hub.

Dans la figure 1, les fonctionnalités suivantes sont associées à des libellés : "Shared dataset" (ensemble de données partagé), "Data exchange" (échange de données) et "Listing" (fiche).

Ensembles de données partagés
Un ensemble de données partagé est un ensemble de données BigQuery qui représente l'unité de partage de données dans Analytics Hub. En tant qu'éditeur, vous créez un ensemble de données BigQuery ou en utilisez un existant dans votre projet avec les objets compatibles suivants que vous souhaitez diffuser à vos abonnés :Les ensembles de données partagés sont compatibles avec la sécurité au niveau des colonnes et la sécurité au niveau des lignes
.
Échanges de données
Un échange de données est un conteneur qui permet le partage de données en libre-service. Il contient les fiches qui font référence à des ensembles de données partagés. Avec Analytics Hub, les éditeurs et les administrateurs peuvent accorder l'accès aux abonnés au niveau des échanges et des fiches. Cette méthode permet d'éviter d'accorder explicitement l'accès aux ensembles de données partagés sous-jacents. Un abonné Analytics Hub peut parcourir les échanges de données, découvrir des données auxquelles il peut accéder, et s'abonner aux ensembles de données partagés. Un échange de données peut être des types suivants :
  • Échange de données privé. Par défaut, un échange de données est privé et seuls les utilisateurs ou les groupes ayant accès à cet échange peuvent afficher les données ou s'y abonner.
  • Échange de données public. Par défaut, un échange de données est privé et seuls les utilisateurs ou les groupes ayant accès à cet échange peuvent afficher les fiches associées ou s'y abonner. Toutefois, vous pouvez choisir de rendre un échange de données public. Les fiches des échanges de données publics peuvent être découvertes et faire l'objet d'abonnements par les utilisateurs Google Cloud (allAuthenticatedUsers). Pour en savoir plus sur les échanges de données publics, consultez la page Rendre un échange de données public.

En tant qu'administrateur Analytics Hub, vous pouvez créer plusieurs échanges de données dans Analytics Hub et gérer les autres utilisateurs Analytics Hub.

Fiches
Une fiche est une référence à un ensemble de données partagé qu'un éditeur répertorie dans un échange de données. En tant qu'éditeur, vous pouvez créer une fiche et spécifier la description de l'ensemble de données, des exemples de requêtes à exécuter sur celui-ci, des liens vers toute documentation pertinente et toute information supplémentaire pouvant aider les abonnés à utiliser votre ensemble de données. Pour en savoir plus, consultez la section Gérer les fiches. Une fiche peut être de deux types selon la stratégie IAM (Identity and Access Management) définie pour la fiche et le type d'échange de données qui la contient :
  • Fiche publique. Elle est partagée avec tous les utilisateurs Google Cloud (allAuthenticatedUsers). Les fiches d'un échange de données public sont des fiches publiques. Ces fiches peuvent faire référence à un ensemble de données public gratuit ou à un ensemble de données commercial. Si la fiche correspond à un ensemble de données commercial, les abonnés peuvent demander l'accès à la fiche, et le fournisseur de données contacte ces abonnés directement.
  • Fiche privée. Elle est partagée directement avec des personnes ou des groupes. Par exemple, une fiche privée peut référencer un ensemble de données de métriques marketing que vous partagez avec d'autres équipes internes de votre entreprise.

Workflow pour les abonnés

Le schéma suivant décrit la façon dont les abonnés interagissent avec Analytics Hub :

Interaction entre les abonnés Analytics Hub et Analytics Hub.
Figure 2. Workflow pour les abonnés Analytics Hub.

Dans la figure 2, les fonctionnalités Analytics Hub suivantes sont associées à des libellés : "Shared dataset" (ensemble de données partagé), "Data exchange" (échange de données), "Listing" (fiche) et "Linked dataset" (ensemble de données associé).

Ensembles de données associés
Un ensemble de données associé est un ensemble de données BigQuery en lecture seule qui sert de lien symbolique vers un ensemble de données partagé. L'abonnement à une fiche crée un ensemble de données associé dans votre projet, et non une copie de l'ensemble de données. Les abonnés peuvent donc lire les données, mais ne peuvent pas lui ajouter des objets ni mettre à jour les objets qu'il contient. Lorsque vous interrogez des objets tels que des tables et des vues via un ensemble de données associé, les données renvoyées sont celles de l'ensemble de données partagé. Pour plus d'informations sur les ensembles de données associés, consultez la section Afficher les fiches et s'y abonner. Les ensembles de données associés sont autorisés à accéder aux tables et aux vues d'un ensemble de données partagé. Les abonnés ayant des ensembles de données associés accèdent aux tables et aux vues d'un ensemble de données partagé sans nécessiter d'autorisation IAM (Identity and Access Management) supplémentaire. Les ensembles de données associés sont compatibles avec les objets suivants :

Options de sortie des données

Les options de sortie des données (preview) permettent aux éditeurs de limiter l'exportation par les abonnés des données hors des ensembles de données associés à BigQuery.

Vous pouvez activer la restriction de sortie des données sur une fiche, les résultats d'une requête ou les deux. Lorsque la sortie des données est limitée, les restrictions suivantes sont appliquées :

  • Les API de copie, de clonage, d'exportation et d'instantané sont désactivées.

  • Les options de copie, de clonage, d'exportation et d'instantané dans la console Google Cloud sont désactivées.

  • La connexion de l'ensemble de données limité à l'explorateur de tables est désactivée.

  • Le service de transfert de données BigQuery est désactivé sur l'ensemble de données limité.

  • Les instructions CREATE TABLE AS SELECT et l'écriture dans une table de destination sont désactivées.

Lorsque vous créez une fiche, vous pouvez définir les options de sortie des données appropriées.

Limites

Analytics Hub présente les limites suivantes :

  • Un ensemble de données partagé peut contenir au maximum 1 000 ensembles de données associés.

  • Un ensemble de données contenant des ressources non compatibles ne peut pas être sélectionné en tant qu'ensemble de données partagé lorsque vous créez une fiche. Pour en savoir plus sur les objets BigQuery compatibles avec Analytics Hub, consultez la section Ensembles de données partagés de ce document.

  • Vous ne pouvez pas mettre à jour une fiche pour limiter la sortie des données. Vous ne pouvez limiter la sortie des données que sur une nouvelle fiche.

  • Les ensembles de données associés créés avant le 25 juillet 2023 ne sont pas remplis par la ressource d'abonnement. Seuls les abonnements créés après le 25 juillet 2023 fonctionnent avec les méthodes d'API.

  • Si vous êtes éditeur, les limitations d'interopérabilité BigQuery suivantes s'appliquent:

    • Les abonnés ne peuvent pas interroger les vues dans les ensembles de données associés faisant référence à des données d'autres projets. Vous devez créer des vues autorisées pour autoriser les abonnés à accéder aux données d'une vue sans leur donner accès aux données sources sous-jacentes.

    • Le plan de requête affiche la requête sur la vue partagée et la requête de routine, y compris les ID de projet et les autres ensembles de données impliqués dans les vues autorisées. N'incluez jamais des éléments tels que des clés de chiffrement que vous considérez comme sensibles dans la requête de vue partagée ou de routine.

    • Les ensembles de données partagés sont indexés dans Data Catalog. Les mises à jour d'un ensemble de données partagé, telles que l'ajout de tables ou de vues, sont mises à la disposition des abonnés sans délai. Toutefois, dans certains cas, par exemple lorsqu'un ensemble de données partagé contient plus de 100 abonnés ou tables, les mises à jour peuvent prendre jusqu'à 18 heures pour être indexées dans Data Catalog. En raison du délai d'indexation, les abonnés ne peuvent pas rechercher immédiatement dans la console Google Cloud ces ressources mises à jour.

    • Si vous avez configuré des règles de sécurité au niveau des lignes ou de masquage des données sur les tables répertoriées, les abonnés doivent être des clients Enterprise ou Enterprise Plus pour exécuter le job de requête sur l'ensemble de données associé. Pour obtenir des informations sur les éditions, consultez la page Présentation des éditions BigQuery.

  • Si vous êtes abonné, les limites d'interopérabilité BigQuery suivantes s'appliquent:

    • Les vues matérialisées faisant référence à des tables de l'ensemble de données associé ne sont pas acceptées.

    • Il n'est pas possible de prendre des instantanés de tables d'ensembles de données associés.

    • Si les ensembles de données associés ne sont pas colocalisés avec l'ensemble de données partagé, les opérations de lecture vers les tables d'ensembles de données associés avec une taille de requête supérieure à 1 To peuvent échouer. Vous pouvez contacter l'assistance pour résoudre ce problème.

    • Vous ne pouvez pas utiliser de qualificatifs de région avec des vues INFORMATION_SCHEMA pour afficher les métadonnées des tables de votre ensemble de données associé.

    • Lorsque vous interrogez des routines dans un ensemble de données associé, vous ne pouvez interroger que des fonctions définies par l'utilisateur (SQL et JavaScript) et Fonctions de table. L'interrogation d'un type de routine non compatible génère le message d'erreur suivant : Querying routine type type is not yet supported on linked dataset dataset.

  • Les limites suivantes s'appliquent aux métriques d'utilisation :

    • Vous ne pouvez pas obtenir les métriques d'utilisation d'abonnements souscrits avant le 20 juillet 2023.

    • Les métriques d'utilisation ne sont pas consignées pour les tables externes.

    • Seules les métriques d'utilisation pour la consommation liée aux jobs BigQuery sont compatibles. La consommation liée à l'utilisation des ressources suivantes n'est pas disponible :

    • Les métriques d'utilisation ne sont pas consignées pour les vues.

  • Les limites suivantes s'appliquent lors de l'abonnement aux données Salesforce Data Cloud :

    • Les données Data Cloud sont partagées en tant que vues. En tant qu'abonné, vous ne pouvez pas accéder aux tables sous-jacentes référencées par les vues.

Régions où le service est disponible

Analytics Hub est compatible avec les régions et les emplacements multirégionaux suivants.

Régions

Le tableau suivant répertorie les régions des Amériques où Analytics Hub est disponible.
Description de la région Nom de la région Détails
Columbus, Ohio us-east5
Dallas us-south1
Iowa us-central1 Icône Feuille Faibles émissions de CO2
Las Vegas us-west4
Los Angeles us-west2
Montréal northamerica-northeast1 Icône Feuille Faibles émissions de CO2
Virginie du Nord us-east4
Oregon us-west1 Icône Feuille Faibles émissions de CO2
Salt Lake City us-west3
São Paulo southamerica-east1 Icône Feuille Faibles émissions de CO2
Santiago southamerica-west1
Caroline du Sud us-east1
Toronto northamerica-northeast2
Le tableau suivant répertorie les régions en Asie-Pacifique où Analytics Hub est disponible.
Description de la région Nom de la région Détails
Delhi asia-south2
Hong Kong asia-east2
Jakarta asia-southeast2
Melbourne australia-southeast2
Mumbai asia-south1
Osaka asia-northeast2
Séoul asia-northeast3
Singapour asia-southeast1
Sydney australia-southeast1
Taïwan asia-east1
Tokyo asia-northeast1
Le tableau suivant répertorie les régions en Europe où Analytics Hub est disponible.
Description de la région Nom de la région Détails
Belgique europe-west1 Icône Feuille Faibles émissions de CO2
Finlande europe-north1 Icône Feuille Faibles émissions de CO2
Francfort europe-west3 icône feuille Faibles émissions de CO2
Londres europe-west2 icône feuille Faibles émissions de CO2
Pays-Bas europe-west4
Varsovie europe-central2
Zurich europe-west6 Icône Feuille Faibles émissions de CO2
Le tableau suivant répertorie les régions du Moyen-Orient où Analytics Hub est disponible.
Description de la région Nom de la région Détails
Dammam me-central2
Tel-Aviv me-west1

Emplacements multirégionaux

Le tableau suivant répertorie les emplacements multirégionaux dans lesquels Analytics Hub est disponible.
Description de la zone multirégionale Nom de l'emplacement multirégional
Centres de données dans les États membres de l'Union européenne1 EU
Centres de données aux États-Unis US

1 Les données situées dans la zone multirégionale EU ne sont pas stockées dans les centres de données des régions europe-west2 (Londres) ou europe-west6 (Zurich).

Régions Omni

Le tableau suivant répertorie les régions Omni où Analytics Hub est disponible.
Description de la région Omni Nom de la région Omni
AWS
AWS Est des États-Unis (Virginie du Nord) aws-us-east-1
AWS Est des États-Unis (Oregon) aws-us-west-2
AWS – Asie-Pacifique (Séoul) aws-ap-northeast-2
AWS – Europe (Irlande) aws-eu-west-1
Azure
Azure – Est des États-Unis 2 azure-eastus2

Exemple d'utilisation

Cette section explique comment utiliser Analytics Hub.

Supposons que vous êtes un revendeur et que votre organisation dispose de données de prévision de la demande en temps réel dans un projet Google Cloud nommé Forecasting. Vous souhaitez partager ces données de prévision de la demande avec des centaines de fournisseurs de votre système de chaîne d'approvisionnement. Voici comment partager vos données avec vos fournisseurs via Analytics Hub :

Administrateurs Analytics Hub

En tant que propriétaire du projet Forecasting, vous devez d'abord activer l'API Analytics Hub, puis attribuer le rôle Administrateur Analytics Hub à un utilisateur chargé de gérer l'échange de données dans le projet. Les utilisateurs disposant du rôle Administrateur Analytics Hub sont appelés administrateurs Analytics Hub.

Un administrateur Analytics Hub peut effectuer les tâches suivantes :

  • Créer, mettre à jour, supprimer et partager l'échange de données dans le projet de Forecasting de votre organisation.

  • Gérer d'autres administrateurs Analytics Hub.

  • Gérer les éditeurs en attribuant le rôle d'éditeur Analytics Hub aux employés de votre organisation. Si vous souhaitez que certains employés puissent uniquement mettre à jour, supprimer et partager des fiches, mais pas les créer, vous pouvez leur attribuer le rôle d'administrateur de fiches Analytics Hub.

  • Gérer les abonnés en attribuant le rôle d'abonné Analytics Hub à un groupe Google composé de tous les fournisseurs. Si vous souhaitez que certains fournisseurs ne puissent accéder qu'en lecture aux échanges de données et aux fiches disponibles, vous pouvez leur attribuer le rôle de lecteur Analytics Hub. Ces fournisseurs ne peuvent pas s'abonner aux fiches.

Pour en savoir plus, consultez la section Gérer les échanges de données.

Éditeurs Analytics Hub

Les éditeurs créent les fiches suivantes pour leurs ensembles de données dans le projet de Forecasting ou dans un projet différent :

  • Fiche A : ensemble de données de prévision de la demande 1
  • Fiche B : ensemble de données de prévision de la demande 2
  • Fiche C : ensemble de données de prévision de la demande 3

En tant que fournisseur de données, vous pouvez suivre les métriques d'utilisation de votre ensemble de données partagé. Les métriques d'utilisation incluent les informations suivantes :

  • Jobs exécutés sur votre ensemble de données partagé.
  • Les détails de consommation de votre ensemble de données partagé par les projets et l'organisation des abonnés.
  • Le nombre de lignes et d'octets traités par le job.

Pour en savoir plus, consultez la section Gérer les fiches.

Abonnés Analytics Hub

Les abonnés peuvent parcourir les fiches auxquelles ils ont accès dans les échanges de données. Ils peuvent également s'abonner à ces fiches et ajouter ces ensembles de données à leurs projets en créant un ensemble de données associé. Les fournisseurs peuvent ensuite exécuter des requêtes sur ces ensembles de données associés et obtenir des résultats en temps réel.

Pour en savoir plus, consultez la section Afficher les fiches et s'y abonner.

Tarifs

La gestion des échanges de données et des fiches n'entraîne aucun coût supplémentaire. Le stockage des données est facturé aux éditeurs Analytics Hub, tandis que les abonnés paient pour les requêtes exécutées sur les données partagées selon un modèle de tarification à la demande ou basé sur la capacité. Pour en savoir plus sur les tarifs, consultez la section Tarifs de BigQuery.

Quotas

Pour en savoir plus sur les quotas Analytics Hub, consultez la section Quotas et limites.

VPC Service Controls

Vous pouvez définir les règles d'entrée et de sortie nécessaires pour permettre aux éditeurs et aux abonnés d'accéder aux données des projets comportant des périmètres VPC Service Controls. Pour en savoir plus, consultez la page Règles de VPC Service Controls d'Analytics Hub.

Étapes suivantes