Architecture : entrepôt de données marketing

Ce document fournit une architecture de référence qui décrit comment créer des entrepôts de données marketing évolutifs. Les solutions d'entreposage de données marketing vous permettent de proposer des expériences publicitaires personnalisées, opportunes et ciblées à vos utilisateurs, tout en respectant leur confidentialité. Ce document est destiné aux ingénieurs de données, aux data scientists ou aux membres informatiques qui travaillent dans des fonctions liées au marketing et à l'analyse d'audience.

La mise en œuvre d'un entrepôt de données marketing vous aide à répondre aux besoins commerciaux suivants :

  • Insights complets : Si vous utilisez plusieurs plates-formes SaaS (Software as a Service), vous pouvez utiliser cette architecture pour consolider les données marketing et publicitaires dans BigQuery. Si vous êtes une personne concernée d'une entreprise, vous pouvez obtenir des informations en temps réel sur les performances marketing et commerciales.

  • Innovation marketing : si vous êtes un data scientist ou un ingénieur de données, vous pouvez créer des modèles de machine learning (ML) pour les besoins de votre entreprise, comme la segmentation de la clientèle, la valeur vie d'un client, des recommandations de produits et des prédictions d'achat. Vous pouvez activer ces modèles sur plusieurs plates-formes, telles que le marketing par e-mail ou le ciblage de la publicité.

  • Expérience client : l'entrepôt de données marketing offre une meilleure visibilité sur les préférences des clients, afin que vous puissiez améliorer leur expérience grâce à une personnalisation précise. L'obtention de ces informations vous permet de personnaliser les points d'interaction de vos clients, tels que les applications propriétaires, les sites Web, les publicités en ligne et le marketing par e-mail.

Architecture

Le schéma suivant illustre une architecture de référence classique pour l'analyse marketing sur Google Cloud utilisant plusieurs produits d'analyse de données et de machine learning.

Architecture de référence pour l'analyse marketing sur Google Cloud

Le schéma montre les étapes à suivre dans un workflow d'entrepôt de données marketing que vous pouvez configurer :

  1. Ingestion de données
  2. Traitement des données
  3. Machine learning
  4. Insights et activation

Composants d'architecture

Cette section décrit les étapes d'une solution d'entrepôt de données marketing, y compris les composants technologiques nécessaires.

Ingestion de données

La première étape de la création d'un entrepôt de données marketing consiste à consolider vos données de manière centralisée. Vous pouvez ingérer des données issues des sources de données suivantes :

  • Plates-formes Google et SaaS : vous pouvez ingérer des sources de données, telles que Google Analytics, Google Ads et Google Marketing Platform, dans l'entrepôt de données marketing Google Cloud de BigQuery. Pour intégrer des données provenant de sources telles que Salesforce, les connecteurs SaaS sont disponibles dans Google Cloud et via nos partenaires.
  • Clouds publics : vous pouvez utiliser le service de transfert de données BigQuery pour ingérer des données provenant d'autres clouds publics. Par exemple, pour déplacer des données d'Amazon S3 vers BigQuery, vous pouvez planifier et gérer automatiquement les tâches de chargement récurrentes. Vous pouvez également utiliser BigQuery Omni, une solution d'analyse flexible et multicloud qui vous permet d'analyser les données de Google Cloud et Amazon Web Services.
  • API, fichiers plats et données first party sur site : vous pouvez ingérer des données issues de sources telles que la gestion de la relation client (CRM) ou les systèmes de point de vente. En général, cette ingestion de données est faite hors connexion à l'aide de l'outil de ligne de commande bq, de l'API BigQuery ou de la console. Vous pouvez charger ces données localement ou à partir de Cloud Storage. Pour les grands ensembles de données, nous vous recommandons d'utiliser Cloud Storage pour optimiser l'utilisation de la bande passante, la vitesse du réseau et l'intégration du produit. Pour charger des données basées sur des événements dans BigQuery, vous pouvez définir des déclencheurs de fonction Cloud. Par exemple, définissez des déclencheurs basés sur la disponibilité des nouvelles données.

La plupart des approches d'ingestion précédentes utilisent des chargements par lot. Si vous souhaitez ingérer des ensembles de données en streaming dans BigQuery, vous pouvez utiliser les fonctionnalités de streaming de BigQuery. Pour les cas d'utilisation de l'analyse de flux, consultez les solutions d'analyse de flux.

Traitement des données

Après avoir ingéré les données, vous pouvez les traiter si nécessaire. Cette étape n'est nécessaire que lorsque vous devez traiter les données avant d'exécuter des requêtes. Le traitement des données inclut le nettoyage et le reformatage visant à assurer la cohérence interne des grands ensembles de données. Vous pouvez utiliser les produits de traitement des données disponibles dans Google Cloud.

En fonction de vos utilisateurs, sélectionnez le produit Google Cloud approprié. Par exemple, considérons les types d'utilisateurs suivants et les produits recommandés :

  • Les développeurs qui créent des pipelines de données d'extraction, de transformation et de chargement (ETL, extract, transform, and load) peuvent utiliser le produit d'intégration de données Cloud Data Fusion. Cloud Data Fusion dispose d'une interface utilisateur qui vous permet de déployer vos pipelines de données ELT (extraction, chargement et transformation) et ETL sans code.
  • Les équipes d'ingénieurs de données compatibles avec l'analyse d'audience peuvent utiliser Dataflow. Dataflow vous permet d'ingérer et d'analyser des sources de données par lot et en streaming à grande échelle.
  • Les analystes de données peuvent utiliser Dataprep by Trifacta, qui vous permet d'explorer, de nettoyer et de préparer visuellement des données pour l'analyse dans BigQuery.

Machine learning

Une fois que votre système ingère et traite les données, vous pouvez utiliser les options de produit Google AI Platform dans les cas suivants :

  • Analyse descriptive montrant l'incidence de la fréquence sur le taux de conversion par utilisateur et par campagne : cette information vous aide à adapter la fréquence de ciblage de vos campagnes de remarketing en fonction d'une liste spécifique d'utilisateurs. BigQuery a accès aux données brutes de Campaign Manager 360, ce qui rend ces informations disponibles.
  • Analyse prédictive de la valeur vie d'utilisateurs spécifiques : lorsque vous prédisez la valeur de groupes d'utilisateurs spécifiques, vous pouvez lancer des campagnes marketing pour augmenter les ventes. Par exemple, vous pourriez constater qu'un groupe d'utilisateurs dont l'engagement envers la marque est limité présente un potentiel d'achat élevé dès lors que l'engagement des utilisateurs est amélioré. Vous obtenez ces informations en joignant des données et en faisant appel au ML pour créer des segments de clientèle et prédire le montant de la valeur vie.
  • Analyse prescriptive des sentiments sur un produit : pour éviter les ciblages inexacts, vous pouvez analyser l'évolution des commentaires écrits et des notes. Cette analyse vous permet de prévoir comment un groupe d'utilisateurs peut recevoir un produit présentant certaines caractéristiques. Par exemple, pour prédire le sentiment, vous pouvez utiliser l'analyse des sentiments et la segmentation de la clientèle.

Avec les données marketing consolidées dans BigQuery, vous pouvez choisir un produit AI Platform adapté à vos besoins. Choisissez l'un des produits suivants en fonction de la maturité du ML et de l'ensemble de compétences de votre organisation :

  • Si votre organisation ne connaît pas le ML, vous pouvez créer et déployer des modèles de ML clients avec AutoML. Par exemple, vous pouvez utiliser AutoML Tables pour créer des modèles de régression et de classification, tels que la probabilité de perte d'utilisateurs et la valeur vie du client.
  • Si votre organisation dispose de compétences SQL, BigQuery ML vous permet d'utiliser les constructions SQL pour créer, évaluer et prédire des modèles, tels que des modèles de segmentation d'audience. Vous pouvez entraîner et déployer de nombreux modèles compatibles, et exécuter des workflows de ML sans déplacer de données depuis BigQuery.
  • Si votre organisation dispose d'une équipe de data scientists, vous pouvez utiliser Vertex AI pour créer et déployer des modèles optimisés à grande échelle. Pour obtenir un exemple d'utilisation de Vertex AI afin d'améliorer la valeur du client, consultez la page Prédire la valeur vie client avec AI Platform.

Insights et activation

Vous pouvez utiliser les options Google Cloud pour obtenir des insights à partir de données consolidées sur la publicité et le marketing. Vous pouvez ensuite renvoyer des données (telles que des segments différenciés) dans des plates-formes telles que Google Analytics et le marketing par e-mail. Google Cloud propose plusieurs méthodes pour exploiter vos données en fonction de vos besoins. Par exemple, vous pouvez récupérer vos segments différenciés dans vos canaux préférés, tels que Google Analytics ou Salesforce.

Looker pour Google Marketing Platform

Vous pouvez également examiner et partager des insights via Looker, une plate-forme d'informatique décisionnelle d'entreprise. Vous pouvez utiliser Looker pour combiner plusieurs ensembles de données, suivre le comportement des clients sur différents canaux et segmenter les clients par attributs.

Vous pouvez utiliser Looker pour générer les insights suivants :

  • Analyse du retour sur investissement (ROI) : découvrez les dépenses et les revenus générés par les campagnes.
  • Alertes : configurez des règles personnalisées pour recevoir des alertes par e-mail en cas de problèmes ou de problèmes liés aux publicités.
  • Analyse de l'attribution multicanal : identifiez les tendances du comportement des clients sur vos canaux marketing.
  • Test A/B : analysez l'impact de vos variantes sur le comportement des utilisateurs clés, en fonction de résultats statistiquement pertinents.
  • Canaux d'acquisition : suivez l'origine des nouveaux prospects et clients.
  • Analyse des cohortes : segmentez vos données et analysez le comportement des différents segments au fil du temps.

Les blocs et les actions de Looker offrent une base solide en termes d'analyses partageables pour les données Web et publicitaires Google Marketing Platform. Ces blocs et actions personnalisables offrent une exploration interactive des données, de nouvelles tranches de données incluant des prédictions de ML légères et des chemins d'activation vers Google Marketing Platform. Les chemins d'activation vous permettent d'utiliser vos données first party pour cibler efficacement des audiences.

Le schéma suivant montre comment les produits Google peuvent fonctionner avec Looker.

Fonctionnement des produits avec Looker

Le schéma montre comment Looker peut exploiter les insights de Google Analytics 4, de Google Analytics 360, de Campaign Manager 360 et de toutes les données de BigQuery pour créer des rapports "Temps réel". Vous pouvez activer des données first party à partir de Looker dans Google Marketing Platform avec Actions for Ads (via le ciblage par liste de clients) et Analytics (via l'importation de données). Les services horizontaux, tels qu'IAM, surveillent en permanence vos pipelines de données marketing.

Intégrations personnalisées

Vous pouvez également utiliser Google Cloud pour créer des intégrations personnalisées afin de transférer les données sur les plates-formes de votre choix. Par exemple, vous pouvez exécuter des requêtes programmées pour générer des listes d'audience avec vos données Analytics, puis les retransférer avec des appels d'API. Par exemple, utilisez Cloud Functions pour déclencher le transfert de données lorsqu'un nouveau segment est prêt dans Cloud Storage.

Étape suivante