Intégration à TikTok

Cette page décrit les configurations requises pour importer des données TikTok en tant que source de données de la charge de travail marketing de Cortex Framework Data Foundation.

TikTok est une application de réseau social populaire connue pour ses vidéos courtes. Cortex Framework peut fournir des données pour analyser les performances marketing globales. En combinant les données de TikTok et de diverses sources, vous pouvez mieux comprendre votre audience cible et l'efficacité de vos campagnes sur les réseaux sociaux sur différentes plates-formes.

Le diagramme suivant décrit comment les données TikTok sont disponibles via la charge de travail marketing de Cortex Framework Data Foundation:

Source de données TikTok

Figure 1 Source de données TikTok

Fichier de configuration

Le fichier config.json configure les paramètres requis pour se connecter aux sources de données afin de transférer des données à partir de différentes charges de travail. Ce fichier contient les paramètres suivants pour TikTok:

   "marketing": {
        "deployTikTok": true,
        },
        "TikTok": {
            "deployCDC": true,
            "datasets": {
                "cdc": "",
                "raw": "",
                "reporting": "REPORTING_TikTok"
            }
        }

Le tableau suivant décrit la valeur de chaque paramètre marketing:

Paramètre Signification Valeur par défaut Description
marketing.deployTikTok Déployer TikTok true Exécutez le déploiement pour la source de données TikTok.
marketing.TikTok.deployCDC Déployer des scripts CDC pour TikTok true Générez des scripts de traitement CDC TikTok à exécuter en tant que DAG dans Cloud Composer.
marketing.TikTok.datasets.cdc Ensemble de données du CDC pour TikTok Ensemble de données du CDC pour TikTok.
marketing.TikTok.datasets.raw Ensemble de données brut pour TikTok Ensemble de données brut pour TikTok.
marketing.TikTok.datasets.reporting Ensemble de données de reporting pour TikTok "REPORTING_TikTok" Ensemble de données de reporting pour TikTok.

Modèle de données

Cette section décrit le modèle de données TikTok à l'aide du diagramme des relations entre entités (ERD).

Diagramme des relations entre les entités pour TikTok

Figure 2 TikTok: diagramme des relations entre les entités.

Vues de base

Il s'agit des objets bleus de l'ERD. Il s'agit de vues sur les tables CDC sans autre transformation que certains alias de nom de colonne. Consultez les scripts dans src/marketing/src/TikTok/src/reporting/ddls.

Vues de rapports

Il s'agit des objets verts de l'ERD. Il s'agit de vues de rapports contenant des métriques agrégées. Consultez les scripts dans src/marketing/src/TikTok/src/reporting/ddls.

Connexion à l'API

Cortex Framework utilise les API de création de rapports TikTok, version v1.3, comme source officielle des données TikTok. Cortex Framework utilise le mode synchrone et appelle les API Basic Reporting pour récupérer les métriques de performances des annonces et des groupes d'annonces. Cela garantit que Cortex Framework a accès à des informations à jour et précises provenant de TikTok, ce qui permet d'effectuer une analyse et des rapports efficaces sur les données.

Pour en savoir plus sur la connexion des API, consultez les API TikTok Reporting.

Authentification du compte

Pour configurer un compte TikTok et son authentification, procédez comme suit:

  1. Configurez un compte de développeur TikTok si vous n'en avez pas déjà un.
  2. Créez une application pour l'intégration de Cortex Framework. Pour en savoir plus, consultez la page API TikTok pour les entreprises. Assurez-vous de sélectionner les deux éléments suivants dans les champs d'application :
    • Ad Account Management/Ad Account Information
    • Reporting/All
  3. Obtenez l'ID de l'application, le secret et le jeton d'accès à long terme comme décrit dans le guide TikTok, puis stockez-les respectivement dans Secret Manager avec les noms suivants :
    • ID de l'application: cortex_tiktok_app_id
    • Secret: cortex_tiktok_app_secret
    • Jeton d'accès à long terme: cortex_tiktok_access_token

Fraîcheur des données et délai

En règle générale, la fraîcheur des données pour les sources de données Cortex Framework est limitée par ce que la connexion en amont permet, ainsi que par la fréquence d'exécution de votre DAG. Ajustez la fréquence d'exécution de votre DAG pour l'aligner sur la fréquence en amont, les contraintes de ressources et vos besoins métier.

Avec l'API TikTok Marketing, la plupart des données (à l'exception des conversions) sont disponibles presque en temps réel.

Connexions Cloud Composer

Créez les connexions suivantes dans Cloud Composer. Pour en savoir plus, consultez la documentation sur la gestion des connexions Airflow.

Nom de la connexion Purpose
tiktok_raw_dataflow Pour l'API TikTok > Ensemble de données brut BigQuery
tiktok_cdc_bq Pour "Ensemble de données brut" > "Transfert d'ensemble de données CDC"
tiktok_reporting_bq Pour l'ensemble de données CDC : > Transfert de l'ensemble de données de reporting

Autorisations du compte de service Cloud Composer

Accordez des autorisations Dataflow au compte de service utilisé dans Cloud Composer (comme configuré dans la connexion tiktok_raw_dataflow). Consultez les instructions de la documentation Dataflow.

De plus, le même compte de service doit également disposer d'un accès "Accesseur de secrets du gestionnaire de secrets".

Paramètres d'ingestion

Contrôlez les pipelines de données Source to Raw et Raw to CDC via les paramètres du fichier src/TikTok/config/ingestion_settings.yaml. Cette section décrit les paramètres de chaque pipeline de données.

Source des tables brutes

Cette section contient des entrées qui contrôlent la façon dont les données TikTok sont extraites et où elles se retrouvent dans l'ensemble de données brut. Chaque entrée correspond à une table brute contenant des données extraites de l'API TikTok pour cette entité. Sur la base de ces paramètres de configuration, Cortex Framework crée des DAG Airflow qui exécutent des pipelines Dataflow pour traiter les données des API TikTok.

Les paramètres suivants contrôlent les paramètres de Source to Raw pour chaque entrée:

Paramètre Description
base_table Table de l'ensemble de données brut dans laquelle les données d'une entité sont stockées(par exemple, les données "Annonce").
load_frequency Fréquence d'exécution d'un DAG pour cette entité afin de traiter les données. Pour en savoir plus sur les valeurs possibles, consultez la documentation Airflow.
schema_file Fichier de schéma dans le répertoire src/table_schema qui met en correspondance les champs de réponse de l'API avec les noms de colonnes de la table de destination.
partition_details Facultatif:indiquez si vous souhaitez que ce tableau soit partitionné pour des raisons de performances. Pour en savoir plus, consultez la section Partitionnement de table.
cluster_details Facultatif:indiquez si vous souhaitez que ce tableau soit regroupé pour des raisons de performances. Pour en savoir plus, consultez la section Paramètres du cluster.

Tables brutes vers CDC

Cette section contient des entrées qui contrôlent le transfert des données des tables brutes vers les tables CDC. Chaque entrée correspond à une table CDC (qui à son tour correspond à une entité mentionnée pour Source to Raw table).

Les paramètres suivants contrôlent les paramètres de Raw to CDC pour chaque entrée:

Paramètre Description
base_table Table de l'ensemble de données CDC dans laquelle les données brutes après la transformation CDC sont stockées (par exemple,auction_ad_performance)
load_frequency Fréquence d'exécution d'un DAG pour cette entité afin de renseigner la table CDC. Pour en savoir plus, consultez la documentation Airflow pour connaître les valeurs possibles.
row_identifiers Liste des colonnes (séparées par une virgule) qui constituent un enregistrement unique pour cette table.
partition_details Facultatif:indiquez si vous souhaitez que ce tableau soit partitionné pour des raisons de performances. Pour en savoir plus, consultez la section Partitionnement de table.
cluster_details Facultatif:indiquez si vous souhaitez que ce tableau soit regroupé pour des raisons de performances. Pour en savoir plus, consultez la section Paramètres du cluster.

Paramètres de création de rapports

Configurez et contrôlez la façon dont Cortex Framework génère des données pour la couche de reporting finale TikTok à l'aide du fichier de paramètres de reportingsrc/TikTok/config/reporting_settings.yaml. Ce fichier contrôle la génération des objets BigQuery de la couche de reporting (tables, vues, fonctions ou procédures stockées).

Pour en savoir plus, consultez Personnaliser le fichier de paramètres de création de rapports.

Étape suivante