Integración con TikTok
En esta página, se describen las configuraciones necesarias para incorporar datos de TikTok como fuente de datos de la carga de trabajo de marketing de Cortex Framework Data Foundation.
TikTok es una app de redes sociales popular conocida por sus videos de formato corto, de los que Cortex Framework puede obtener datos para analizar el rendimiento general del marketing. Si combinas los datos de TikTok y varias fuentes, puedes obtener una comprensión más integral de tu público objetivo y la eficacia de tus campañas en redes sociales en diferentes plataformas.
En el siguiente diagrama, se describe cómo los datos de TikTok están disponibles a través de la carga de trabajo de marketing de Cortex Framework Data Foundation:
Archivo de configuración
El archivo config.json
configura la configuración necesaria para conectarse a fuentes de datos y transferir datos desde varias cargas de trabajo. Este archivo contiene los siguientes parámetros para TikTok:
"marketing": {
"deployTikTok": true,
},
"TikTok": {
"deployCDC": true,
"datasets": {
"cdc": "",
"raw": "",
"reporting": "REPORTING_TikTok"
}
}
En la siguiente tabla, se describe el valor de cada parámetro de marketing:
Parámetro | Significado | Valor predeterminado | Descripción |
marketing.deployTikTok
|
Implementa TikTok | true
|
Ejecuta la implementación para la fuente de datos de TikTok. |
marketing.TikTok.deployCDC
|
Implementa secuencias de comandos de CDC para TikTok | true
|
Genera secuencias de comandos de procesamiento de CDC de TikTok para ejecutarlas como DAG en Cloud Composer. |
marketing.TikTok.datasets.cdc
|
Conjunto de datos de CDC para TikTok | Conjunto de datos de CDC para TikTok. | |
marketing.TikTok.datasets.raw
|
Conjunto de datos sin procesar de TikTok | Conjunto de datos sin procesar de TikTok. | |
marketing.TikTok.datasets.reporting
|
Conjunto de datos de informes de TikTok | "REPORTING_TikTok"
|
Conjunto de datos de informes de TikTok. |
Modelo de datos
En esta sección, se describe el modelo de datos de TikTok con el diagrama de relaciones de entidades (ERD).
Vistas básicas
Estos son los objetos azules del ERE y son vistas en tablas de CDC sin transformaciones, excepto algunos alias de nombres de columnas. Consulta las secuencias de comandos en src/marketing/src/TikTok/src/reporting/ddls
.
Vistas de informes
Estos son los objetos verdes del ERE y son vistas de informes que contienen métricas agregadas. Consulta las secuencias de comandos en src/marketing/src/TikTok/src/reporting/ddls
.
Conexión a la API
Cortex Framework usa las APIs de informes de TikTok, versión v1.3, como la fuente autorizada de los datos de TikTok. Cortex Framework usa el modo síncrono y llama a las APIs de Basic Reporting para recuperar métricas de rendimiento de los anuncios y los grupos de anuncios. Esto garantiza que Cortex Framework tenga acceso a información actualizada y precisa de TikTok, lo que permite generar informes y realizar análisis de datos de manera eficaz.
Para obtener más información sobre la conexión de la API, consulta APIs de TikTok Reporting.
Autenticación de cuenta
Para configurar una cuenta de TikTok y su autenticación, sigue estos pasos:
- Configura una cuenta de desarrollador de TikTok si aún no tienes una.
- Crea una app para la integración de Cortex Framework. Consulta la API de TikTok para empresas para obtener más información. Asegúrate de seleccionar los dos siguientes en los permisos de la app:
Ad Account Management/Ad Account Information
Reporting/All
- Obtén el ID de app, el secreto y el token de acceso a largo plazo como se describe en la
guía de TikTok,
y almacénalos, respectivamente, en Secret Manager
con los siguientes nombres:
- ID de la aplicación:
cortex_tiktok_app_id
- Secreto:
cortex_tiktok_app_secret
- Token de acceso a largo plazo:
cortex_tiktok_access_token
- ID de la aplicación:
Actualización y demora de los datos
Como regla general, la actualización de los datos de las fuentes de datos de Cortex Framework se limita a lo que permite la conexión upstream, así como a la frecuencia de la ejecución de tu DAG. Ajusta la frecuencia de ejecución de tu DAG para alinearla con la frecuencia upstream, las restricciones de recursos y las necesidades de tu empresa.
Con la API de marketing de TikTok, la mayoría de los datos (excepto las conversiones) están disponibles casi en tiempo real.
Conexiones de Cloud Composer
Crea las siguientes conexiones en Cloud Composer. Para obtener más detalles, consulta la documentación sobre cómo administrar las conexiones de Airflow.
Nombre de la conexión | Purpose |
tiktok_raw_dataflow
|
Para la API de TikTok > Conjunto de datos sin procesar de BigQuery |
tiktok_cdc_bq
|
Para Conjunto de datos sin procesar > Transferencia de conjuntos de datos de CDC |
tiktok_reporting_bq
|
Para el conjunto de datos de los CDC > Transferencia de conjuntos de datos de informes |
Permisos de la cuenta de servicio de Cloud Composer
Otorga permisos de Dataflow a la cuenta de servicio que se usa en
Cloud Composer (como se configuró en la conexión tiktok_raw_dataflow
).
Consulta las instrucciones en la documentación de Dataflow.
Además, la misma cuenta de servicio también debe tener acceso al descriptor de acceso de Secret Manager.
Configuración de transferencia
Controla las canalizaciones de datos de Source to Raw
y Raw to CDC
a través de la configuración
del archivo src/TikTok/config/ingestion_settings.yaml
. En esta sección, se describen los parámetros de cada canalización de datos.
De fuente a tablas sin procesar
Esta sección tiene entradas que controlan cómo se recuperan los datos de TikTok y dónde terminan en el conjunto de datos sin procesar. Cada entrada corresponde a una tabla sin procesar que tiene datos recuperados de la API de TikTok para esa entidad. En función de estos parámetros de configuración, Cortex Framework crea DAG de Airflow que ejecutan canalizaciones de Dataflow para procesar datos de las APIs de TikTok.
Los siguientes parámetros controlan la configuración de Source to Raw
para cada entrada:
Parámetro | Descripción |
base_table
|
Es la tabla del conjunto de datos sin procesar en la que se almacenan los datos de una entidad(por ejemplo, los datos de "Anuncio"). |
load_frequency
|
La frecuencia con la que se ejecuta un DAG para que esta entidad procese los datos Consulta la documentación de Airflow para obtener detalles sobre los valores posibles. |
schema_file
|
Es un archivo de esquema en el directorio src/table_schema que asigna los campos de respuesta de la API a los nombres de las columnas de la tabla de destino.
|
partition_details
|
Opcional: Si deseas que esta tabla se particione por motivos de rendimiento. Para obtener más información, consulta Partición de tablas. |
cluster_details
|
Opcional: Si deseas que esta tabla se agrupe por motivos de rendimiento. Para obtener más información, consulta Configuración del clúster. |
De tablas sin procesar a tablas de CDC
Esta sección tiene entradas que controlan cómo se mueven los datos de las tablas sin procesar a las tablas de CDC. Cada entrada corresponde a una tabla de CDC (que, a su vez, corresponde a una entidad mencionada para Source to Raw table
).
Los siguientes parámetros controlan la configuración de Raw to CDC
para cada entrada:
Parámetro | Descripción |
base_table
|
Es la tabla del conjunto de datos de CDC en la que se almacenan los datos sin procesar después de la transformación de CDC (por ejemplo,auction_ad_performance ).
|
load_frequency
|
La frecuencia con la que se ejecuta un DAG para esta entidad para propagar la tabla de CDC. Para obtener más información, consulta la documentación de Airflow y obtén detalles sobre los valores posibles. |
row_identifiers
|
Es una lista de columnas (separadas por comas) que forman un registro único para esta tabla. |
partition_details
|
Opcional: Si deseas que esta tabla se particione por motivos de rendimiento. Para obtener más información, consulta Partición de tablas. |
cluster_details
|
Opcional: Si deseas que esta tabla se agrupe por motivos de rendimiento. Para obtener más información, consulta Configuración del clúster. |
Configuración de informes
Configura y controla cómo Cortex Framework genera datos para la capa de informes final de TikTok con el archivo de configuración de informessrc/TikTok/config/reporting_settings.yaml
.
Este archivo controla cómo se generan los objetos de BigQuery de la capa de informes (tablas, vistas, funciones o procedimientos almacenados).
Para obtener más información, consulta Cómo personalizar el archivo de configuración de informes.
Próximos pasos
- Para obtener más información sobre otras fuentes de datos y cargas de trabajo, consulta Fuentes de datos y cargas de trabajo.
- Para obtener más información sobre los pasos para la implementación en entornos de producción, consulta los requisitos previos para la implementación de Data Foundation de Cortex Framework.