Integración con Google Ads
En esta página se describen las configuraciones necesarias para importar datos de Google Ads como fuente de datos de la carga de trabajo de marketing de Cortex Framework Data Foundation.
Google Ads es una plataforma publicitaria online que permite a las empresas anunciar sus productos o servicios en varias propiedades de Google. Cortex Framework combina tus datos de Google Ads con los de otros canales de marketing, los analiza de forma exhaustiva y usa la IA para mejorar los resultados de tus campañas.
En el siguiente diagrama se describe cómo se puede acceder a los datos de Google Ads a través de la carga de trabajo de marketing de la base de datos de Cortex Framework:
Archivo de configuración
El archivo config.json
configura los ajustes necesarios para transferir datos desde cualquier fuente de datos, incluido Google Ads. Este archivo contiene los siguientes parámetros de Google Ads:
"marketing": {
"deployGoogleAds": true,
"GoogleAds": {
"deployCDC": true,
"lookbackDays": 180,
"datasets": {
"cdc": "",
"raw": "",
"reporting": "REPORTING_GoogleAds"
}
}
}
En la siguiente tabla se describe el valor de cada parámetro de marketing de Google Ads:
Parámetro | Significado | Valor predeterminado | Descripción |
marketing.deployGoogleAds
|
Implementar Google Ads | true
|
Ejecute la implementación de la fuente de datos de Google Ads. |
marketing.GoogleAds.deployCDC
|
Implementar CDC para Google Ads | true
|
Genera secuencias de comandos de procesamiento de CDC de Google Ads para ejecutarlas como DAGs en Cloud Composer. |
marketing.GoogleAds.lookbackDays
|
Días para analizar de Google Ads | 180
|
Número de días que deben transcurrir para empezar a obtener datos de la API de Google Ads. |
marketing.GoogleAds.datasets.cdc
|
Conjunto de datos de CDC para Google Ads | Conjunto de datos de CDC para Google Ads. | |
marketing.GoogleAds.datasets.raw
|
Conjunto de datos sin procesar de Google Ads | Conjunto de datos sin procesar de Google Ads. | |
marketing.GoogleAds.datasets.reporting
|
Conjunto de datos de informes de Google Ads | "REPORTING_GoogleAds"
|
Conjunto de datos de informes de Google Ads. |
Modelo de datos
En esta sección se describe el modelo de datos de Google Ads mediante el diagrama de relaciones entre entidades (DRE).
Vistas básicas
Son los objetos azules del diagrama ER y son vistas de tablas de CDC sin transformaciones, salvo algunos alias de nombres de columna. Consulta las secuencias de comandos en src/marketing/src/GoogleAds/src/reporting/ddls
.
Vistas de informes
Son los objetos verdes del diagrama ER y son vistas de informes que contienen métricas agregadas. Consulta las secuencias de comandos en src/marketing/src/GoogleAds/src/reporting/ddls
.
Conexión a la API
Las plantillas de ingestión de Cortex Framework usan la API de Google Ads para obtener atributos e métricas de informes de Google Ads. Las plantillas actuales de Cortex Framework usan la versión 17.1 de la API de Google Ads. Ten en cuenta las limitaciones de la API de Google Ads:
- Operaciones de acceso básicas al día: 15.000 (las solicitudes paginadas que contienen un
next_page_token
válido no se tienen en cuenta). - Tamaño máximo de página: 10.000 filas por página.
- Parámetros predeterminados recomendados: el tamaño de página es de 10.000 filas por página.
Para obtener más información sobre la conexión de la API, consulta la documentación de la API de Google Ads.
Autenticación de cuenta
Sigue estos pasos para configurar la autenticación de la cuenta:
- En la Google Cloud consola, haz clic en Menú de navegación > APIs y servicios > Credenciales > Crear credenciales.
Crea una credencial de ID de cliente de OAuth con las siguientes características. Para obtener más información, consulta el artículo sobre cómo usar OAuth 2.0 para acceder a las APIs de Google.
Application type: "Web Application" Name: CHOSEN_NAME #(For example,"Cortex Authentication Client"). Authorized redirect URIs: http://127.0.0.1
Sustituye
CHOSEN_NAME
por el nombre que hayas elegido para la cuenta de credenciales de ID de cliente de OAuth.Guarda el
Client ID
y elClient secret
después de configurar la credencial. Necesitarás estos datos más adelante.Genera un token nuevo con OAuth 2.0 Access Google APIs. Cortex Data Foundation detecta e ingiere automáticamente los datos de todos los clientes (cuentas) a los que se puede acceder con las credenciales usadas para generar el token.
Crea un secreto con Secret Manager:
- En la Google Cloud consola, haz clic en Secret Manager.
- Crea un secreto llamado
cortex-framework-google-ads-yaml
con el siguiente formato y cambia los valores según tu configuración:
{"developer_token": "DEVELOPER_TOKEN_VALUE", "refresh_token": "REFRESH_TOKEN_VALUE", "client_id": "CLIENT_ID_VALUE", "client_secret": "CLIENT_SECRET_VALUE", "use_proto_plus": False}
Haz los cambios siguientes:
DEVELOPER_TOKEN_VALUE
con el valor del token de desarrollador disponible en la cuenta de Google Ads.REFRESH_TOKEN_VALUE
con el valor del token de actualización obtenido en el paso 4.CLIENT_ID_VALUE
con el valor del ID de cliente obtenido en la configuración de OAuth del paso 2.CLIENT_SECRET_VALUE
con el valor del secreto de cliente obtenido de la configuración de OAuth en el paso 2.
Actualización y latencia de los datos
Por lo general, la actualización de los datos de las fuentes de datos de Cortex Framework está limitada por lo que permite la conexión ascendente, así como por la frecuencia de ejecución de tu DAG. Ajusta la frecuencia de ejecución de tu DAG para que se ajuste a la frecuencia de los elementos anteriores, las restricciones de recursos y las necesidades de tu empresa.
Los datos obtenidos mediante la API de Google Ads suelen estar disponibles con una latencia de 3 horas o más. Es posible que se ajusten posteriormente debido a las conversiones y a la detección de tráfico no válido. Para obtener más información, consulte el artículo Acerca de la actualización de los datos del Centro de Ayuda de Google Ads.
Permisos de conexiones de Cloud Composer
Crea las siguientes conexiones en Cloud Composer. Para obtener más información, consulta la documentación sobre cómo gestionar conexiones de Airflow.
Nombre de la conexión | Purpose |
googleads_raw_dataflow
|
Para la API Google Ads > Conjunto de datos sin procesar de BigQuery. |
googleads_cdc_bq
|
En Conjunto de datos sin procesar > Transferencia de conjunto de datos de CDC. |
googleads_reporting_bq
|
Para el conjunto de datos de CDC > conjunto de datos de informes transferencia. |
Permisos de la cuenta de servicio de Cloud Composer
Concede permisos de Dataflow a la cuenta de servicio utilizada en Cloud Composer (tal como se configura en la googleads_raw_dataflow
conexión). Consulta las instrucciones en la documentación de Dataflow.
Configuración de ingestión
Controla las canalizaciones de datos Source to Raw
y Raw to CDC
mediante los ajustes del archivo src/GoogleAds/config/ingestion_settings.yaml
. En esta sección se describen los parámetros de cada canalización de datos.
De las fuentes a las tablas sin procesar
En esta sección se describe qué entidades obtienen las APIs y cómo. Cada entrada corresponde a una entidad de Google Ads. Según esta configuración, Cortex crea DAGs de Airflow que ejecutan las canalizaciones de Dataflow para obtener datos mediante las APIs de Google Ads.
Los siguientes parámetros controlan los ajustes de Source to Raw
de cada entrada:
Parámetro | Descripción |
load_frequency
|
La frecuencia con la que se ejecuta un DAG de esta entidad para obtener datos de Google Ads. Para obtener más información sobre los valores posibles, consulta la documentación de Airflow. |
api_name
|
Nombre del recurso de la API (por ejemplo, customer ).
|
table_name
|
Tabla del conjunto de datos sin procesar en la que se almacenan los datos obtenidos (por ejemplo, customer ).
|
schema_file
|
Archivo de esquema en el directorio src/table_schema
que asigna los campos de respuesta de la API a los nombres de las columnas de la tabla de destino.
|
key
|
Columnas (separadas por comas) que forman un registro único para esta tabla. |
is_metrics_table
|
Indica si una entrada determinada corresponde a una entidad de métrica (en la API de Google Ads). El sistema trata estas tablas de forma ligeramente diferente debido a la naturaleza agregada de las mismas. |
partition_details
|
Opcional: si quieres que esta tabla se particione por motivos de rendimiento. Para obtener más información, consulta Partición de tablas. |
cluster_details
|
Opcional: si quiere que esta tabla se agrupe por motivos de rendimiento. Para obtener más información, consulta Configuración del clúster. |
Tablas de datos sin procesar a tablas de CDC
En esta sección se describe qué entradas controlan cómo se mueven los datos de las tablas sin procesar a las tablas de CDC. Cada entrada se corresponde con una tabla sin procesar (que, a su vez, se corresponde con una entidad de la API de Google Ads, como se ha mencionado).
Los siguientes parámetros controlan los ajustes de Raw to CDC
de cada entrada:
Parámetro | Descripción |
table_name
|
Tabla del conjunto de datos de CDC en la que se almacenan los datos sin procesar después de la transformación de CDC (por ejemplo, customer ).
|
raw_table
|
Tabla en la que se han replicado los datos sin procesar. |
key
|
Columnas (separadas por comas) que forman un registro único en esta tabla. |
load_frequency
|
Con qué frecuencia se ejecuta un DAG para esta entidad para rellenar la tabla de CDC. Para obtener más información sobre los valores posibles, consulta la documentación de Airflow. |
schema_file
|
Archivo de esquema en el directorio src/table_schema
que asigna columnas sin procesar a columnas de CDC y al tipo de datos de la columna de CDC.
Este es el mismo archivo de esquema al que se hace referencia en la sección anterior.
|
partition_details
|
Opcional: si quieres que esta tabla se particione por motivos de rendimiento. Para obtener más información, consulta Partición de tablas. |
cluster_details
|
Opcional: si quiere que esta tabla se agrupe por motivos de rendimiento. Para obtener más información, consulta Configuración del clúster. |
Configuración de informes
Puede configurar y controlar cómo genera Cortex Framework los datos de la capa de informes finales de Google Ads mediante el archivo de configuración de informes src/GoogleAds/config/reporting_settings.yaml
.
Este archivo controla cómo se generan los objetos de BigQuery de la capa de informes (tablas, vistas,funciones o procedimientos almacenados).
Para obtener más información, consulte Personalizar el archivo de configuración de informes.
Siguientes pasos
- Para obtener más información sobre otras fuentes de datos y cargas de trabajo, consulta el artículo Fuentes de datos y cargas de trabajo.
- Para obtener más información sobre los pasos para la implementación en entornos de producción, consulta los requisitos previos para la implementación de Data Foundation de Cortex Framework.