Integración con Google Ads
En esta página, se describen las configuraciones necesarias para incorporar datos de Google Ads como fuente de datos de la carga de trabajo de marketing de Cortex Framework Data Foundation.
Google Ads es una plataforma publicitaria en línea que permite a las empresas promocionar sus productos o servicios en varias propiedades de Google. Cortex Framework combina tus datos de Google Ads con otros canales de marketing, los analiza de forma integral y usa la IA para mejorar los resultados de tus campañas.
En el siguiente diagrama, se describe cómo los datos de Google Ads están disponibles a través de la carga de trabajo de marketing de Cortex Framework Data Foundation:
Archivo de configuración
El archivo config.json
configura los parámetros necesarios para transferir datos desde cualquier fuente de datos, incluido Google Ads. Este archivo contiene los siguientes parámetros para Google Ads:
"marketing": {
"deployGoogleAds": true,
"GoogleAds": {
"deployCDC": true,
"lookbackDays": 180,
"datasets": {
"cdc": "",
"raw": "",
"reporting": "REPORTING_GoogleAds"
}
}
}
En la siguiente tabla, se describe el valor de cada parámetro de marketing de Google Ads:
Parámetro | Significado | Valor predeterminado | Descripción |
marketing.deployGoogleAds
|
Implementa Google Ads | true
|
Ejecuta la implementación de la fuente de datos de Google Ads. |
marketing.GoogleAds.deployCDC
|
Implementa la CDC para Google Ads | true
|
Genera secuencias de comandos de procesamiento de CDC de Google Ads para ejecutarlas como DAG en Cloud Composer. |
marketing.GoogleAds.lookbackDays
|
Días de visualización para Google Ads | 180
|
Es la cantidad de días para comenzar a recuperar datos de la API de Google Ads. |
marketing.GoogleAds.datasets.cdc
|
Conjunto de datos del CDC para Google Ads | Conjunto de datos del CDC para Google Ads. | |
marketing.GoogleAds.datasets.raw
|
Conjunto de datos sin procesar para Google Ads | Es el conjunto de datos sin procesar de Google Ads. | |
marketing.GoogleAds.datasets.reporting
|
Conjunto de datos de informes de Google Ads | "REPORTING_GoogleAds"
|
Es el conjunto de datos de informes de Google Ads. |
Modelo de datos
En esta sección, se describe el modelo de datos de Google Ads con el diagrama de relaciones de entidades (ERD).
Vistas básicas
Estos son los objetos azules del ERE y son vistas en tablas de CDC sin transformaciones, excepto algunos alias de nombres de columnas. Consulta las secuencias de comandos en src/marketing/src/GoogleAds/src/reporting/ddls
.
Vistas de informes
Estos son los objetos verdes del ERE y son vistas de informes que contienen métricas agregadas. Consulta las secuencias de comandos en src/marketing/src/GoogleAds/src/reporting/ddls
.
Conexión a la API
Las plantillas de transferencia de Cortex Framework usan la API de Google Ads para recuperar atributos y métricas de informes de Google Ads. Las plantillas actuales de Cortex Framework usan la versión 17.1 de la API de Google Ads. Ten en cuenta las siguientes limitaciones de la API de Google Ads:
- Operaciones de acceso básicas por día: 15,000 (no se cuentan las solicitudes paginadas que contienen un
next_page_token
válido). - Tamaño máximo de página: 10,000 filas por página.
- Parámetros predeterminados recomendados: El tamaño de la página es igual a 10,000 filas por página.
Para obtener más información sobre la conexión de la API, consulta la documentación de la API de Google Ads.
Autenticación de cuenta
Sigue estos pasos para configurar la autenticación de la cuenta:
- En la consola de Google Cloud, haz clic en Menú de navegación > API y servicios > Credenciales > Crear credenciales.
Crea una credencial de ID de cliente de OAuth con las siguientes características. Para obtener más información, consulta Usa OAuth 2.0 para acceder a las APIs de Google.
Application type: "Web Application" Name: CHOSEN_NAME #(For example,"Cortex Authentication Client"). Authorized redirect URIs: http://127.0.0.1
Reemplaza
CHOSEN_NAME
por el nombre que elegiste para la cuenta de credenciales del ID de cliente de OAuth.Guarda
Client ID
yClient secret
después de configurar la credencial. La necesitarás más tarde.Genera un token nuevo con OAuth 2.0 para acceder a las APIs de Google. Cortex Data Foundation detecta e incorpora automáticamente los datos de todos los clientes (cuentas) a los que pueden acceder las credenciales que se usan para generar el token.
Crea un secreto con Secret Manager:
- En la consola de Google Cloud, haz clic en Secret Manager.
- Crea un secreto llamado
cortex-framework-google-ads-yaml
con el siguiente formato y cambia los valores según tu configuración:
{"developer_token": "DEVELOPER_TOKEN_VALUE", "refresh_token": "REFRESH_TOKEN_VALUE", "client_id": "CLIENT_ID_VALUE", "client_secret": "CLIENT_SECRET_VALUE", "use_proto_plus": False}
Reemplaza lo siguiente:
DEVELOPER_TOKEN_VALUE
con el valor del token de desarrollador disponible en la cuenta de Google Ads.REFRESH_TOKEN_VALUE
por el valor del token de actualización que obtuviste en el paso 4.CLIENT_ID_VALUE
con el valor de ID de cliente que se obtuvo en la configuración de OAuth del paso 2.CLIENT_SECRET_VALUE
con el valor del secreto del cliente que se obtuvo de la configuración de OAuth en el paso 2.
Actualización y demora de los datos
Como regla general, la actualización de los datos de las fuentes de datos de Cortex Framework se limita a lo que permite la conexión upstream, así como a la frecuencia de la ejecución de tu DAG. Ajusta la frecuencia de ejecución de tu DAG para alinearla con la frecuencia upstream, las restricciones de recursos y las necesidades de tu empresa.
Los datos recuperados con la API de Google Ads generalmente están disponibles con una latencia de más de 3 horas. Es posible que se ajusten más adelante debido a las conversiones y a la detección de tráfico no válido. Para obtener más información, consulta el siguiente artículo Acerca de la actualización de los datos en el Centro de ayuda de Google Ads.
Permisos de conexiones de Cloud Composer
Crea las siguientes conexiones en Cloud Composer. Consulta más detalles en la documentación para administrar conexiones de Airflow.
Nombre de la conexión | Purpose |
googleads_raw_dataflow
|
Para la API de Google Ads, ve a > Conjunto de datos sin procesar de BigQuery. |
googleads_cdc_bq
|
Para conjunto de datos sin procesar > Transferencia de conjunto de datos de CDC. |
googleads_reporting_bq
|
Para el conjunto de datos de CDC > Transferencia de conjuntos de datos de informes. |
Permisos de la cuenta de servicio de Cloud Composer
Otorga permisos de Dataflow a la cuenta de servicio que se usa en
Cloud Composer (como se configuró en la conexión googleads_raw_dataflow
). Consulta las instrucciones en la documentación de Dataflow.
Configuración de transferencia
Controla las canalizaciones de datos Source to Raw
y Raw to CDC
a través de la configuración del archivo src/GoogleAds/config/ingestion_settings.yaml
. En esta sección, se describen los parámetros de cada canalización de datos.
De fuente a tablas sin procesar
En esta sección, se describe qué entidades recuperan las APIs y cómo. Cada entrada corresponde a una entidad de Google Ads. En función de esta configuración, Cortex crea DAG de Airflow que ejecutan canalizaciones de Dataflow para recuperar datos con las APIs de Google Ads.
Los siguientes parámetros controlan la configuración de Source to Raw
para cada entrada:
Parámetro | Descripción |
load_frequency
|
La frecuencia con la que se ejecuta un DAG para esta entidad para recuperar datos de Google Ads. Para obtener más información sobre los valores posibles, consulta la documentación de Airflow. |
api_name
|
Nombre del recurso de API (por ejemplo, customer )
|
table_name
|
Es la tabla del conjunto de datos sin procesar en la que se almacenan los datos recuperados (por ejemplo, customer ).
|
schema_file
|
Es un archivo de esquema en el directorio src/table_schema que asigna los campos de respuesta de la API a los nombres de las columnas de la tabla de destino.
|
key
|
Son las columnas (separadas por comas) que forman un registro único para esta tabla. |
is_metrics_table
|
Indica si una entrada determinada es para una entidad de métrica (en la API de Google Ads). El sistema trata esas tablas de manera un poco diferente debido a su naturaleza agregada. |
partition_details
|
Opcional: Si deseas que esta tabla se particione por motivos de rendimiento. Para obtener más información, consulta Partición de tablas. |
cluster_details
|
Opcional: Si deseas que esta tabla se agrupe por motivos de rendimiento. Para obtener más información, consulta Configuración del clúster. |
De tablas sin procesar a tablas de CDC
En esta sección, se describe qué entradas controlan cómo se mueven los datos de las tablas sin procesar a las tablas de CDC. Cada entrada corresponde a una tabla sin procesar (que, a su vez, corresponde a la entidad de la API de Google Ads, como se mencionó).
Los siguientes parámetros controlan la configuración de Raw to CDC
para cada entrada:
Parámetro | Descripción |
table_name
|
Es la tabla del conjunto de datos de CDC en la que se almacenan los datos sin procesar después de la transformación de CDC (por ejemplo, customer ).
|
raw_table
|
Es la tabla en la que se replicaron los datos sin procesar. |
key
|
Son las columnas (separadas por comas) que forman un registro único para esta tabla. |
load_frequency
|
La frecuencia con la que se ejecuta un DAG para esta entidad para propagar la tabla de CDC Para obtener más información sobre los valores posibles, consulta la documentación de Airflow. |
schema_file
|
Es un archivo de esquema en el directorio src/table_schema que asigna columnas sin procesar a columnas de CDC y el tipo de datos de la columna de CDC.
Este es el mismo archivo de esquema al que se hace referencia en la sección anterior.
|
partition_details
|
Opcional: Si deseas que esta tabla se particione por motivos de rendimiento. Para obtener más información, consulta Partición de tablas. |
cluster_details
|
Opcional: Si deseas que esta tabla se agrupe por motivos de rendimiento. Para obtener más información, consulta Configuración del clúster. |
Configuración de informes
Puedes configurar y controlar cómo Cortex Framework genera datos para la capa de informes final de Google Ads con el archivo de configuración de informes src/GoogleAds/config/reporting_settings.yaml
.
Este archivo controla cómo se generan los objetos de BigQuery de la capa de informes (tablas, vistas,funciones o procedimientos almacenados).
Para obtener más información, consulta Cómo personalizar el archivo de configuración de informes.
Próximos pasos
- Para obtener más información sobre otras fuentes de datos y cargas de trabajo, consulta Fuentes de datos y cargas de trabajo.
- Para obtener más información sobre los pasos para la implementación en entornos de producción, consulta los requisitos previos para la implementación de Data Foundation de Cortex Framework.