Integración con Google Ads

En esta página se describen las configuraciones necesarias para importar datos de Google Ads como fuente de datos de la carga de trabajo de marketing de Cortex Framework Data Foundation.

Google Ads es una plataforma publicitaria online que permite a las empresas anunciar sus productos o servicios en varias propiedades de Google. Cortex Framework combina tus datos de Google Ads con los de otros canales de marketing, los analiza de forma exhaustiva y usa la IA para mejorar los resultados de tus campañas.

En el siguiente diagrama se describe cómo se puede acceder a los datos de Google Ads a través de la carga de trabajo de marketing de la base de datos de Cortex Framework:

Fuente de datos de Google Ads

Imagen 1. Fuente de datos de Google Ads.

Archivo de configuración

El archivo config.json configura los ajustes necesarios para transferir datos desde cualquier fuente de datos, incluido Google Ads. Este archivo contiene los siguientes parámetros de Google Ads:

  "marketing": {
          "deployGoogleAds": true,
          "GoogleAds": {
              "deployCDC": true,
              "lookbackDays": 180,
              "datasets": {
                  "cdc": "",
                  "raw": "",
                  "reporting": "REPORTING_GoogleAds"
                    }
                  }
                 }

En la siguiente tabla se describe el valor de cada parámetro de marketing de Google Ads:

Parámetro Significado Valor predeterminado Descripción
marketing.deployGoogleAds Implementar Google Ads true Ejecute la implementación de la fuente de datos de Google Ads.
marketing.GoogleAds.deployCDC Implementar CDC para Google Ads true Genera secuencias de comandos de procesamiento de CDC de Google Ads para ejecutarlas como DAGs en Cloud Composer.
marketing.GoogleAds.lookbackDays Días para analizar de Google Ads 180 Número de días que deben transcurrir para empezar a obtener datos de la API de Google Ads.
marketing.GoogleAds.datasets.cdc Conjunto de datos de CDC para Google Ads Conjunto de datos de CDC para Google Ads.
marketing.GoogleAds.datasets.raw Conjunto de datos sin procesar de Google Ads Conjunto de datos sin procesar de Google Ads.
marketing.GoogleAds.datasets.reporting Conjunto de datos de informes de Google Ads "REPORTING_GoogleAds" Conjunto de datos de informes de Google Ads.

Modelo de datos

En esta sección se describe el modelo de datos de Google Ads mediante el diagrama de relaciones entre entidades (DRE).

Diagrama de relaciones entre entidades de Google Ads

Imagen 2. Google Ads: diagrama de relaciones entre entidades.

Vistas básicas

Son los objetos azules del diagrama ER y son vistas de tablas de CDC sin transformaciones, salvo algunos alias de nombres de columna. Consulta las secuencias de comandos en src/marketing/src/GoogleAds/src/reporting/ddls.

Vistas de informes

Son los objetos verdes del diagrama ER y son vistas de informes que contienen métricas agregadas. Consulta las secuencias de comandos en src/marketing/src/GoogleAds/src/reporting/ddls.

Conexión a la API

Las plantillas de ingestión de Cortex Framework usan la API de Google Ads para obtener atributos e métricas de informes de Google Ads. Las plantillas actuales de Cortex Framework usan la versión 17.1 de la API de Google Ads. Ten en cuenta las limitaciones de la API de Google Ads:

  • Operaciones de acceso básicas al día: 15.000 (las solicitudes paginadas que contienen un next_page_token válido no se tienen en cuenta).
  • Tamaño máximo de página: 10.000 filas por página.
  • Parámetros predeterminados recomendados: el tamaño de página es de 10.000 filas por página.

Para obtener más información sobre la conexión de la API, consulta la documentación de la API de Google Ads.

Autenticación de cuenta

Sigue estos pasos para configurar la autenticación de la cuenta:

  1. En la Google Cloud consola, haz clic en Menú de navegación > APIs y servicios > Credenciales > Crear credenciales.
  2. Crea una credencial de ID de cliente de OAuth con las siguientes características. Para obtener más información, consulta el artículo sobre cómo usar OAuth 2.0 para acceder a las APIs de Google.

    Application type: "Web Application"
    Name: CHOSEN_NAME #(For example,"Cortex Authentication Client").
    Authorized redirect URIs: http://127.0.0.1
    

    Sustituye CHOSEN_NAME por el nombre que hayas elegido para la cuenta de credenciales de ID de cliente de OAuth.

  3. Guarda el Client ID y el Client secret después de configurar la credencial. Necesitarás estos datos más adelante.

  4. Genera un token nuevo con OAuth 2.0 Access Google APIs. Cortex Data Foundation detecta e ingiere automáticamente los datos de todos los clientes (cuentas) a los que se puede acceder con las credenciales usadas para generar el token.

  5. Crea un secreto con Secret Manager:

    • En la Google Cloud consola, haz clic en Secret Manager.
    • Crea un secreto llamado cortex-framework-google-ads-yaml con el siguiente formato y cambia los valores según tu configuración:
    {"developer_token": "DEVELOPER_TOKEN_VALUE", "refresh_token": "REFRESH_TOKEN_VALUE", "client_id": "CLIENT_ID_VALUE", "client_secret": "CLIENT_SECRET_VALUE", "use_proto_plus": False}
    

Haz los cambios siguientes:

  • DEVELOPER_TOKEN_VALUE con el valor del token de desarrollador disponible en la cuenta de Google Ads.
  • REFRESH_TOKEN_VALUE con el valor del token de actualización obtenido en el paso 4.
  • CLIENT_ID_VALUE con el valor del ID de cliente obtenido en la configuración de OAuth del paso 2.
  • CLIENT_SECRET_VALUE con el valor del secreto de cliente obtenido de la configuración de OAuth en el paso 2.

Actualización y latencia de los datos

Por lo general, la actualización de los datos de las fuentes de datos de Cortex Framework está limitada por lo que permite la conexión ascendente, así como por la frecuencia de ejecución de tu DAG. Ajusta la frecuencia de ejecución de tu DAG para que se ajuste a la frecuencia de los elementos anteriores, las restricciones de recursos y las necesidades de tu empresa.

Los datos obtenidos mediante la API de Google Ads suelen estar disponibles con una latencia de 3 horas o más. Es posible que se ajusten posteriormente debido a las conversiones y a la detección de tráfico no válido. Para obtener más información, consulte el artículo Acerca de la actualización de los datos del Centro de Ayuda de Google Ads.

Permisos de conexiones de Cloud Composer

Crea las siguientes conexiones en Cloud Composer. Para obtener más información, consulta la documentación sobre cómo gestionar conexiones de Airflow.

Nombre de la conexión Purpose
googleads_raw_dataflow Para la API Google Ads > Conjunto de datos sin procesar de BigQuery.
googleads_cdc_bq En Conjunto de datos sin procesar > Transferencia de conjunto de datos de CDC.
googleads_reporting_bq Para el conjunto de datos de CDC > conjunto de datos de informes transferencia.

Permisos de la cuenta de servicio de Cloud Composer

Concede permisos de Dataflow a la cuenta de servicio utilizada en Cloud Composer (tal como se configura en la googleads_raw_dataflow conexión). Consulta las instrucciones en la documentación de Dataflow.

Configuración de ingestión

Controla las canalizaciones de datos Source to Raw y Raw to CDC mediante los ajustes del archivo src/GoogleAds/config/ingestion_settings.yaml. En esta sección se describen los parámetros de cada canalización de datos.

De las fuentes a las tablas sin procesar

En esta sección se describe qué entidades obtienen las APIs y cómo. Cada entrada corresponde a una entidad de Google Ads. Según esta configuración, Cortex crea DAGs de Airflow que ejecutan las canalizaciones de Dataflow para obtener datos mediante las APIs de Google Ads.

Los siguientes parámetros controlan los ajustes de Source to Raw de cada entrada:

Parámetro Descripción
load_frequency La frecuencia con la que se ejecuta un DAG de esta entidad para obtener datos de Google Ads. Para obtener más información sobre los valores posibles, consulta la documentación de Airflow.
api_name Nombre del recurso de la API (por ejemplo, customer).
table_name Tabla del conjunto de datos sin procesar en la que se almacenan los datos obtenidos (por ejemplo, customer).
schema_file Archivo de esquema en el directorio src/table_schema que asigna los campos de respuesta de la API a los nombres de las columnas de la tabla de destino.
key Columnas (separadas por comas) que forman un registro único para esta tabla.
is_metrics_table Indica si una entrada determinada corresponde a una entidad de métrica (en la API de Google Ads). El sistema trata estas tablas de forma ligeramente diferente debido a la naturaleza agregada de las mismas.
partition_details Opcional: si quieres que esta tabla se particione por motivos de rendimiento. Para obtener más información, consulta Partición de tablas.
cluster_details Opcional: si quiere que esta tabla se agrupe por motivos de rendimiento. Para obtener más información, consulta Configuración del clúster.

Tablas de datos sin procesar a tablas de CDC

En esta sección se describe qué entradas controlan cómo se mueven los datos de las tablas sin procesar a las tablas de CDC. Cada entrada se corresponde con una tabla sin procesar (que, a su vez, se corresponde con una entidad de la API de Google Ads, como se ha mencionado).

Los siguientes parámetros controlan los ajustes de Raw to CDC de cada entrada:

Parámetro Descripción
table_name Tabla del conjunto de datos de CDC en la que se almacenan los datos sin procesar después de la transformación de CDC (por ejemplo, customer).
raw_table Tabla en la que se han replicado los datos sin procesar.
key Columnas (separadas por comas) que forman un registro único en esta tabla.
load_frequency Con qué frecuencia se ejecuta un DAG para esta entidad para rellenar la tabla de CDC. Para obtener más información sobre los valores posibles, consulta la documentación de Airflow.
schema_file Archivo de esquema en el directorio src/table_schema que asigna columnas sin procesar a columnas de CDC y al tipo de datos de la columna de CDC. Este es el mismo archivo de esquema al que se hace referencia en la sección anterior.
partition_details Opcional: si quieres que esta tabla se particione por motivos de rendimiento. Para obtener más información, consulta Partición de tablas.
cluster_details Opcional: si quiere que esta tabla se agrupe por motivos de rendimiento. Para obtener más información, consulta Configuración del clúster.

Configuración de informes

Puede configurar y controlar cómo genera Cortex Framework los datos de la capa de informes finales de Google Ads mediante el archivo de configuración de informes src/GoogleAds/config/reporting_settings.yaml. Este archivo controla cómo se generan los objetos de BigQuery de la capa de informes (tablas, vistas,funciones o procedimientos almacenados).

Para obtener más información, consulte Personalizar el archivo de configuración de informes.

Siguientes pasos