Integración con Google Ads

En esta página, se describen las configuraciones necesarias para incorporar datos de Google Ads como fuente de datos de la carga de trabajo de marketing de Cortex Framework Data Foundation.

Google Ads es una plataforma publicitaria en línea que permite a las empresas promocionar sus productos o servicios en varias propiedades de Google. Cortex Framework combina tus datos de Google Ads con otros canales de marketing, los analiza de forma integral y usa la IA para mejorar los resultados de tus campañas.

En el siguiente diagrama, se describe cómo los datos de Google Ads están disponibles a través de la carga de trabajo de marketing de Cortex Framework Data Foundation:

Fuente de datos de Google Ads

Figura 1. Fuente de datos de Google Ads.

Archivo de configuración

El archivo config.json configura los parámetros necesarios para transferir datos desde cualquier fuente de datos, incluido Google Ads. Este archivo contiene los siguientes parámetros para Google Ads:

  "marketing": {
          "deployGoogleAds": true,
          "GoogleAds": {
              "deployCDC": true,
              "lookbackDays": 180,
              "datasets": {
                  "cdc": "",
                  "raw": "",
                  "reporting": "REPORTING_GoogleAds"
                    }
                  }
                 }

En la siguiente tabla, se describe el valor de cada parámetro de marketing de Google Ads:

Parámetro Significado Valor predeterminado Descripción
marketing.deployGoogleAds Implementa Google Ads true Ejecuta la implementación de la fuente de datos de Google Ads.
marketing.GoogleAds.deployCDC Implementa la CDC para Google Ads true Genera secuencias de comandos de procesamiento de CDC de Google Ads para ejecutarlas como DAG en Cloud Composer.
marketing.GoogleAds.lookbackDays Días de visualización para Google Ads 180 Es la cantidad de días para comenzar a recuperar datos de la API de Google Ads.
marketing.GoogleAds.datasets.cdc Conjunto de datos del CDC para Google Ads Conjunto de datos del CDC para Google Ads.
marketing.GoogleAds.datasets.raw Conjunto de datos sin procesar para Google Ads Es el conjunto de datos sin procesar de Google Ads.
marketing.GoogleAds.datasets.reporting Conjunto de datos de informes de Google Ads "REPORTING_GoogleAds" Es el conjunto de datos de informes de Google Ads.

Modelo de datos

En esta sección, se describe el modelo de datos de Google Ads con el diagrama de relaciones de entidades (ERD).

Diagrama de relaciones de entidades de Google Ads

Figura 2: Google Ads: Diagrama de relaciones de entidades.

Vistas básicas

Estos son los objetos azules del ERE y son vistas en tablas de CDC sin transformaciones, excepto algunos alias de nombres de columnas. Consulta las secuencias de comandos en src/marketing/src/GoogleAds/src/reporting/ddls.

Vistas de informes

Estos son los objetos verdes del ERE y son vistas de informes que contienen métricas agregadas. Consulta las secuencias de comandos en src/marketing/src/GoogleAds/src/reporting/ddls.

Conexión a la API

Las plantillas de transferencia de Cortex Framework usan la API de Google Ads para recuperar atributos y métricas de informes de Google Ads. Las plantillas actuales de Cortex Framework usan la versión 17.1 de la API de Google Ads. Ten en cuenta las siguientes limitaciones de la API de Google Ads:

  • Operaciones de acceso básicas por día: 15,000 (no se cuentan las solicitudes paginadas que contienen un next_page_token válido).
  • Tamaño máximo de página: 10,000 filas por página.
  • Parámetros predeterminados recomendados: El tamaño de la página es igual a 10,000 filas por página.

Para obtener más información sobre la conexión de la API, consulta la documentación de la API de Google Ads.

Autenticación de cuenta

Sigue estos pasos para configurar la autenticación de la cuenta:

  1. En la consola de Google Cloud, haz clic en Menú de navegación > API y servicios > Credenciales > Crear credenciales.
  2. Crea una credencial de ID de cliente de OAuth con las siguientes características. Para obtener más información, consulta Usa OAuth 2.0 para acceder a las APIs de Google.

    Application type: "Web Application"
    Name: CHOSEN_NAME #(For example,"Cortex Authentication Client").
    Authorized redirect URIs: http://127.0.0.1
    

    Reemplaza CHOSEN_NAME por el nombre que elegiste para la cuenta de credenciales del ID de cliente de OAuth.

  3. Guarda Client ID y Client secret después de configurar la credencial. La necesitarás más tarde.

  4. Genera un token nuevo con OAuth 2.0 para acceder a las APIs de Google. Cortex Data Foundation detecta e incorpora automáticamente los datos de todos los clientes (cuentas) a los que pueden acceder las credenciales que se usan para generar el token.

  5. Crea un secreto con Secret Manager:

    • En la consola de Google Cloud, haz clic en Secret Manager.
    • Crea un secreto llamado cortex-framework-google-ads-yaml con el siguiente formato y cambia los valores según tu configuración:
    {"developer_token": "DEVELOPER_TOKEN_VALUE", "refresh_token": "REFRESH_TOKEN_VALUE", "client_id": "CLIENT_ID_VALUE", "client_secret": "CLIENT_SECRET_VALUE", "use_proto_plus": False}
    

Reemplaza lo siguiente:

  • DEVELOPER_TOKEN_VALUE con el valor del token de desarrollador disponible en la cuenta de Google Ads.
  • REFRESH_TOKEN_VALUE por el valor del token de actualización que obtuviste en el paso 4.
  • CLIENT_ID_VALUE con el valor de ID de cliente que se obtuvo en la configuración de OAuth del paso 2.
  • CLIENT_SECRET_VALUE con el valor del secreto del cliente que se obtuvo de la configuración de OAuth en el paso 2.

Actualización y demora de los datos

Como regla general, la actualización de los datos de las fuentes de datos de Cortex Framework se limita a lo que permite la conexión upstream, así como a la frecuencia de la ejecución de tu DAG. Ajusta la frecuencia de ejecución de tu DAG para alinearla con la frecuencia upstream, las restricciones de recursos y las necesidades de tu empresa.

Los datos recuperados con la API de Google Ads generalmente están disponibles con una latencia de más de 3 horas. Es posible que se ajusten más adelante debido a las conversiones y a la detección de tráfico no válido. Para obtener más información, consulta el siguiente artículo Acerca de la actualización de los datos en el Centro de ayuda de Google Ads.

Permisos de conexiones de Cloud Composer

Crea las siguientes conexiones en Cloud Composer. Consulta más detalles en la documentación para administrar conexiones de Airflow.

Nombre de la conexión Purpose
googleads_raw_dataflow Para la API de Google Ads, ve a > Conjunto de datos sin procesar de BigQuery.
googleads_cdc_bq Para conjunto de datos sin procesar > Transferencia de conjunto de datos de CDC.
googleads_reporting_bq Para el conjunto de datos de CDC > Transferencia de conjuntos de datos de informes.

Permisos de la cuenta de servicio de Cloud Composer

Otorga permisos de Dataflow a la cuenta de servicio que se usa en Cloud Composer (como se configuró en la conexión googleads_raw_dataflow). Consulta las instrucciones en la documentación de Dataflow.

Configuración de transferencia

Controla las canalizaciones de datos Source to Raw y Raw to CDC a través de la configuración del archivo src/GoogleAds/config/ingestion_settings.yaml. En esta sección, se describen los parámetros de cada canalización de datos.

De fuente a tablas sin procesar

En esta sección, se describe qué entidades recuperan las APIs y cómo. Cada entrada corresponde a una entidad de Google Ads. En función de esta configuración, Cortex crea DAG de Airflow que ejecutan canalizaciones de Dataflow para recuperar datos con las APIs de Google Ads.

Los siguientes parámetros controlan la configuración de Source to Raw para cada entrada:

Parámetro Descripción
load_frequency La frecuencia con la que se ejecuta un DAG para esta entidad para recuperar datos de Google Ads. Para obtener más información sobre los valores posibles, consulta la documentación de Airflow.
api_name Nombre del recurso de API (por ejemplo, customer)
table_name Es la tabla del conjunto de datos sin procesar en la que se almacenan los datos recuperados (por ejemplo, customer).
schema_file Es un archivo de esquema en el directorio src/table_schema que asigna los campos de respuesta de la API a los nombres de las columnas de la tabla de destino.
key Son las columnas (separadas por comas) que forman un registro único para esta tabla.
is_metrics_table Indica si una entrada determinada es para una entidad de métrica (en la API de Google Ads). El sistema trata esas tablas de manera un poco diferente debido a su naturaleza agregada.
partition_details Opcional: Si deseas que esta tabla se particione por motivos de rendimiento. Para obtener más información, consulta Partición de tablas.
cluster_details Opcional: Si deseas que esta tabla se agrupe por motivos de rendimiento. Para obtener más información, consulta Configuración del clúster.

De tablas sin procesar a tablas de CDC

En esta sección, se describe qué entradas controlan cómo se mueven los datos de las tablas sin procesar a las tablas de CDC. Cada entrada corresponde a una tabla sin procesar (que, a su vez, corresponde a la entidad de la API de Google Ads, como se mencionó).

Los siguientes parámetros controlan la configuración de Raw to CDC para cada entrada:

Parámetro Descripción
table_name Es la tabla del conjunto de datos de CDC en la que se almacenan los datos sin procesar después de la transformación de CDC (por ejemplo, customer).
raw_table Es la tabla en la que se replicaron los datos sin procesar.
key Son las columnas (separadas por comas) que forman un registro único para esta tabla.
load_frequency La frecuencia con la que se ejecuta un DAG para esta entidad para propagar la tabla de CDC Para obtener más información sobre los valores posibles, consulta la documentación de Airflow.
schema_file Es un archivo de esquema en el directorio src/table_schema que asigna columnas sin procesar a columnas de CDC y el tipo de datos de la columna de CDC. Este es el mismo archivo de esquema al que se hace referencia en la sección anterior.
partition_details Opcional: Si deseas que esta tabla se particione por motivos de rendimiento. Para obtener más información, consulta Partición de tablas.
cluster_details Opcional: Si deseas que esta tabla se agrupe por motivos de rendimiento. Para obtener más información, consulta Configuración del clúster.

Configuración de informes

Puedes configurar y controlar cómo Cortex Framework genera datos para la capa de informes final de Google Ads con el archivo de configuración de informes src/GoogleAds/config/reporting_settings.yaml. Este archivo controla cómo se generan los objetos de BigQuery de la capa de informes (tablas, vistas,funciones o procedimientos almacenados).

Para obtener más información, consulta Cómo personalizar el archivo de configuración de informes.

Próximos pasos