Análisis creativo a gran escala con Google Cloud y el aprendizaje automático

Este artículo está dirigido a profesionales de la publicidad interesados en aprender cómo automatizar estadísticas de creatividades mediante el aprendizaje automático (AA) y las capacidades de almacenamiento de datos de Google Cloud. En este artículo se explica cómo aprovechar la tecnología en la nube para recibir estadísticas de creatividades con rapidez, medir la calidad de estas creatividades de manera efectiva y, luego, adaptar tus esfuerzos publicitarios según corresponda. Aprende a extraer y procesar metadatos visuales de anuncios (tus creatividades) a gran escala para que puedas comprender mejor con qué imágenes y videos se identifican tus clientes.

En este artículo, se describe un sistema con los siguientes objetivos:

  • Usar las API de aprendizaje automático para analizar creatividades
  • Implementar una canalización de Pub/Sub para habilitar el procesamiento a gran escala
  • Consultar datos de publicidad y contenido de imágenes para las estadísticas

El sistema descrito aquí puede ayudarte a realizar lo siguiente:

  • Habilitar el análisis personalizado de datos sin procesar mediante equipos de ciencia de datos internos y externos
  • Mostrar la vista macro de elementos de las creatividades y estadísticas relevantes en una red, anunciante o campaña para el análisis interactivo
  • modelos de aprendizaje automático que puedes compartir con las partes interesadas que se centran en optimizar sus creatividades.

En este artículo, se da por sentado que usas Google Marketing Platform para tu publicidad.

Introducción

Los anunciantes se enfocan cada vez más en la orientación y la atribución, aunque el 75% del impacto de una creatividad está relacionado con su calidad. A pesar de esta estadística, la mayoría de los análisis aún se enfocan en cuándo y dónde se ejecutó la creatividad en lugar de en su contenido. Este enfoque no se debe a una falta de esfuerzo, sino a lo difícil que es analizar creatividades.

Para comenzar a recibir estadísticas de los datos, es necesario que etiquetes de forma manual creatividades individuales. Por lo tanto, solo puedes analizar un conjunto selecto de creatividades, lo que es costoso y lleva mucho tiempo. Además, el proceso de carga de elementos de creatividad no es adecuado para una taxonomía coherente que incluya el ID de la creatividad, por lo que es imposible observar las métricas de rendimiento y conectarlas de nuevo a la creatividad.

Lo ideal es que puedas responder preguntas como las que se presentan a continuación:

  • ¿Mostrar el logotipo de la marca dentro de los primeros 5 segundos de un video aumenta el recuerdo de marca?
  • ¿Las creatividades con imágenes de naturaleza y exteriores, como árboles o playas, superan a las que tienen imágenes de ciudades?
  • ¿Qué palabras clave aparecen en tus creatividades y cómo afectan las métricas?
  • ¿Las creatividades con muchas personas felices generan un compromiso mayor?

En la actualidad, la única manera de responder a estas preguntas es observar cada creatividad y proporcionar respuestas de forma manual. Esta solución no es escalable ni rápida. La solución presentada aquí replantea este proceso de una manera que permite a los analistas procesar todas las creatividades en unos pocos días. Esta solución aumenta en gran medida la magnitud y profundidad de los datos disponibles que hubieran sido inviables o demasiado costosos con el etiquetado manual.

En este artículo se describe una forma de automatizar estas estadísticas de creatividades a gran escala con tecnologías de Google Cloud como Pub/Sub, App Engine, Cloud Vision, BigQuery y Data Studio.

Canalización de datos para estadísticas de creatividades

La canalización de datos se ejecuta, en su mayoría, en App Engine, con Pub/Sub como el servicio de cola de mensajes para procesar varias creatividades a la vez. Esta canalización también lee y escribe en Datastore como una forma de coordinar trabajos paralelos entre varios trabajadores de App Engine durante las fases de la canalización.

En la canalización, las imágenes y videos de las creatividades se obtienen de Google Marketing Platform y se copian en Cloud Storage. Las imágenes y los videos también se ejecutan a través de las API de Vision y Video Intelligence. Los datos sin procesar que resultan de esos servicios se escriben en BigQuery. Para ayudarte a comprender cómo implementar una canalización de este tipo, en la siguiente sección se analiza cada componente con más detalle.

Automatiza una solución:

La solución propuesta tiene las siguientes tres etapas:

  1. Aprovechar las capacidades del aprendizaje automático existentes a través de las API de Vision y Video Intelligence
  2. Usar Pub/Sub para crear una canalización escalable a fin de procesar las creatividades a tu disposición
  3. Almacenar, consultar y visualizar las estadísticas resultantes con BigQuery y Data Studio

Paso 1: aprovecha las API de aprendizaje automático

Considera la siguiente creatividad de ejemplo:

anuncio de un bálsamo para la piel

En Campaign Manager, obtienes la siguiente información relacionada con los anuncios:

  • ID de creatividad
  • Tamaño de creatividad
  • Métricas de publicidad como la tasa de clics (CTR). En Campaign Manager, hay una lista completa de métricas disponible.
ID de creatividad Nombre de creatividad Tamaño de creatividad Impresiones Clics Tasa de clics
12345 cbalm_lipgloss_300x300.png 300x300 80,734,829 174,696 0.2%

En la actualidad las convenciones de nombres son la mejor opción para extraer información sobre el contenido de la creatividad. En cambio, en este artículo se usa la API de Cloud Vision para extraer las funciones clave de esta creatividad de forma automática, como se muestra en la siguiente figura:

extrae funciones clave de una creatividad mediante la API de Vision

Para comprender los matices del contenido, puedes probar esta extracción si subes tu imagen de creatividad.

Usaste una API para analizar el contenido de la creatividad en un instante. Puedes comenzar a comprender cómo la calidad de estas creatividades afecta el rendimiento y el recuerdo del anuncio. Te resultará más fácil hacer preguntas sobre el conjunto de datos.

Paso 2: configura Pub/Sub para automatizar la canalización de creatividades

Para automatizar la canalización de creatividades a gran escala, puedes aprovechar Pub/Sub. Este servicio es una solución de estadísticas de transmisiones que transfiere transmisiones de eventos y las envía a BigQuery para analizarlas en su almacén de datos. Usar Pub/Sub para enviar datos de eventos te permite procesar miles de creatividades de forma eficaz. En el siguiente diagrama, se muestra un esquema de la configuración de la canalización usada para implementar el análisis de creatividades.

Technology stack y arquitectura

Technology stack y arquitectura

En el diagrama de arquitectura anterior, se hace referencia a los siguientes componentes de Google Cloud.

Componente de GCP Función de la canalización
Pub/Sub Trabajo asíncrono y cola de mensajes.

En este caso, te sugerimos crear 4 temas para administrar creatividades, trabajos, metadatos de creatividades y datos de la API de Vision. Cada uno de estos temas tiene suscriptores asociados que se inician cuando se detecta una entrada nueva.
Cloud Storage Es ideal para el almacenamiento de archivos de medios de las imágenes y videos usados en la canalización.
App Engine Recursos de procesamiento para procesar la lógica empresarial.
Datastore Permite la telemetría básica en los trabajos, la coordinación de acciones en los pasos de la canalización y la agregación de mensajes.
Cloud Logging Recurso de registro para la verificación de estado, la depuración y el estado.
BigQuery Funciona como almacén de datos para resultados de canalizaciones y alimenta a Data Studio a fin de realizar análisis.

Consideraciones clave para la canalización

  • El inicio y el final de la canalización son unidades de trabajo monolíticas. En el medio de la canalización, se procesan creatividades en paralelo; cada mensaje de Pub/Sub lleva una sola creatividad.
  • Los trabajos se tratan como procesos de larga duración (cada trabajo puede tardar horas o días).
  • La canalización se ejecuta ad hoc, por lo que los datos nuevos en Google Marketing Platform no se actualizan hasta la próxima ejecución.
  • La canalización requiere permisos adecuados para la cuenta de servicio asociada al proyecto de Google Cloud en el que se ejecuta esta infraestructura, tanto de las propiedades de Google Marketing Platform (por ejemplo, Campaign Manager) como de los proyectos de Google Cloud de origen y destino para servicios como Cloud Storage y BigQuery.
  • Esta canalización permite un solo proceso de creatividad o actualizaciones por lotes.

Paso 3: visualiza estadísticas de creatividades con Data Studio y BigQuery

Para un análisis preliminar, puedes usar los datos sin procesar de las API de Vision y Video Intelligence directamente. Sin embargo, para el modelado matemático y el aprendizaje automático, te recomendamos que uses la ingeniería de atributos a fin de dar a estos datos un formato adecuado. En esta solución, se usa un enfoque one-hot modificado, que expresa cada característica de la creatividad como un número del 0 al 1. En la siguiente tabla, se muestran algunos ejemplos de cómo se convierten estos datos.

Datos de API para cada creatividad Representación one-hot
Conjunto de etiquetas de texto sin formato que describen el contenido de la creatividad (por ejemplo, playa o automóvil), junto con una puntuación de confianza (de 0 a 1) para cada etiqueta El conjunto de características es el diccionario completo de etiquetas en todas las creatividades; cada creatividad obtiene un 0 si esa etiqueta no estaba presente y la puntuación de confianza (de 0 a 1) si lo estaba.
Tamaño del logotipo en píxeles

Ubicación de la esquina superior izquierda en píxeles
Una característica para el tamaño relativo del logotipo, que se calcula como (ancho × altura del logotipo) o (ancho × altura de la creatividad).

Cuatro características, una para cada cuadrante, con 1 si el logotipo estaba en ese cuadrante y 0 si no estaba.
Lista de todos los rostros en la creatividad Una característica para el número de rostros, normalizada del 0 al 1 con una función logística de modo que 0 indica que no hay rostros, 0.5 indica 1 o 2 rostros y 0.99 indica una gran multitud.

Cuando se completan estos pasos, puedes usar BigQuery para reunir información sobre una creatividad desde la API de Vision (etiqueta, puntuación, color, importancia) junto con los datos de Google Marketing Platform, específicamente Campaign Manager (ID de creatividad, tasa de clics). A continuación, se muestra una tabla de información de ejemplo.

ID de creatividad Etiqueta Puntuación Color Importancia Tasa de clics
12345 pirata 0.7 rojo 0.8 0.2%
sombrero 0.8 blanco 0.1
67890 torso 0.6 blanco 0.4 0.3%
caballo 0.9 azul cielo 0.4
  • Ahora puedes convertir estos datos en estadísticas de creatividades. Y puedes responder con facilidad las preguntas planteadas al principio de este artículo.

Comienza con la pregunta: ¿Las creatividades con imágenes de naturaleza y exteriores, como árboles o playas, superan a las que tienen imágenes de ciudades? Con datos anonimizados de un fabricante de automóviles, en el siguiente grafo, se muestra la cantidad de veces que aparece una etiqueta en comparación con el índice de rendimiento de la creatividad.

grafo en el que se muestra la cantidad de apariciones de una etiqueta en comparación con el índice de rendimiento de la creatividad

  • En el cuadrante superior derecho del grafo, las etiquetas ingeniería, proyecto y esquemático aparecen con frecuencia y tienen un buen rendimiento. Los resultados sugieren que mostrar diagramas de ingeniería y proyectos transmite al cliente la idea de que el automóvil es un producto preciso y bien diseñado.
  • En el cuadrante inferior derecho, las etiquetas ejecutivo (executive) y zapatos formales (dress shoes) aparecen con frecuencia, pero tienen un rendimiento deficiente. Puedes evitar estos tipos de creatividades en el futuro.
  • En el cuadrante superior izquierdo, las etiquetas viaje (journey), bosque (forest), personas (people), cuerpo (body) y gafas de sol (sunglasses) no aparecen con frecuencia, pero superan a sus pares. Estas etiquetas muestran oportunidades que podrías no haber tenido en cuenta. Por ejemplo, viaje + bosque podrían evocar anuncios con un camino sinuoso y un paisaje impresionante, y personas + cuerpo + gafas de sol pueden sugerir que el modelo humano es importante. Compara esas etiquetas con zapatos formales + ejecutivo y podrás ver que una imagen informal funciona mejor para la campaña publicitaria de esta marca.

  • Ahora hazte otra pregunta: ¿Qué palabras clave aparecen en tus creatividades y cómo afectan las métricas? Con los mismos datos de BigQuery, puedes crear el siguiente grafo, en el que se muestra la cantidad de veces que aparecen ciertas palabras clave en comparación con el rendimiento de sus creatividades correspondientes. Como se indica en el siguiente grafo, las creatividades con las palabras clave ahora y oferta suelen tener un mejor rendimiento que las creatividades con descuento o exclusivo.

    las creatividades con las palabras clave “ahora” y “oferta” suelen tener un mejor rendimiento que las que tienen palabras como “descuento” o “exclusivo”

    Con estas estadísticas, puedes comprender aún más el impacto de todas tus creatividades y tomar mejores decisiones sobre la implementación y las pruebas de creatividades.

Próximos pasos