Análise criativa em escala com o Google Cloud e machine learning

Este artigo é destinado a profissionais de publicidade interessados em aprender a automatizar insights de criativos usando os recursos de machine learning (ML) e armazenamento de dados do Google Cloud. Neste artigo, mostramos como aproveitar a tecnologia de nuvem para receber rapidamente insights criativos, avaliar a qualidade desses criativos com eficácia e adaptar os esforços de publicidade de maneira correta. Saiba como extrair e processar metadados visuais de anúncios (seus criativos) em escala para que você possa entender melhor quais imagens e vídeos atraem seus clientes.

Este artigo descreve um sistema para:

  • usar as APIs de machine learning para analisar criativos;
  • implementar um pipeline do Pub/Sub para ativar o processamento em escala;
  • consultar dados de publicidade e conteúdo de imagem para análise.

O sistema descrito aqui pode ajudar você a:

  • usar análise personalizada de dados brutos por equipes de ciência de dados internas e externas;
  • exibir uma visualização macro de elementos do criativo e estatísticas relevantes em uma rede, anunciante ou campanha para análise interativa;
  • fornecer análises escalonáveis usando modelos de machine learning que podem ser compartilhadas com as partes interessadas focadas na otimização dos criativos.

Este artigo supõe que você use o Google Marketing Platform na sua iniciativa de publicidade.

Introdução

Os anunciantes focam cada vez mais a segmentação e a atribuição, mesmo que 75% do impacto de um criativo esteja relacionado à qualidade dele (em inglês). Apesar dessa estatística, a maioria dos esforços de análise ainda se concentra em quando e onde o criativo foi executado, e não no conteúdo dele. Esse foco não se deve à falta de esforço, mas sim à dificuldade de analisar os criativos.

Para começar a receber insights de dados, você precisa marcar manualmente os criativos individuais. Portanto, é possível analisar apenas um conjunto selecionado de criativos, mas isso é caro e demorado. Além disso, o processo de upload dos materiais não tem uma taxonomia consistente que inclui o ID, assim, é impossível analisar as métricas de desempenho e conectá-las ao criativo.

O ideal seria responder a perguntas como as seguintes:

  • Mostrar o logotipo da marca nos primeiros cinco segundos de um vídeo aumenta o recall da marca?
  • Os criativos com imagens naturais e ao ar livre, como árvores ou praias, têm melhor desempenho que aqueles com imagens urbanas?
  • Quais palavras-chave estão presentes nos seus criativos e como elas afetam as métricas?
  • Os criativos com vários rostos felizes geram um engajamento maior?

Hoje, a única maneira de responder a essas perguntas é analisar cada criativo e fornecer respostas manualmente. Essa solução é lenta e não escalonável. A solução apresentada aqui repensa esse processo de modo a permitir que os analistas processem todos os criativos em alguns dias. Isso aumenta drasticamente a amplitude e a profundidade dos dados disponíveis que, com a codificação manual, seriam inviáveis ou extremamente caros.

Este artigo descreve uma maneira de automatizar esses insights de criativos em escala usando tecnologias do Google Cloud, como Pub/Sub, App Engine, Cloud Vision, BigQuery e Data Studio.

Pipeline de dados para insights sobre criativos

O pipeline de dados é executado principalmente no App Engine, usando o Pub/Sub como o serviço de fila de mensagens para processar muitos criativos por vez. Esse pipeline também lê e grava no Datastore como uma maneira de coordenar tarefas paralelas em vários workers do App Engine durante as fases do pipeline.

No pipeline, imagens e vídeos criativos são buscados no Google Marketing Platform e copiados para o Cloud Storage. As imagens e os vídeos também são executados por meio das APIs Vision e Video Intelligence. Os dados brutos provenientes desses serviços são gravados no BigQuery. Para entender melhor como implementar esse pipeline, a próxima seção analisa cada componente com mais detalhes.

Como automatizar uma solução

A solução proposta tem três etapas:

  1. Aproveitar os recursos de machine learning atuais por meio das APIs Vision e Video Intelligence.
  2. Use o Pub/Sub para criar um pipeline escalonável e processar os criativos à sua disposição.
  3. Armazenar, consultar e visualizar os insights resultantes usando o BigQuery e o Data Studio.

Etapa 1: aproveitar as APIs de machine learning

Veja o seguinte exemplo de criativo:

anúncio de uma loção para a pele

No Campaign Manager, você recebe as seguintes informações relacionadas a anúncios:

  • ID do criativo
  • Tamanho do criativo
  • Métricas de publicidade, como taxa de cliques (CTR). Uma lista completa de métricas está disponível no Campaign Manager.
ID do criativo Nome do criativo Tamanho do criativo Impressões Cliques Taxa de cliques
12345 cbalm_lipgloss_300x300.png 300x300 80.734.829 174.696 0,2%

Atualmente, as convenções de nomenclatura são sua melhor opção para extrair informações sobre o conteúdo do criativo em si. Por outro lado, este artigo usa a API Cloud Vision para coletar automaticamente os principais recursos desse criativo, conforme ilustrado na figura a seguir:

como extrair os principais recursos de um criativo por meio da API Vision

Para entender as nuances do conteúdo, tente essa extração como fazer o upload da imagem do seu criativo.

Em seguida, use a API para analisar o conteúdo do criativo e entender como a qualidade desses criativos impacta o recall e o desempenho do anúncio. Assim, fica bem mais fácil fazer perguntas sobre o conjunto de dados.

Etapa 2: configurar o Pub/Sub para automatizar o pipeline do criativo

Para automatizar o pipeline de criativos em escala, é possível aproveitar o Pub/Sub. Esse serviço é uma solução de análise de stream que ingere streams de eventos e os envia ao BigQuery para análise no armazenamento de dados. Confiar no Pub/Sub para a entrega de dados de eventos permite que você processe milhares de criativos com eficiência. O diagrama a seguir mostra um esboço da configuração do pipeline usado para implementar a análise do criativo.

Pilha de tecnologia e arquitetura

Pilha de tecnologia e arquitetura

O diagrama de arquitetura anterior refere-se aos seguintes componentes do Google Cloud.

Componente do GCP Papel do pipeline
Pub/Sub Job assíncrono e fila de mensagens.

Neste caso, sugerimos a criação de quatro tópicos para gerenciar criativos, jobs, metadados de criativos e dados da API Vision. Cada um desses tópicos tem assinantes que são iniciados quando uma nova entrada é detectada.
Cloud Storage Ideal para armazenamento de arquivos de mídia das imagens e vídeos usados no pipeline.
App Engine Recursos de computação para processar lógica de negócios.
Datastore Permite a telemetria básica em jobs, coordenação de ações em etapas do pipeline e agrupamento de mensagens.
Cloud Logging Recurso do Logging para verificação de integridade, depuração e status.
BigQuery Armazenamento de dados para saídas e feeds do pipeline resultantes no Data Studio para análise.

Principais considerações sobre o pipeline

  • O início e o final do pipeline são unidades de trabalho monolíticas. O meio do pipeline processa os criativos em paralelo, em que cada mensagem do Pub/Sub carrega um único criativo.
  • Os jobs são tratados como processos de longa duração (podem levar horas/dias).
  • O pipeline é executado para um objetivo específico, portanto, os novos dados no Google Marketing Platform não são atualizados até a próxima execução.
  • O pipeline requer permissões apropriadas para a conta de serviço associada ao projeto do Google Cloud que executa essa infraestrutura, tanto das propriedades da Google Marketing Platform (por exemplo, Campaign Manager) quanto dos projetos de origem e destino do Google Cloud para serviços como o Cloud Storage e o BigQuery.
  • Esse pipeline permite um único processo criativo ou atualizações em lote.

Etapa 3: visualizar insights sobre criativos com o Data Studio e o BigQuery

Para fazer uma análise preliminar, inicialmente é possível usar diretamente os dados brutos das APIs Vision e Video Intelligence. No entanto, para modelagem matemática e machine learning, recomendamos que você projete esses dados em um formato adequado. Essa solução usa uma abordagem one-hot (em inglês) modificada, expressando cada recurso do criativo com um número de 0 a 1. A tabela a seguir mostra alguns exemplos de como esses dados são convertidos.

Dados da API para cada criativo Representação one-hot
Conjunto de rótulos em texto simples que descrevem qual conteúdo foi visto no criativo (praia ou carro, por exemplo) com uma pontuação de confiança (0 a 1) para cada rótulo O conjunto de atributos é o dicionário inteiro de rótulos em todos os criativos. Cada criativo receberá um 0 se esse rótulo não estiver presente e a pontuação de confiança (0 a 1) se estiver.
Tamanho do logotipo em pixels

Localização do canto superior esquerdo em pixels
Um recurso para o tamanho relativo do logotipo que é calculado como (largura × altura do logotipo) / (largura × altura do criativo).

Quatro recursos, um para cada quadrante, com 1 se o logotipo estiver nesse quadrante e 0 se não estiver.
Lista de todas as faces no criativo Um recurso para o número de faces, com valor de 0 a 1 e uma função logística, em que 0 representa nenhuma face, 0,5 representa 1 ou 2 faces e 0,99 representa uma multidão.

Depois que essas etapas forem concluídas, será possível usar o BigQuery para reunir informações sobre um criativo da API Vision (rótulo, pontuação, cor, destaque) com os dados do Google Marketing Platform, especificamente o Campaign Manager (ID do criativo, taxa de cliques). Veja a seguir um exemplo de tabela de informações.

ID do criativo Rótulo Pontuação Cor Destaque Taxa de cliques
12345 pirata 0,7 vermelho 0,8 0,2%
chapéu 0,8 branco 0,1
67890 tronco 0,6 branco 0,4 0,3%
cavalo 0,9 azul-celeste 0,4
  • Agora é possível transformar esses dados em insights sobre criativos e responder facilmente às perguntas feitas no início deste artigo.

Comece perguntando: os criativos com imagens naturais e ao ar livre, como árvores ou praias, têm melhor desempenho que aqueles com imagens urbanas? Usando dados anônimos de um fabricante de carros, o gráfico a seguir representa o número de ocorrências de um rótulo em relação ao índice de desempenho do criativo.

gráfico que representa o número de ocorrências de um rótulo em relação ao índice de desempenho do criativo

  • No quadrante superior direito do gráfico, os rótulos engenharia, blueprint e esquema ocorrem com frequência e apresentam bom desempenho. Os resultados sugerem que mostrar diagramas e blueprints de engenharia passa a mensagem ao cliente de que o carro é um produto preciso e bem projetado.
  • No quadrante inferior direito, os rótulos executivo e sapatos sociais são frequentes, mas têm um desempenho ruim. Assim, é recomendável evitar esses tipos de criativos no futuro.
  • No quadrante superior esquerdo, os rótulos jornada, floresta, pessoas, corpo e óculos de sol não ocorrem com frequência, mas têm melhor desempenho que os pares deles. Esses rótulos mostram oportunidades que não foram aproveitadas. Por exemplo, jornada + floresta pode evocar anúncios com uma estrada sinuosa e paisagens de tirar o fôlego, e a combinação pessoas + corpo + óculos de sol pode sugerir que o modelo humano é importante. Se você comparar esses rótulos com sapatos sociais + executivo, verá que uma imagem casual funciona melhor para a campanha publicitária dessa marca.

  • Agora, faça outra pergunta: quais palavras-chave estão presentes nos seus criativos e como elas afetam as métricas? Usando os mesmos dados do BigQuery, é possível criar o gráfico a seguir, que representa o número de ocorrências de determinadas palavras-chave em relação ao desempenho dos criativos correspondentes. Como mostra o gráfico a seguir, os criativos com as palavras-chave agora e liquidação tendem a ter um desempenho melhor do que aqueles com exclusivo ou desconto.

    criativos com palavras-chave

    Com esses insights, será possível entender melhor o impacto dos seus criativos e tomar decisões fundamentadas em relação à implantação e ao teste de criativos.

A seguir