Análise criativa em escala com o Google Cloud e machine learning

Este artigo é destinado a profissionais de publicidade interessados em aprender como automatizar insights criativos usando os recursos de machine learning (ML) e o armazenamento de dados do Google Cloud Platform (GCP). Neste artigo, mostramos como aproveitar a tecnologia de nuvem para receber rapidamente insights criativos, avaliar a qualidade desses criativos com eficácia e adaptar os esforços de publicidade de maneira correta. Saiba como extrair e processar metadados visuais de anúncios (seus criativos) em escala para que você possa entender melhor quais imagens e vídeos atraem seus clientes.

Este artigo descreve um sistema para:

  • usar as APIs de machine learning para analisar criativos;
  • implementar um pipeline do Cloud Pub/Sub para permitir o processamento em escala;
  • consultar dados de publicidade e conteúdo de imagem para análise.

O sistema descrito aqui pode ajudar você a:

  • usar análise personalizada de dados brutos por equipes de ciência de dados internas e externas;
  • exibir uma visualização macro de elementos do criativo e estatísticas relevantes em uma rede, anunciante ou campanha para análise interativa;
  • fornecer análises escalonáveis usando modelos de machine learning que podem ser compartilhadas com as partes interessadas focadas na otimização dos criativos.

Este artigo supõe que você use o Google Marketing Platform na sua iniciativa de publicidade.

Introdução

Os anunciantes focam cada vez mais a segmentação e a atribuição, mesmo que 75% do impacto de um criativo esteja relacionado à qualidade dele (em inglês). Apesar dessa estatística, a maioria dos esforços de análise ainda se concentra em quando e onde o criativo foi executado, e não no conteúdo dele. Esse foco não se deve à falta de esforço, mas sim à dificuldade de analisar os criativos.

Para começar a receber insights de dados, você precisa marcar manualmente os criativos individuais. Portanto, é possível analisar apenas um conjunto selecionado de criativos, mas isso é caro e demorado. Além disso, o processo de upload dos materiais não tem uma taxonomia consistente que inclui o ID, assim, é impossível analisar as métricas de desempenho e conectá-las ao criativo.

O ideal seria responder a perguntas como as seguintes:

  • Mostrar o logotipo da marca nos primeiros cinco segundos de um vídeo aumenta o recall da marca?
  • Os criativos com imagens naturais e ao ar livre, como árvores ou praias, têm melhor desempenho que aqueles com imagens urbanas?
  • Quais palavras-chave estão presentes nos seus criativos e como elas afetam as métricas?
  • Os criativos com vários rostos felizes geram um engajamento maior?

Hoje, a única maneira de responder a essas perguntas é analisar cada criativo e fornecer respostas manualmente. Essa solução é lenta e não escalonável. A solução apresentada aqui repensa esse processo de modo a permitir que os analistas processem todos os criativos em alguns dias. Isso aumenta drasticamente a amplitude e a profundidade dos dados disponíveis que, com a codificação manual, seriam inviáveis ou extremamente caros.

Neste artigo, descrevemos uma maneira de automatizar esses insights sobre criativos em escala usando tecnologias do GCP como o Cloud Pub/Sub, o App Engine, o Cloud Vision, o BigQuery e o Data Studio.

Pipeline de dados para insights sobre criativos

O pipeline de dados é executado principalmente no App Engine usando o Cloud Pub/Sub como o serviço de fila de mensagens para processar muitos criativos de uma vez. Esse pipeline também lê e grava no Cloud Datastore como forma de coordenar tarefas paralelas entre vários workers do App Engine durante as fases.

No pipeline, imagens e vídeos criativos são buscados no Google Marketing Platform e copiados para o Cloud Storage. Essas imagens e vídeos também são executados pelas APIs Vision e Video Intelligence, e os dados brutos originados desses serviços são gravados no BigQuery. Para entender melhor como implementar esse pipeline, a próxima seção analisa cada componente com mais detalhes.

Como automatizar uma solução

A solução proposta tem três etapas:

  1. Aproveitar os recursos de machine learning atuais por meio das APIs Vision e Video Intelligence.
  2. Usar o Cloud Pub/Sub para criar um pipeline escalonável para processar os criativos à sua disposição.
  3. Armazenar, consultar e visualizar os insights resultantes usando o BigQuery e o Data Studio.

Etapa 1: aproveitar as APIs de machine learning

Veja o seguinte exemplo de criativo:

anúncio de uma loção para a pele

No Campaign Manager, você recebe as seguintes informações relacionadas a anúncios:

  • ID do criativo
  • Tamanho do criativo
  • Métricas de publicidade, como taxa de cliques (CTR). Uma lista completa de métricas está disponível no Campaign Manager.
ID do criativo Nome do criativo Tamanho do criativo Impressões Cliques Taxa de cliques
12345 cbalm_lipgloss_300x300.png 300x300 80.734.829 174.696 0,2%

Atualmente, as convenções de nomenclatura são sua melhor opção para extrair informações sobre o conteúdo do criativo em si. Por outro lado, este artigo usa a API Cloud Vision para coletar automaticamente os principais recursos desse criativo, conforme ilustrado na figura a seguir:

como extrair os principais recursos de um criativo por meio da API Vision

Para entender as nuances do conteúdo, tente essa extração fazendo o upload da imagem do seu criativo.

Em seguida, use a API para analisar o conteúdo do criativo e entender como a qualidade desses criativos impacta o recall e o desempenho do anúncio. Assim, fica bem mais fácil fazer perguntas sobre o conjunto de dados.

Etapa 2: configurar o Cloud Pub/Sub para automatizar o pipeline do criativo

Para automatizar o pipeline do criativo em escala, use o Cloud Pub/Sub. Esse serviço é uma solução de análise de stream que ingere streams de eventos e os envia ao BigQuery para análise no armazenamento de dados. Utilizar o Cloud Pub/Sub para a entrega de dados do evento libera tempo para que você processe eficientemente milhares de criativos. O diagrama a seguir mostra um esboço da configuração do pipeline usado para implementar a análise do criativo.

Pilha de tecnologia e arquitetura

Pilha de tecnologia e arquitetura

O diagrama de arquitetura anterior refere-se aos seguintes componentes do GCP.

Componente do GCP Papel do pipeline
Cloud Pub/Sub Job assíncrono e fila de mensagens.

Neste caso, sugerimos a criação de quatro tópicos para gerenciar criativos, jobs, metadados de criativos e dados da API Vision. Cada um desses tópicos tem assinantes que são iniciados quando uma nova entrada é detectada.
Cloud Storage Ideal para armazenamento de arquivos de mídia das imagens e vídeos usados no pipeline.
App Engine Recursos de computação para processar lógica de negócios.
Cloud Datastore Permite a telemetria básica em jobs, coordenação de ações em etapas do pipeline e agrupamento de mensagens.
Stackdriver Logging Recurso de registro para verificação de integridade, depuração e status.
BigQuery Armazenamento de dados para saídas e feeds do pipeline resultantes no Data Studio para análise.

Principais considerações sobre o pipeline

  • O início e o final do pipeline são unidades de trabalho monolíticas. O meio dele processa os criativos em paralelo, em que cada mensagem do Cloud Pub/Sub carrega um único criativo.
  • Os jobs são tratados como processos de longa duração (podem levar horas/dias).
  • O pipeline é executado para um objetivo específico, portanto, os novos dados no Google Marketing Platform não são atualizados até a próxima execução.
  • O pipeline requer permissões apropriadas para a conta de serviço associada ao projeto do GCP que executa essa infraestrutura, tanto das propriedades do Google Marketing Platform (do Campaign Manager, por exemplo) quanto dos projetos de origem e destino do GCP para serviços como Cloud Storage e BigQuery.
  • Esse pipeline permite um único processo criativo ou atualizações em lote.

Etapa 3: visualizar insights sobre criativos com o Data Studio e o BigQuery

Para fazer uma análise preliminar, inicialmente é possível usar, de maneira direta, os dados brutos das APIs Vision e Video Intelligence. No entanto, para modelagem matemática e machine learning, recomenda-se fazer a engenharia de atributos desses dados em um formato adequado. Essa solução usa uma abordagem one-hot (em inglês) modificada, expressando cada recurso do criativo com um número de 0 a 1. A tabela a seguir mostra alguns exemplos de como esses dados são convertidos.

Dados da API para cada criativo Representação one-hot
Conjunto de rótulos em texto simples que descrevem qual conteúdo foi visto no criativo (praia ou carro, por exemplo) com uma pontuação de confiança (0 a 1) para cada rótulo O conjunto de recursos é o dicionário inteiro de rótulos em todos os criativos. Cada criativo receberá um 0 se esse rótulo não estiver presente e a pontuação de confiança (0 a 1) se estiver.
Tamanho do logotipo em pixels

Local do canto superior esquerdo em pixels
Um recurso para o tamanho relativo do logotipo que é calculado como (largura × altura do logotipo) / (largura × altura do criativo).

Quatro recursos, um para cada quadrante, com 1 se o logotipo estiver nesse quadrante e 0 se não estiver.
Lista de todas as faces no criativo Um recurso para o número de faces, com valor de 0 a 1 e uma função logística (em inglês), em que 0 representa nenhuma face, 0,5 representa 1 ou 2 faces e 0,99 representa uma multidão.

Depois que essas etapas forem concluídas, será possível usar o BigQuery para reunir informações sobre um criativo da API Vision (rótulo, pontuação, cor, destaque) com os dados do Google Marketing Platform, especificamente o Campaign Manager (ID do criativo, taxa de cliques). Veja a seguir um exemplo de tabela de informações.

ID do criativo Rótulo Pontuação Cor Destaque Taxa de cliques
12345 pirata 0,7 vermelho 0,8 0,2%
chapéu 0,8 branco 0,1
67890 tronco 0,6 branco 0,4 0,3%
cavalo 0,9 azul-celeste 0,4
  • Agora é possível transformar esses dados em insights sobre criativos e responder facilmente às perguntas feitas no início deste artigo.

Comece perguntando: os criativos com imagens naturais e ao ar livre, como árvores ou praias, têm melhor desempenho que aqueles com imagens urbanas? Usando dados anônimos de um fabricante de carros, o gráfico a seguir representa o número de ocorrências de um rótulo em relação ao índice de desempenho do criativo.

gráfico que representa o número de ocorrências de um rótulo em relação ao índice de desempenho do criativo

  • No quadrante superior direito do gráfico, os rótulos engenharia, blueprint e esquema ocorrem com frequência e apresentam bom desempenho. Os resultados sugerem que mostrar diagramas e blueprints de engenharia passa a mensagem ao cliente de que o carro é um produto preciso e bem projetado.
  • No quadrante inferior direito, os rótulos executivo e sapatos sociais são frequentes, mas têm um desempenho ruim. Assim, é recomendável evitar esses tipos de criativos no futuro.
  • No quadrante superior esquerdo, os rótulos jornada, floresta, pessoas, corpo e óculos de sol não ocorrem com frequência, mas têm melhor desempenho que os pares deles. Esses rótulos mostram oportunidades que não foram aproveitadas. Por exemplo, jornada + floresta pode evocar anúncios com uma estrada sinuosa e paisagens de tirar o fôlego, e a combinação pessoas + corpo + óculos de sol pode sugerir que o modelo humano é importante. Se você comparar esses rótulos com sapatos sociais + executivo, verá que uma imagem casual funciona melhor para a campanha publicitária dessa marca.

  • Agora, faça outra pergunta: quais palavras-chave estão presentes nos seus criativos e como elas afetam as métricas? Usando os mesmos dados do BigQuery, é possível criar o gráfico a seguir, que representa o número de ocorrências de determinadas palavras-chave em relação ao desempenho dos criativos correspondentes. Como mostra o gráfico a seguir, os criativos com as palavras-chave agora e liquidação tendem a ter um desempenho melhor do que aqueles com exclusivo ou desconto.

    criativos com palavras-chave "agora" e "liquidação" tendem a ter um desempenho melhor em comparação a criativos com "exclusivo" ou "desconto"

    Com esses insights, você poderá entender melhor o impacto dos seus criativos e tomar decisões fundamentadas em relação à implantação e ao teste de criativos.

A seguir