Umfassende Creative-Analysen mit Google Cloud und maschinellem Lernen

Dieser Artikel richtet sich an Werbeprofis, die wissen möchten, wie sie Creatives mit den Funktionen für maschinelles Lernen (ML) und Data-Warehouse-Prozesse von Google Cloud automatisieren können. Es wird erläutert, wie Sie Cloudtechnologie nutzen, um schnell Informationen über Creatives zu erlangen, deren Qualität effektiv zu messen und Ihre Werbeaktivitäten entsprechend abzustimmen. Sie erfahren, wie Sie in großem Maßstab visuelle Metadaten aus Werbeanzeigen (Ihren Creatives) extrahieren und verarbeiten. Dadurch verstehen Sie am Ende besser, welche Bilder und Videos bei Ihren Kunden gut ankommen.

In diesem Artikel wird ein System beschrieben, das Folgendes ermöglicht:

  • Die Machine Learning APIs zum Parsen von Creatives verwenden
  • Pub/Sub-Pipeline implementieren, um eine Verarbeitung in großem Maßstab zu ermöglichen
  • Werbedaten und Bildinhalte für die Analyse abfragen

Dieses System kann Ihnen auch bei Folgendem helfen:

  • Ermöglichen benutzerdefinierter Analysen von Rohdaten durch interne und externe Data-Science-Teams
  • Anzeigen einer Makroansicht von Creative-Elementen und relevanter Statistikdaten für ein Netzwerk, einen Werbetreibenden oder eine Kampagne zur interaktiven Analyse
  • Bereitstellen skalierbarer Analysen mithilfe von Modellen für maschinelles Lernen, die Sie mit Beteiligten teilen können, die ihre Creatives optimieren möchten

In diesem Artikel wird davon ausgegangen, dass Sie für Ihre Werbung die Google Marketing Platform verwenden.

Einleitung

Werbetreibende legen zunehmend Wert auf Targeting und Attribution, obwohl 75 % der Wirkung eines Creatives auf dessen Qualität zurückzuführen sind. Ungeachtet dieser Statistik konzentrieren sich die meisten analytischen Bemühungen noch immer darauf, wann und wo ein Creative geschaltet wurde, statt auf den Inhalt. Diese Priorität ist nicht auf Nachlässigkeit zurückzuführen, sondern auf die Tatsache, dass die Analyse von Creatives sehr schwierig ist.

Wenn Sie Informationen aus den Daten gewinnen möchten, müssen Sie zuerst einzelne Creatives manuell mit Tags kennzeichnen. Daher können Sie jeweils nur einen Satz ausgewählter Creatives analysieren, was kostenintensiv und zeitaufwendig ist. Darüber hinaus eignet sich der Upload-Prozess für Creative-Assets nicht für eine konsistente Taxonomie, die die Creative-ID einschließt. Daher können Leistungsmesswerte nicht betrachtet und auf das jeweilige Creative zurückgeführt werden.

Im Idealfall möchten Sie Fragen wie die folgenden beantworten können:

  • Erhöht sich durch das Anzeigen des Markenlogos innerhalb der ersten 5 Sekunden eines Videos die Markenerinnerung?
  • Haben Creatives mit Naturbildern, wie Bäumen oder Stränden, eine stärkere Wirkung als solche mit Stadtansichten?
  • Welche Keywords kommen in Ihren Creatives vor und wie wirken sie sich auf die Messwerte aus?
  • Führen Creatives mit mehreren glücklichen Gesichtern zu einer höheren Interaktion?

Derzeit lassen sich diese Fragen nur beantworten, indem jedes Creative einzeln betrachtet wird und manuell Antworten gesucht werden. Diese Vorgehensweise ist aber weder skalierbar noch schnell. Bei der im Folgenden vorgestellten Lösung wurde dieser Prozess neu durchdacht, um Analysten die Möglichkeit zu geben, alle Creatives innerhalb weniger Tage zu verarbeiten. Diese Lösung erhöht die Breite und Tiefe der verfügbaren Daten erheblich, was mit manueller Tag-Kennzeichnung nicht umsetzbar oder unverhältnismäßig teuer wäre.

In diesem Artikel wird beschrieben, wie Sie die Gewinnung umfangreicher Informationen über Creatives mithilfe von Google Cloud-Technologien wie Pub/Sub, App Engine, Cloud Vision, BigQuery und Data Studio automatisieren können.

Datenpipeline für Informationen über Creatives

Die Datenpipeline wird hauptsächlich in App Engine ausgeführt und verwendet Pub/Sub als Nachrichtenwarteschlangendienst, um viele Creatives gleichzeitig zu verarbeiten. Diese Pipeline liest und schreibt außerdem in Datastore, um während der Pipeline-Phasen parallele Aufgaben zu koordinieren, für die verschiedene App Engine-Worker ausgeführt werden.

In der Pipeline werden Creative-Bilder und -Videos von der Google Marketing Platform abgerufen und in Cloud Storage kopiert. Die Bilder und Videos werden auch durch die Vision API und die Video Intelligence API verarbeitet. Die von diesen Diensten ausgegebenen Rohdaten werden dann in BigQuery geschrieben. Für ein genaueres Verständnis der Implementierung einer solchen Pipeline werden die einzelnen Komponenten im nächsten Abschnitt genauer beschrieben.

Lösung automatisieren

Die hier vorgestellte Lösung gliedert sich in drei Phasen:

  1. Sie nutzen bestehende ML-Funktionen über die Vision API und die Video Intelligence API.
  2. Verwenden Sie Pub/Sub, um eine skalierbare Pipeline zur Verarbeitung der verfügbaren Creatives zu erstellen.
  3. Sie nutzen BigQuery und Data Studio, um die resultierenden Informationen zu speichern, Abfragen durchzuführen und die Informationen darzustellen.

Schritt 1: Machine Learning APIs nutzen

Betrachten Sie das folgende Beispiel-Creative:

Werbeanzeige für eine Hautcreme

In Campaign Manager erhalten Sie die folgenden Informationen zur Werbeanzeige:

Creative-ID Creative-Name Creative-Größe Impressionen Klicks Klickrate
12345 cbalm_lipgloss_300x300.png 300 x 300 80.734.829 174.696 0,2 %

Derzeit sind Namenskonventionen die beste Option, um Informationen zum Inhalt des Creatives zu extrahieren. Im Gegensatz dazu wird in diesem Artikel die Cloud Vision API verwendet, um die wichtigsten Merkmale automatisch aus diesem Creative zu extrahieren, wie in der folgenden Abbildung dargestellt:

Wichtige Merkmale eines Creatives mithilfe der Vision API extrahieren

Für ein tieferes Verständnis der Nuancen des Inhalts können Sie diese Extraktion selbst testen, indem Sie ein eigenes Creative-Bild hochladen.

So haben Sie im Handumdrehen eine API verwendet, um den Inhalt des Creatives zu analysieren, und erfahren mehr darüber, wie sich die Qualität dieser Creatives auf die Anzeigenerinnerung und die Leistung auswirkt. Auf diese Weise wird es viel einfacher, Fragen zum Dataset zu beantworten.

Schritt 2: Pub/Sub einrichten, um die Creative-Pipeline zu automatisieren

Für die umfassende Automatisierung der Creative-Pipeline können Sie Pub/Sub nutzen. Dieser Dienst ist eine Lösung für Streamanalysen, die Ereignisstreams aufnimmt und zur Analyse im Data Warehouse an BigQuery sendet. Durch die Bereitstellung von Ereignisdaten mithilfe von Pub/Sub können Sie effizient Tausende von Creatives verarbeiten. Das folgende Diagramm zeigt einen Überblick über die Pipelinekonfiguration, die zur Implementierung der Creative-Analyse verwendet wird.

Softwarepaket und Architektur

Softwarepaket und Architektur

Das obige Architekturdiagramm bezieht sich auf die folgenden Google Cloud-Komponenten.

GCP-Komponente Funktion in der Pipeline
Pub/Sub Asynchrone Job- und Nachrichtenwarteschlange

In diesem Fall empfehlen wir die Erstellung von vier Themen zur Verwaltung von Creatives, Jobs, Creative-Metadaten und Vision API-Daten. Jedem dieser Themen sind Abonnenten zugeordnet, die bei Erkennung einer neuen Eingabe gestartet werden.
Cloud Storage Ideal zum Speichern der in der Pipeline verwendeten Bild- und Videodateien
App Engine Bietet Rechenressourcen für die Verarbeitung der Geschäftslogik.
Datastore Ermöglicht grundlegende Telemetrie für Jobs, die Koordination von Aktionen in den Pipelineschritten und die Aggregation von Nachrichten.
Cloud Logging Logging-Ressource für Systemdiagnosen, Fehlerbehebung und Statuserfassung
BigQuery Datenspeicher für die resultierenden Pipeline-Ausgaben und Feeds zur Analyse in Data Studio

Wichtige Hinweise zur Pipeline

  • Der Anfang und das Ende der Pipeline sind monolithische Arbeitseinheiten. In der Mitte der Pipeline werden Creatives parallel verarbeitet, wobei jede Pub/Sub-Nachricht ein einzelnes Creative enthält.
  • Jobs werden als lang andauernde Prozesse behandelt (und können mehrere Stunden oder Tage dauern).
  • Die Pipeline wird ad hoc ausgeführt. Neue Daten in der Google Marketing Platform werden also erst bei der nächsten Ausführung aktualisiert.
  • Die Pipeline benötigt entsprechende Berechtigungen für das Dienstkonto, das mit dem Google Cloud-Projekt verknüpft ist, auf dem diese Infrastruktur ausgeführt wird. Diese müssen sowohl durch Google Marketing Platform-Attribute (z. B. Campaign Manager) als auch durch Quell- und Zielprojekte von Google Cloud für Dienste wie Cloud Storage und BigQuery erteilt werden.
  • Diese Pipeline ermöglicht sowohl einen einzelnen Creative-Prozess als auch Batch-Aktualisierungen.

Schritt 3: Aus Creatives gewonnene Informationen mit Data Studio und BigQuery darstellen

Zur Voranalyse können Sie zuerst direkt die Rohdaten aus der Vision API und der Video Intelligence API verwenden. Für mathematische Modellierung und maschinelles Lernen empfehlen wir jedoch, diese Daten in ein geeignetes Format zu bringen. Für diese Lösung wird ein modifizierter One-Hot-Ansatz verwendet, bei dem jedes Merkmal des Creatives als Zahl von 0 bis 1 dargestellt wird. Die folgende Tabelle zeigt einige Beispiele dafür, wie diese Daten umgewandelt werden.

API-Daten der einzelnen Creatives One-Hot-Darstellung
Satz von Nur-Text-Labels, die beschreiben, welcher Inhalt im Creative erfasst wurde (z. B. Strand oder Auto) sowie ein Konfidenzwert (0 bis 1) für jedes Label Das Feature-Set umfasst das gesamte Wörterbuch der Labels aller Creatives. Ein Creative wird mit 0 bewertet, wenn der Labelinhalt nicht vorhanden ist, bzw. mit dem Konfidenzwert (0 bis 1), falls er es ist.
Logogröße in Pixeln

Position der linken oberen Ecke in Pixeln
Ein Merkmal für die relative Größe des Logos, berechnet als (Breite × Höhe des Logos) / (Breite × Höhe des Creatives).

Vier Merkmale (eines für jeden Quadranten), bewertet mit 1, wenn das Logo in diesem Quadranten vorhanden war, andernfalls mit 0.
Liste der Gesichter im Creative Ein Merkmal für die Anzahl der abgebildeten Gesichter, normalisiert von 0 bis 1 mit einer logistischen Funktion: 0, wenn keine Gesichter zu sehen sind, 0,5 bei ein oder zwei Gesichtern und 0,99 bei einer Menschenmenge.

Wenn diese Schritte abgeschlossen sind, können Sie mit BigQuery Informationen zu einem Creative aus der Vision API (Label, Konfidenzwert, Farbe, Auffälligkeit) zusammen mit den Daten aus der Google Marketing Platform, insbesondere dem Campaign Manager (Creative-ID, Klickrate (Click-through-Rate, CTR)), abrufen. Hier ist eine Beispieltabelle mit solchen Daten:

Creative-ID Label Konfidenzwert Farbe Auffälligkeit Klickrate
12345 Pirat 0,7 Rot 0,8 0,2 %
Hut 0,8 Weiß 0,1
67890 Oberkörper 0,6 Weiß 0,4 0,3 %
Pferd 0,9 Himmelblau 0,4
  • Jetzt können Sie diese Daten in konkrete Informationen über die Creatives umwandeln. Und Sie können mühelos die zu Beginn dieses Artikels gestellten Fragen beantworten.

Fragen Sie sich: Haben Creatives mit Naturbildern, wie Bäumen oder Stränden, eine stärkere Wirkung als solche mit Stadtansichten? Anhand von anonymisierten Daten eines Automobilherstellers werden in der folgenden Grafik die Häufigkeit, mit der ein Label vorkommt, zum Leistungsindex des Creatives ins Verhältnis gesetzt.

Grafik zur Häufigkeit, mit der ein Label vorkommt, und zum Leistungsindex des Creatives

  • Die Labels engineering (Konstruktion), blueprint (Bauplan) und schematic (Schaubild) im rechten oberen Quadranten der Grafik kommen oft vor und weisen eine gute Leistung auf. Diese Ergebnisse deuten darauf hin, dass das Anzeigen von technischen Schaubildern und Bauplänen dem Kunden den Eindruck vermittelt, dass das Fahrzeug ein präzises und ausgereiftes Produkt ist.
  • Die Labels executive (Führungskraft) und dress shoes (Abendschuhe) im rechten unteren Quadranten treten häufig auf, allerdings mit schlechten Ergebnissen. Daher werden Sie diese Arten von Creatives in Zukunft möglicherweise vermeiden.
  • Die Labels journey (Reise), forest (Wald), people (Menschen), body (Körper) und sunglasses (Sonnenbrille) im linken oberen Quadranten treten nicht häufig auf, übertreffen aber die anderen Labels in der Leistung. Dies weist auf Potenziale hin, die Sie möglicherweise übersehen haben. So könnten zum Beispiel journey + forest (Reise + Wald) Werbeanzeigen mit einer kurvenreichen Straße und atemberaubender Landschaft suggerieren oder people + body + sunglasses (Menschen + Körper + Sonnenbrille) darauf hinweisen, dass die Darstellung von Menschen wichtig ist. Vergleichen Sie diese Labels mit dress shoes + executive (Abendschuhe + Führungskraft) und Sie sehen, dass ein lockeres Image für die Werbekampagne dieser Marke besser geeignet ist.

  • Stellen Sie sich jetzt die nächste Frage: Welche Keywords kommen in den Creatives vor und wie wirken sie sich auf die Messwerte aus? Mit den gleichen Daten aus BigQuery können Sie die folgende Grafik erstellen, in der die Vorkommenshäufigkeit bestimmter Keywords zur Leistung der entsprechenden Creatives ins Verhältnis gesetzt wird. Wie die Grafik zeigt, haben Creatives mit den Keywords now (jetzt) und sale (Sonderangebot) in der Regel eine größere Wirkung als solche mit den Keywords exclusive (exklusiv) oder off (Rabatt).

    Creatives mit den Keywords

    Mithilfe dieser Informationen verstehen Sie die Wirkung aller Ihrer Creatives besser und können somit fundiertere Entscheidungen in Bezug auf ihre Bereitstellung und das Testen treffen.

Weitere Informationen