Google Cloud 및 머신러닝을 활용한 대규모 광고 소재 분석

이 문서는 Google Cloud의 머신러닝(ML) 및 데이터 웨어하우징 기능을 사용하여 광고 소재 통계를 자동화하는 방법을 알아보려는 광고 전문가를 대상으로 합니다. 여기서는 클라우드 기술을 활용하여 광고 소재 통계를 신속하게 받고, 광고 소재 품질을 효과적으로 측정한 후 그에 맞게 광고 노력을 맞춤화하는 방법을 살펴봅니다. 광고(광고 소재)의 시각적 메타데이터를 대규모로 추출하고 처리하여 고객과 공감할 수 있는 이미지와 동영상이 무엇인지 보다 잘 이해할 수 있는 방법을 알아봅니다.

이 문서에서는 다음과 같은 시스템을 설명합니다.

  • 광고 소재 파싱에 Machine Learning API를 사용합니다.
  • 대규모 처리를 위한 Pub/Sub 파이프라인을 구현합니다.
  • 분석을 위해 광고 데이터 및 이미지 콘텐츠를 쿼리합니다.

이 문서에 설명된 시스템은 다음과 같은 이점을 제공합니다.

  • 내부/외부 데이터 사이언스팀의 원시 데이터 커스텀 분석을 사용합니다.
  • 양방향 분석을 위해 네트워크, 광고주 또는 캠페인의 광고 소재 요소 및 관련 통계를 거시적으로 보여줍니다.
  • 광고 소재 최적화에 중점을 둔 이해관계자들과 공유할 수 있는 머신러닝 모델을 통해 확장 가능한 분석을 제공합니다.

이 문서에서는 광고에 Google Marketing Platform을 사용한다고 가정합니다.

소개

광고 소재의 영향 중 75%가 광고 소재 품질과 관련되어 있음에도 불구하고 광고주들은 타겟팅 및 기여 분석에 더욱 집중하고 있습니다. 이 통계에 관계없이 대부분의 분석 노력을 광고 소재의 콘텐츠에 집중하는 대신 광고 소재가 실행된 시기와 위치에 집중하고 있습니다. 이렇게 집중하는 이유는 노력 부족이 아니라 광고 소재를 분석하는 것이 매우 어렵기 때문입니다.

데이터에서 통계를 얻으려면 개별 광고 소재에 수동으로 태그를 지정하는 과정을 거쳐야 합니다. 따라서 일부 광고 소재들만 분석 가능하며, 많은 비용과 시간이 소모됩니다. 또한 광고 소재 애셋 업로드 과정이 소재 ID를 포함하는 일관된 분류 체계에 적합하지 않으므로, 실적 측정항목을 보고 이를 광고 소재와 다시 연결하는 것이 불가능합니다.

다음과 같은 질문에 대한 답을 얻는 것이 목표입니다.

  • 동영상의 처음 5초 이내에 브랜드 로고를 보여주면 브랜드 회상이 증가하는가?
  • 나무나 해변과 같은 자연스러운 실외 이미지가 있는 광고 소재가 도시 이미지가 있는 광고 소재보다 효과가 좋은가?
  • 광고 소재의 키워드가 무엇이고 측정항목에 어떤 영향을 미치는가?
  • 행복한 얼굴이 여럿 나오는 광고 소재가 더 많은 참여를 유도하는가?

현재 이러한 질문에 답하는 유일한 방법은 각 광고 소재를 살펴보고 직접 답을 구하는 것입니다. 이러한 솔루션은 확장될 수 없고 신속하지도 않습니다. 여기에 제시된 솔루션에서는 이 과정을 재고하여 분석가가 며칠 동안 모든 광고 소재를 처리할 수 있도록 합니다. 이 솔루션은 가용 데이터의 폭과 깊이를 크게 증가시키며, 만약 수동으로 태그를 추가한다면 이는 실행 불가능하거나 엄청난 비용이 발생하게 됩니다.

이 문서에서는 Pub/Sub, App Engine, Cloud Vision, BigQuery, 데이터 스튜디오와 같은 Google Cloud 기술을 사용하여 이러한 광고 소재 통계를 대규모로 자동화하는 방법을 간략히 설명합니다.

광고 소재 통계를 위한 데이터 파이프라인

데이터 파이프라인은 주로 App Engine에서 실행되며, Pub/Sub를 메시지 큐 서비스로 사용하여 한 번에 여러 광고 소재를 처리합니다. 또한 파이프라인 단계별로 다양한 App Engine 작업자들의 병렬 작업을 조정하는 방식으로 Datastore를 읽고 씁니다.

파이프라인에서는 Google Marketing Platform으로부터 광고 소재 이미지와 동영상을 가져와서 Cloud Storage에 복사합니다. 이미지와 동영상은 Vision 및 Video Intelligence API를 통해서도 실행됩니다. 그런 다음 해당 서비스에서 생성된 원시 데이터가 BigQuery에 작성됩니다. 이러한 파이프라인 구현 방법에 대한 이해를 돕기 위해 다음 섹션에서는 각 구성요소를 좀 더 자세히 살펴봅니다.

솔루션 자동화:

제안 솔루션은 다음 세 가지 단계로 구성됩니다.

  1. Vision 및 Video Intelligence API를 통해 기존 머신러닝 기능을 활용합니다.
  2. Pub/Sub을 사용하여 원하는 대로 광고 소재를 처리할 수 있는 확장 가능한 파이프라인을 만듭니다.
  3. BigQuery와 데이터 스튜디오를 사용하여 결과 통계를 저장, 쿼리, 시각화합니다.

1단계: Machine Learning API 활용

다음의 광고 소재를 예시로 살펴보겠습니다.

피부 밤 광고

Campaign Manager에서 다음과 같은 광고 관련 정보를 가져옵니다.

  • 소재 ID
  • 광고 소재 크기
  • 클릭률(CTR)과 같은 광고 측정항목. 전체 측정항목 목록은 Campaign Manager에서 확인할 수 있습니다.
소재 ID 광고 소재 이름 광고 소재 크기 노출 클릭 클릭률
12345 cbalm_lipgloss_300x300.png 300x300 80,734,829 174,696 0.2%

현재는 이름 지정 규칙이 광고 소재 자체 콘텐츠에 대한 정보를 추출하기 위한 최상의 방법입니다. 그에 비해 이 문서에서는 Cloud Vision API를 사용하여 다음 그림과 같이 이 광고 소재에서 주요 특징을 자동으로 추출합니다.

Vision API를 사용하여 광고 소재에서 주요 특징 추출

콘텐츠의 미묘한 차이를 파악하기 위해 광고 소재 이미지를 업로드하여 직접 추출해볼 수 있습니다.

신속하게 API를 사용하여 광고 소재 콘텐츠를 분석하고, 이러한 광고 소재 품질이 광고 회상과 실적에 미치는 영향을 파악할 수 있습니다. 따라서 데이터 세트에 대해 질문하기가 훨씬 쉬워집니다.

2단계: 광고 소재 파이프라인을 자동화하도록 Pub/Sub 설정

광고 소재 파이프라인을 대규모로 자동화하려면 Pub/Sub을 활용하면 됩니다. 이 서비스는 이벤트 스트림의 데이터를 수집해 데이터 웨어하우스에서 분석하기 위해 BigQuery로 전달하는 스트림 분석 솔루션입니다. 이벤트 데이터 전달을 위해 Pub/Sub을 사용하면 수천 개의 광고 소재를 효율적으로 처리할 수 있습니다. 다음 다이어그램은 광고 소재 분석을 구현하는 데 사용되는 파이프라인 설정을 간략히 보여줍니다.

기술 스택 및 아키텍처

기술 스택 및 아키텍처

위의 아키텍처 다이어그램에서 나타내는 Google Cloud 구성요소는 다음과 같습니다.

GCP 구성요소 파이프라인 역할
Pub/Sub 비동기 작업 및 메시지 큐

이 경우에는 광고 소재, 작업, 광고 소재 메타데이터, Vision API 데이터의 관리를 위해 4가지 주제를 만드는 것이 좋습니다. 이들 각 주제에는 새 입력이 표시되면 시작되는 관련 구독자가 있습니다.
Cloud Storage 파이프라인에 사용되는 이미지와 비디오의 미디어 파일 저장소에 가장 적합합니다.
App Engine 비즈니스 로직을 처리하기 위한 컴퓨팅 리소스입니다.
Datastore 작업에 대한 기본 원격 분석, 파이프라인 단계에서의 액션 조정, 메시지 집계를 허용합니다.
Cloud Logging 상태 확인, 디버깅, 상태의 로깅 리소스입니다.
BigQuery 결과 파이프라인 출력의 Datastore로, 분석을 위해 데이터 스튜디오에 공급합니다.

파이프라인의 주요 고려사항

  • 파이프라인의 시작과 끝은 모놀리식 작업 단위입니다. 파이프라인의 중간 부분은 광고 소재를 동시에 처리하며, 여기서 각 Pub/Sub 메시지는 단일 광고 소재를 전달합니다.
  • 작업은 장기 실행 프로세스로 처리됩니다(작업 당 시간/일이 소요될 수 있음).
  • 파이프라인은 임시로 실행되므로, Google Marketing Platform의 새 데이터는 다음 실행 때까지 업데이트되지 않습니다.
  • 파이프라인에는 Google Marketing Platform 속성(예: Campaign Manager)과 Cloud Storage 및 BigQuery와 같은 서비스의 소스 및 대상 Google Cloud 프로젝트에서 유래한 이 인프라를 실행하는 Google Cloud 프로젝트와 연결된 서비스 계정에 대한 적절한 권한이 필요합니다.
  • 이 파이프라인에서는 단일 광고 소재 프로세스 또는 배치 업데이트가 허용됩니다.

3단계: 데이터 스튜디오 및 BigQuery로 광고 소재 통계 시각화

예비 분석을 위해 처음에는 Vision 및 Video Intelligence API의 원시 데이터를 직접 사용할 수 있습니다. 그러나 수학적 모델링과 머신러닝을 위해서는 이 데이터의 특성을 적절한 형식으로 추출하는 것이 좋습니다. 이 솔루션에서는 수정된 원-핫 접근방식을 사용하며, 광고 소재의 각 특성을 0부터 1까지의 숫자로 표현합니다. 다음 표에서는 이 데이터의 변환 방법과 관련된 몇 가지 예를 보여줍니다.

각 광고 소재의 API 데이터 원-핫 표현
광고 소재에서 보이는 콘텐츠(예: 해변 또는 자동차)를 설명하는 일반 텍스트 라벨 세트와 각 라벨의 신뢰도 점수(0~1) 특성 세트는 모든 광고 소재의 전체 라벨 사전입니다. 각 광고 소재는 해당 라벨이 없으면 0을 가져오고, 있으면 신뢰도 점수(0~1)를 가져옵니다.
로고 크기(픽셀)

왼쪽 상단 모서리 위치(픽셀)
로고 상대 크기의 특성 한 개로, (로고 너비 × 높이)/(광고 소재 너비 × 높이)로 계산됩니다.

4가지 특성, 각 사분면에 하나씩, 로고가 해당 사분면에 있는 경우 1개, 그렇지 않으면 0개가 있습니다.
광고 소재의 모든 면 목록 면 수에 대한 특성 한 개. 로지스틱 함수로 0부터 1로 정규화됩니다. 0은 면 없음을, 0.5는 면 1개 또는 2개를, 0.99는 큰 무리를 나타냅니다.

위 단계가 완료되면 BigQuery를 사용하여 Google Marketing Platform의 데이터(특히, Campaign Manager(광고 소재 ID, 클릭률))와 함께 Vision API(라벨, 점수, 색상, 가시도)의 광고 소재 정보를 가져올 수 있습니다. 다음은 정보 테이블의 예시입니다.

소재 ID 라벨 점수 색상 가시도 클릭률
12345 해적 0.7 빨간색 0.8 0.2%
모자 0.8 흰색 0.1
67890 토르소 0.6 흰색 0.4 0.3%
0.9 하늘색 0.4
  • 이제 이 데이터를 광고 소재 통계로 바꿀 수 있습니다. 그러면 이 문서의 시작 부분에 나와 있는 질문에 대한 답을 쉽게 얻을 수 있습니다.

다음 질문으로 시작합니다. 나무나 해변과 같은 자연스러운 실외 이미지가 있는 광고 소재가 도시 이미지가 있는 광고 소재보다 효과가 좋은가? 다음 그래프는 자동차 제조업체의 익명 데이터를 사용하여 광고 소재의 실적 지표와 비교하여 라벨 발생 횟수를 보여줍니다.

광고 소재의 실적 지표에 대한 라벨 발생 횟수를 나타내는 그래프

  • 그래프의 오른쪽 상단 사분면에서는 라벨 엔지니어링, 청사진, 개략도가 자주 나타나고 실적이 좋습니다. 따라서 엔지니어링 다이어그램과 청사진을 보여주면 자동차가 정밀하게 잘 엔지니어링된 제품임을 고객에게 알릴 수 있음을 시사합니다.
  • 오른쪽 하단 사분면에서는 임원예복용 구두 라벨이 자주 나타나지만 실적은 좋지 않습니다. 나중에 이러한 유형의 광고 소재를 사용하지 않도록 선택할 수 있습니다.
  • 왼쪽 상단 사분면에서는 여행, , 사람, , 선글라스 라벨이 자주 나타나지는 않지만 피어들 보다 실적이 좋습니다. 이들 라벨은 간과했을 수 있는 기회를 보여줍니다. 예를 들어 여행 + 은 구불구불한 도로와 숨막히는 경치가 있는 광고를 연출할 수 있으며, 사람 + + 선글라스는 사람 모델의 중요성을 시사할 수 있습니다. 이러한 라벨을 예복용 구두 + 임원과 비교하면 이 브랜드의 광고 캠페인에는 캐주얼 이미지가 더 효과적이라는 것을 알 수 있습니다.

  • 이제 다음 질문을 합니다. 광고 소재의 키워드가 무엇이고 측정항목에 어떤 영향을 미치는가? BigQuery의 동일한 데이터를 사용하여 다음 그래프를 만들 수 있습니다. 이 그래프는 해당 광고 소재의 실적과 비교하여 특정 키워드의 발생 횟수를 보여줍니다. 다음 그래프에서 볼 수 있듯이 키워드가 지금판매인 광고 소재가 독점 또는 해제인 광고 소재보다 실적이 좋은 경향이 있습니다.

    키워드가 '지금'과 '판매'인 광고 소재는 '독점' 또는 '해제' 광고 소재보다 실적이 좋은 경향이 있음

    이러한 통계를 사용하면 모든 광고 소재의 영향을 더 잘 파악할 수 있으며 광고 소재 배포 및 테스트와 관련하여 더 나은 결정을 내릴 수 있습니다.

다음 단계