株式会社サイバーエージェントの導入事例:動画広告クリエイティブソリューション『VS(バーサス)』に Google Cloud Vision API を導入
Google Cloud Japan Team
現在、多くのエンジニアが注目し一大トレンドとなっている「機械学習(Machine Learning )」。Google Cloud Platform でも、さまざまな ML 系 API が提供されています。今回は画像解析 API「Google Cloud Vision API」の活用事例を紹介します。


■ 写真左から
株式会社サイバーエージェント
オンラインビデオ総研 所長 酒井 英典さん
AI Studio AI Lab 次世代ブランド戦略室 データサイエンティスト 杉尾 樹さん
インターネット広告事業本部 ブランドクリエイティブ局
プランニンググループ シニアプランナー 箸尾 拓哉さん
(利用している Google Cloud Platform サービス)
Google Cloud Vision API
■ 株式会社サイバーエージェント
インターネット広告国内 No1. の売上高・営業利益率を誇るインターネット広告代理店事業を筆頭に、「AbemaTV」や「アメーバブログ」等を主軸としたメディア事業、複数のヒットタイトルを持つスマートフォンゲーム事業を柱として展開するインターネット総合サービス企業。現在は日本を含む全 10 か国に進出しており、2016 年時点での正社員数は約 4000 名に。
関連:インターネット広告事業の情報サイト「CyberAgent AD.AGENCY」
『VS』で動画広告のブランドリフト効果を客観的に測定
国内インターネット広告業界でトップシェアを誇る、インターネット広告代理店として知られる株式会社サイバーエージェント。以前紹介したゲーム事業領域の事例で言及された「あした会議」や「ヒダッカソン」など、未来に向けた研究・開発についても定評のある企業です。もちろん、広告領域においてもその社風は健在。今回お話をお伺いした酒井さんが所長を務める「オンラインビデオ総研」では、いまだ黎明期とも言える Web 動画メディアについての研究を行うことでオンラインビデオ市場の健全な発展に寄与しようとしています。そんなオンラインビデオ総研が取り組んでいる、これまでにない動画広告のクリエイティブソリューションが「VS」。これは一体どういったものなのでしょうか?
「現在、急激な勢いで増え続けている Web の動画広告ですが、これらは大きく 2 つに分けることができます。1 つがダイレクトにインストールや、CPA(Cost Per Acquisition)を取っていくようなレスポンス型広告。もう 1 つが、テレビ CM に代表される、認知・ブランドイメージ向上を目指すブランディング広告です。『VS』はそのうち後者をターゲットにしたクリエイティブ分析ソリューションとなります。」※1(酒井さん)
こうしたソリューションが求められるようになった背景には、ブランディング動画広告のほとんどが、TVCM 素材からの流用となっているという現実があります。同じ動画ということで多くの企業がこれを何の疑問もなく流用しているのが現実なのですが、冷静に考えてみれば TV と Web 動画では、見る装置や、見る場所が異なっています。「クリエイティブによっては TVCM と Web 動画との相性が良くないケースもあるのではないかという仮説から『VS』の開発をスタートしました。」(酒井さん)
『VS』では、実際のブランディング広告(動画)の構成要素を客観的に評価することで、動画広告のブランドリフト効果を検証。VS ポイントというかたちで採点した上で、より効果的な(VS ポイントを向上する)表現を提案します。
「これまでこうした提案はクリエイティブ担当者の経験やセンスなど、属人的で、数値化できないものに頼ることがあったのですが、それを定量的な分析結果と紐付けてコンサルティングしたいと考えたのです。」と語るのは、同社インターネット 広告事業本部 ブランドクリエイティブ局でプランナーを務め、『VS』の開発にも 深く関わっている箸尾 拓哉さん。 なお、『VS』の第 1 ステージでは、こうした分析を人力で行っていました。その後、ブランドリフトに寄与する要素を、企業・サービスロゴの位置やサイズ、コピー要素、背景要素、キャスト要素など、約 100 種類のタグにこれを集約。その組みあわせによって広告の効果を評価していたのです。
「バナー広告のクリエイティブでも、表現要素を分析して最適化するということはやっています。そういう意味では『VS』はその延長線上にあるものです。ただ、動画は静止画のバナーと比べてとても要素が増えます。その組みあわせで善し悪しを判断しようとすると統計モデルを組む必要があると考えました。そして、それこそ が『VS』の最大のポイントと言えるでしょう。」(箸尾さん)
そんな『VS』は、昨年 11 月から、まず YouTube に特化した『VS for YouTube』と いう形で運用開始。全く同じ広告配信条件下で『VS』を利用した場合としなかった場合でブランドリフト値に差が出ることを確認できたなど、早くもその効果を発揮しつつあります。
Google Cloud Vision API が『VS』を新たなステージへ導く
そして今、オンラインビデオ総研では、『VS』をさらに強力なソリューションとすべく、Google Cloud Vision API を活かした機能強化版を開発中。Vision API の動画自動解析機能を利用して、構成要素の抽出を一部自動化するなどといった挑戦を始めています。この革新について、同社で人工知能に関する研究・開発を行う AI Studio AI Lab 所属のデータサイエンティスト・杉尾 樹さんは、次のように説明してくれました。「実は、Vision API を使おうという話は、『VS』の開発当初からありました。しかし、当時はどのような構成要素がブランドリフトを向上させるか未知であったため、まずはクリエイターの知見を元に変数を作成していく、人力での開発を進めました。その結果をふまえた上で、現在は Vision API を使って、一部のタグ付けを自動化することに成功しています。しかし、最終的に『VS』の全てを AI 任せにするかというと、答はノー。例えばロゴの大きさや動きなどは Vision API で解析できますが、青年がドリンク片手に駆け抜けているシーンから『清涼感』というメタな情報のラベリングをすることは無理ですからね。そこは適材適所で棲み分けていくべきだと考えています。」
ちなみに、現在の『VS』では、内容の評価を行っているのは冒頭と末尾の 3 秒ずつ。もし、それが単に手間の問題なのであれば、AI を駆使することで解決可能なように思えるのですが、現在はあえてそうしていないそうです。
「冒頭末尾の 3 秒を分析対象としたのは、手間の問題だけが理由ではありません。
開始 5 秒後からスキップ可能となる Web 動画の仕様(YouTube 視聴時、冒頭に挿入される動画広告「TrueView」の場合)や、末尾に視聴者への呼びかけ要素が配置されることなどを考慮し、特にその合計 6 秒が重要だと考えました。また、開始 5秒ではなく 3 秒を対象としたのは分析対象のシーン数を制限し、考察しやすくする意図もあったためです。」(箸尾さん)
「もちろん手間と時間をかけて全ての内容を分析することもできますが、それによって、得られるアウトプットが複雑化し過ぎると、かえってクリエイティブ制作過程の意思決定が混乱してしまいます。『VS』の本来の目的は、クリエイターやクライアントの意志決定をサポートすること。であれば、冒頭と末尾の、本当に重要な部分だけに注目した方がハラオチしやすいのではないでしょうか。」(杉尾さん)
「この 6 秒間は、動画広告の中でも特に最適化しやすい部分でもあります。また、 全てを『VS』でやろうとするのではなく、あくまでサポートに徹することが大事。 『VS』で提案するのはあくまでベースの部分。データが出した分析結果と、人間的なアイデアを掛け合わせて良いものを作るのが目的です。クリエイターの想像力を縛るようなものにはしたくありませんでした。」(酒井さん)
今回、あくまで人力のサポートということで活用されている Vision API ですが、杉尾さん曰く、「とは言え、今後はより活用される領域が広くなっていくでしょう。」とのこと。「たとえば、バナー広告などの画像系クリエイティブを Vision API でスコアリングし、データ化された “良いクリエイティブ” という客観的指標を配信ロジックに組み込んでいくことはチャレンジしてみたいですね 。そして、何よりうれしいのが、そのようなことが Google のサービスを使うと、驚くほど手軽にできてしまうこと。Vision API 以外の ML 系 API とか、TensorFlow、そして、Bigtable や BigQuery などまで、Google Cloud Platform には便利なものがたくさんあって、それを自由に、低コストに使える。これは発想を実現するための手段として素晴らしいですね。また、最近では Spanner が気になっています。今後、グローバル展開が重要視されていく中、スケールしやすい RDB(Relational Database) として、有望な選択肢の 1 つになるんじゃないかと AI Studioでも話題になっているんですよ。」(杉尾さん)
昨年 11 月のリリース以来、すでに 60 件を越える案件で活用されている『VS』。 最後に、今後の展開予定についても聞いてみました。
「最近、実際の利用事例を聞いてなるほどと思ったのは、すでに存在する TVCM 素 材の中から、どれが YouTube での配信に向いているかの判断に『VS』をつかった というもの。そういう使い方もあるのだな、と。」(酒井さん)
「Vision API の導入と並行して、業界別の『VS』を立ち上げていこうと計画中です。金融系だったり、飲料系だったり、エンタメ系だったり、業界によって特徴のある表現要素を分析していきたいです。また、『VS』を初速の効果最大化の為の活用だけでなく、運用フェーズでも配信効果の測定と紐付けて、PDCA を回していくようなソリューションにしていきたいと考えています。」(箸尾さん)
※1 配信実績を他社に公開することはありません。抽象的なクリエイティブ要素の特徴を数値化した上で、分析をしています。また、本サービスは、クリエイティブの冒頭と末尾の 3 秒間に限定した分析のため、特定のタレントやストーリーを指定することはなく、クリエイティブが類似してしまうことはありません。
GCP のその他の導入事例はこちらをご覧ください。