コンテンツに移動
データ分析

Twitter、Google Cloud を使用したデータの有効活用で新たな高みに到達

2022年5月26日
https://storage.googleapis.com/gweb-cloudblog-publish/images/twitter_bq.max-2600x2600.jpg
Google Cloud Japan Team

※この投稿は米国時間 2022 年 5 月 18 日に、Google Cloud blog に投稿されたものの抄訳です。

Twitter は、多様な人々、視点、アイデア、情報が集まる、オープンなソーシャル プラットフォームです。人々の注目度が高いトピックに関する情報を収集、作成、配信、発見できるよう、自由でグローバルな会話を促進することを目的に活動しています。

2006 年に設立された Twitter は、常に新しい技術に目を向け、移り変わりの激しい時代のニーズに応える最新のプラットフォームを維持し続けています。こうした初期投資は、Twitter のプロダクト促進に役立ちましたが、最新のオープンソースに相当するものよりも先行していました。時代の変化に対応するためにより多くのオープンソース技術を活用したいと考えた結果、収集したデータをユーザー エクスペリエンスを最大化するために使用したいと考えました。そのためには、これまでの運用ツールのデータ処理技術をさらに短時間化し信頼性を向上させる必要がありました。Twitter の開発者が複雑な手作業を自動化し、自分たちの負担を軽減できるデータ処理技術を開発する必要があったのです。こうして、Twitter がツールをモダナイズし、プロダクトの進化や広告主とのパートナーシップに変革をもたらすような貴重な分析情報を得る機会が生まれました。Twitter は、業務全体のデータ処理のアプローチを標準化および簡素化する計画のもと、Google Cloud の BigQuery にオペレーションを順次移行しました。

複雑で競争の激しいプログラマティック広告の世界では、データ分析情報の関連性、品質、解釈は、企業が常に変化するニーズに対応するために不可欠です。大規模なデータ処理へのアプローチを合理化する能力は、Twitter が自社の目標を広告主やお客様の目標に合わせるという計画において、すぐに頼みの綱となりました。最近の広告データのオンプレミスから Google Cloud への移行により、Twitter はいくつかの Google Cloud ソリューション、なかでも BigQuery や Dataflow を活用してこの素晴らしい連携を促進させました。

BigQuery を活用して広告パートナーシップとデータ抽出を改善

広告主やお客様と企業の目標を一致させることは大きな課題ですが、Twitter のように何億人もの熱心なユーザーがいる企業にとって、すべてのグループのニーズをバランスよく満たすアプローチを開発および実行することは複雑なタスクであることが実証されています。Twitter 収益チームの Google Cloud 導入を担当するシニア データ サイエンティストの Pradip Thachile 氏は、このプロセスを、Twitter チームが広告パートナーと協力して、自社と広告パートナーの目標を中心とした仮説的アプローチを開発およびテストするための一種のフライホイールに例えています。Thachile 氏は、関係者全員のビジネス成長の最適化を視野に入れ、これらの目標を総合的に判断するうえで、BigQuery ソリューションが果たすべき本質的な役割を次のように述べています。「これらをすべて組み合わせることは、規模が大きい場合は簡単なことではありません。達成するためには、このような科学的学習フライホイールを構築できるようになるしかないのです。BigQuery は重要なコンポーネントです。というのも、BigQuery による仮説から実際のアクションに移すまでの速度が非常に速いからです。」

Twitter のあらゆるデータを取り込み、移動させ、価値ある分析情報を抽出するための重要なサービスとして、BigQuery は近年の Twitter の社内生産性の最適化と収益拡大を支えるエンジンです。

Dataflow を使用した生産性の最適化と価値創出のためのデータ モデリング

フルマネージドのストリーミング分析サービスとして、Dataflow は Twitter の生産性向上に大きく貢献する時間節約ソリューションであることが証明されました。スケーリングのための手作業に費やす時間の短縮を通じて、Dataflow は Twitter における典型的なデータセットの動きをシームレスかつ巧みに整理し、テンプレート化することを容易にします。運用ツールのキャリブレーションに割く時間を減らすことで、Twitter のチームはデータの分析情報をさらに活用するための革新的な方法の調査と開発に関する、より価値の高いタスクに集中できます。

Google のデータに関する専門知識による信頼性の高いサポート

データに関する専門知識で知られる Google Cloud は、Twitter へのテクニカル サポートに大きく寄与しました。Twitter では、BigQuery の大量のデータ取り込み機能を活用する際、取り込みの速度に関するガイダンスとして Google Cloud プロダクト チームに日常的にアクセスしていました。大まかに言うと、Google Cloud のサポートチームは、Twitter のパフォーマンスを向上させるためのホワイト ペーパーやユースケースなど、貴重なリソースを提供しました。Thachile 氏は、Google Cloud のサポートの価値について、「Google Cloud は、非常に効果的かつ段階的なサポートのレイヤを提供してくれます。こちらが望むだけ問題の解決に協力してくれます」と説明します。

Twitter による BigQuery の利用方法の詳細については、Twitter のこちらのブログをご覧ください。


- Twitter 社 Cloud 導入リード Pradip Thachile 氏
投稿先