Google Cloud

『ドラゴンボールレジェンズ』の舞台裏を支える Google Cloud

2018年6月28日

Google Cloud Japan Team

Posted by Google Cloud ゲームテクニカルスペシャリスト　サミールハムディ

バンダイナムコエンターテインメント（BNE）の『ドラゴンボールレジェンズ』は、人気の高い『ドラゴンボール』シリーズをモチーフとした、全世界のゲーマーに向けて配信を開始した新しいモバイルゲームです。このゲームを支えるクラウドインフラストラクチャの計画は、特殊な課題を抱えていた BNE が、その解決のために Google Cloud と話し合いを持った 2017 年 2 月にスタートしました。

https://storage.googleapis.com/gweb-cloudblog-publish/images/QQ5k9fJHmbSvVzZLxumeC2Y5D4xyvwXjzhnIrw2Kzq.max-1600x1600.PNG

BNE は、自ら予測する需要に基づいて、次の 3 つの意欲的な要件を設けていました。

極端なまでのスケーラビリティ : このゲームは全世界に配信されるため、数百万のプレーヤーが参加してもびくともしないスケーラビリティの高いバックエンドが必要でした。
グローバルネットワーク : このゲームはプレーヤー同士のリアルタイム対戦をサポートするため、地域の枠を超えて信頼性が高くレイテンシが低いネットワークが必要でした。
リアルタイムデータアナリティクス : このゲームはプレーヤーの行動に基づきリアルタイムで発展するように作られているため、データウェアハウスにデータをストリーミングするデータアナリティクスパイプラインが必須でした。プレーヤーがどのようにプレーしているかを計測して評価し、臨機応変にゲームを調整できるようにするのです。

この 3 つの要件は、いずれも私たち Google が多くの経験を有する分野です。Google は、10 億人以上のユーザーを対象とするグローバルサービスを複数運用し、サービスが生成するデータを活用して継続的にサービスを改善しています。Google Cloud Platform（GCP）は、これらの Google サービスと同じインフラストラクチャで実行されているため、GCP のお客様は Google と同じテクノロジーを活用できます。

以下では、BNE がドラゴンボールレジェンズのインフラストラクチャ構築に向けて Google Cloud と行った共同作業を紹介します。

課題 1 : 極端なまでのスケーラビリティ

日本のゲーム会社は MySQL を多用しています。日本のエンジニアたちは、スキーマ、SQL クエリ、強整合性を備えたリレーショナルデータベースの扱いに慣れています。MySQL ならアプリケーションサイドの多くのことが単純化されます。結果整合性やスキーマレスといったデータベースの弱点を処理しなくて済むわけです。MySQL はゲーム以外でも広く使われており、ほとんどのバックエンドエンジニアが MySQL の経験を有しています。

このように MySQL には多くの利点がありますが、一方でスケーラビリティが低いという大きな限界を抱えています。実際、スケールアップデータベースとして MySQL のパフォーマンスを上げたければ、CPU や RAM、もしくはディスクの増設が必要です。確かに、シングルインスタンスの MySQL で負荷を処理できなくなっても、シャーディングで負荷を分散することは可能です。ユーザーをグループ分けし、複数の独立した MySQL インスタンスに振り分けるのです。

ただし、シャーディングにはいくつも欠点があります。リシャーディングは労力がかかり、エラーを起こしがちなので、ほとんどのゲーム開発者は配信前に、必要とされるシャード数を計算します。そのとき、想定以上のプレーヤーが殺到しても対応できるように、データベースを過度にプロビジョニングしてしまう傾向があります。プレーヤーの規模が予想どおりになれば問題はありません。しかし、ゲームが途方もない成功を収めて需要が予測を超えたらどうなるでしょうか。アクティブなプレーヤーが少しずつ減るロングテールを起こしたり、まったくの失敗に終わったりしたらどうなるでしょうか。MySQL のシャーディングは動的にスケーラブルなものではなく、サイズの調整にはメンテナンスが必要でリスクもあります。

理想は、リレーショナルデータベースのすべての利点を有しながら、ダウンタイムなしでスケールイン、スケールアウトできるデータベースです。BNE は、ドラゴンボールレジェンズで予測される大量のトラフィックを MySQL で処理したいという意向を持っていましたが、私たち Google は Cloud Spanner を使うことを提案しました。

なぜ Cloud Spanner なのか
Cloud Spanner は、MySQL のものとよく似たスキーマで強整合性を維持しつつ、水平スケーラビリティと高可用性を提供するフルマネージドのリレーショナルデータベースです。マネージドサービスなのでメンテナンスは Google SRE に任せることができ、ダウンタイムのリスクもありません。私たちは、BNE がゲームをグローバルに展開するうえで、Cloud Spanner がきっと役に立つと考えたのです。

https://storage.googleapis.com/gweb-cloudblog-publish/original_images/Cloud2BSpanner2BMR2Banimation9vci.GIF

評価から実装へ
新技術を採用するときは、実際のシナリオで期待どおりのパフォーマンスが得られることを確認するため、必ずテストが必要になります。BNE は、MySQL を手放す前に、GCP に新しい Cloud Spanner のインスタンスを作り、MySQL で使っていたものとよく似たスキーマのテーブルも作りました。BNE のバックエンド開発者たちは Scala を使っていたので、Cloud Spanner の Java クライアントライブラリを選択して Cloud Spanner のロードテストコードを書きました。ピーク時に 3 万 QPS（1 秒あたりのクエリ数）に達するクエリについていけるかどうかをテストしたのです。Google の担当エンジニアと Cloud Spanner エンジニアリングチームも協力して、この目標は楽にクリアしました。さらに BNE は、INSERT、UPDATE、DELETE などの SQL コマンドを書くために独自のデータ操作言語（DML）まで作りました。

ゲームリリース
概念実証を終えた BNE は実装を開始しました。予想されるデイリーアクティブユーザー（DAU）に基づき、BNE は必要とされる Cloud Spanner ノードの数を計算しました。予想される事前登録者に十分なサービスを提供できる数です。配信開始に備え、バックエンドの評価のために 2 度にわたるクローズドベータテストを実施しましたが、データベースでは何の問題も発生しませんでした。ドラゴンボールレジェンズの事前登録者は最終的に全世界で 300 万人を超えましたが、これだけのユーザーを抱えながらも、ゲームの正式リリースは問題なく成功しました。

要するに、BNE はデータベースの操作に時間を費やすことなく、ゲームの改良に集中することができたのです。

課題 2 : グローバルネットワーク

BNE の第 2 の課題に移りましょう。プレーヤー同士がリアルタイムで対戦できるゲーム（PvP）の構築がそれです。ドラゴンボールレジェンズでの目標は、世界中どこにいても、すべてのプレーヤーが別のプレーヤーと対戦できるようにすることでした。ネットワーキングについて少しでも知識があれば、この場合、レイテンシが問題になることは容易に想像がつくでしょう。

たとえば、東京とサンフランシスコ間のラウンドトリップタイム（RTT）は平均で 100 ミリ秒程度です。そこで BNE は、ゲームのすべての時間を 250 ミリ秒に分割しました。ユーザーにはリアルタイムのように見えても、実際には高速に交替してプレーをしています（アーキテクチャの詳細はこちらをご覧ください）。250 ミリ秒もあればレイテンシへの対処には十分だと思われるかもしれませんが、インターネット経由で通信する場合にはレイテンシの予測はきわめて困難です。

Google 専用ネットワークのメリット
ゲームクライアントがインターネット経由で GCP 上のサーバーにアクセスする様子を図示すると、次のようになります。ホップ数が毎回まちまちなので、PvP の体感速度もまちまちになります。

https://storage.googleapis.com/gweb-cloudblog-publish/images/GLYwJmpTlz5kdNoaT7LqJ4XN0p8NHc9KX6Bbhv-j8y.max-1000x1000.PNG

BNE がドラゴンボールレジェンズのバックエンドとして GCP を使用することにした主な理由の 1 つは、Google の専用ネットワークです。下図からもわかるように、全世界で数百万に上る GCP の POP（接続拠点）のいずれかにゲームクライアントがアクセスすると、Google の専用ネットワークにつながります。これでホップ数は予測可能になり、レイテンシは最小限に抑えられます。

https://storage.googleapis.com/gweb-cloudblog-publish/images/CEupTz5im48n3KnsoOBqicBtPNE7ORKzckZyssZ6HB.max-1000x1000.PNG

Google Cloud Networking の活用
ゲーム会社は通常、2 人のプレーヤーを直接つなぐか、専用ゲームサーバーを間に挟んで PvP を実現します。プレーヤー間のレイテンシを抑えたい戦闘ゲームの場合は、一般に P2P 通信が使われます。2 人のプレーヤーが地理的に近い場所にいれば P2P はうまく機能しますが、距離が遠くなると信頼性が失われがちになります（P2P プロトコルをブロックするキャリアもあります）。

異なる大陸間で 2 人のプレーヤーが通信するときは、まずは P2P による通信を試みます。うまくいかなければ、coturn という STUN/TURN サーバーのオープンソース実装にフェイルオーバーして、Google の専用ネットワークを介して通信します。これが 2 人のプレーヤーのリレーとして機能します。大陸間バトルでは、レイテンシが低く信頼性が高い Google ネットワークをできる限り活用するのです。

https://storage.googleapis.com/gweb-cloudblog-publish/images/QvVho3kenBLBXRU8im7VEH4HKCqWu1_uJ1L7tizOWB.max-1300x1300.PNG

課題 3 : リアルタイムデータアナリティクス

BNE の最後の課題はリアルタイムのデータアナリティクスでした。BNE は最高のユーザーエクスペリエンスをファンに提供する方法の 1 つとして、オペレーターによるゲームの変更を定期的に行い、新鮮味を感じさせるライブオペレーション（LiveOps）を実施しようとしていました。ただし、プレーヤーのニーズを知るためにはデータ、つまりユーザーアクションのログデータが必要です。リアルタイムでデータが得られれば、ユーザーの満足度を上げてプレー時間を延ばすためにどのような変更を加えるかを判断できます。

このデータを収集するため、BNE は Cloud Pub/Sub と Cloud Dataflow を組み合わせてユーザーデータをリアルタイムで変換し、BigQuery に転送することにしました。

Cloud Pub/Sub はグローバルに信頼性の高いメッセージングシステムです。Cloud Dataflow が処理できるようになるまで、ログをバッファリングします。
Cloud Dataflow はフルマネージドの並列処理サービスです。リアルタイムで並列に ETL を実行できます。
BigQuery はフルマネージドのデータウェアハウスです。ゲームのすべてのログを格納します。BigQuery はペタバイト規模のストレージを提供するため、スケーリングが問題になることはありません。ログのクエリ処理の並列度が高いため、BNE はわずか数秒で数テラバイトのデータをスキャンし、クエリの応答を得られるようになりました。

このシステムにより、ゲームプロデューサーは、ほぼリアルタイムでプレーヤーの行動を可視化し、ファンを満足させるためにどのような新機能をゲームに投入するか、ゲーム内をどのように変更するかを判断できるようになりました。