コンテンツに移動
顧客事例

MLB とタッグを組み、スポーツ分析で逆転ホームラン

2022年4月19日
https://storage.googleapis.com/gweb-cloudblog-publish/images/mlb_2022.max-2600x2600.jpg
Google Cloud Japan Team

※この投稿は米国時間 2022 年 4 月 7 日に、Google Cloud blog に投稿されたものの抄訳です。

編集者注: メジャーリーグ ベースボール™(MLB™)は、Google Cloud と提携して、大量のデータを活用するユースケースを増加させています。この投稿では、Google Cloud サービスを使って選手、ファン、放送局のために新機軸を打ち出している MLB の事例を紹介します。MLB のソフトウェア エンジニア シニア ディレクターである Rob Engel 氏の寄稿に感謝いたします。


野球と統計学は、長きにわたり密接な関係にあります。150 年以上前、初めてのプロ野球の試合でピッチャーが最初のボールを投げた日から、グラウンドにおけるすべてのアクションは、米国における人気の娯楽の歴史として集計され、追加され、平均化され、記録されています。収集される野球データの数と種類が爆発的に増加していく中で、クラウド コンピューティングの登場は、まさに試合の流れを変えたといえます。

最近では、MLB™ は、2,430 にものぼるレギュラー シーズンの各試合において、クラウド テクノロジーを用いて 2,500 万の固有のデータポイントを収集、分析しています。選手たちに完成度の高い試合をしてもらえるよう、ファンにゲームをさらに身近に感じてもらえるよう、MLB がデータを使ってどうグランドスラムを達成しているかをご説明します。

Video Thumbnail

スタジアムにおける、剛速球より速いコンピューティング

バッティング練習が始まった瞬間から、サヨナラヒットで試合が終了するまで、MLB は、グラウンドにおけるすべてのデータを収集しています。Statcast では、選手とボールのトラッキング技術により過去には不可能だった方法で、膨大な野球データの収集と分析が可能になりました。2020 年以降、Statcast は Hawk-Eye システムを利用しています。このシステムは、MLB の全 30 球団のスタジアムに設置された 12 台の高解像度カメラで、各選手の体に付けられた 18 の独自のポイントにより、ボールと選手のすべての動きを毎秒 30 フレームで追跡します。ボールがピッチャーの手から離れた瞬間から、Hawk-Eye はバッターに届くまでのスピードや軌道のアングルを含めた 60 ものデータポイントをキャプチャします。

これらのカメラは、Anthos Google Kubernetes Engine クラスタを使って現場での処理を行い、ビデオフィードを構造化データに変換し、スコアボードと放送局に即座に送信します。その結果、時速 153 km の投球よりも速く、統計データが表示されるようになりました。自宅で観戦するファンにも、Hawk-Eye はストライク ゾーンをライブで可視化して表示します。

「Anthos を使えば、Google Cloud で実行しているソフトウェア インフラストラクチャのすべてをオンプレミスで再現できます」「オンプレミスでデプロイされているので、やることはほぼ変わりません」と、MLB のソフトウェア エンジニアリング シニア ディレクター、Rob Engel 氏は話します。こうしたデプロイ環境における統一性は、クラウドやデータセンター、スタジアムで作業することもある MLB の開発者にとって、非常に重要なポイントです。

Anthos は、スタジアム内のシステムに障害が起きたときに、バックアップ ソリューションを提供するピンチヒッターとしても活躍します。例えば、ヤンキー スタジアム™ からの放送が停止したとしても、MLB は同じニューヨーク市内にあるメッツ本拠地のシティ フィールド™ やクラウド上でコードを実行することで、放送を中断せずに続けることができます。Engel 氏は「スタジアムで問題が発生しても、Google Cloud にすぐデータを送って、その場で対処することができます」と話します。

スーパープレイにコンテキストを加える

スタジアム内のデータと、長年蓄積されてきた Statcast のデータを組み合わせてみたらどうなるでしょうか。MLB のプロダクト マネジメント VP である Josh Frost 氏は次のように説明します。「例えば、ボールの速度が時速 177 km だったとします。これってすごいことでしょうか?それとも大したことないですか?リーグ全体で比較するとどうでしょう?これこそが、私たちが組織として最も注力しているポイントです。ただ単にデータを提供するだけではなく、それに意味を付け加えて、さらに試合を楽しめる情報にするのです」。

Hawk-Eye は時速 153 km の投球を正確な位置で計測することができますが、その投球がボールかストライクか、あるいは一塁でセーフかどうかを判断し、采配を振るうのは審判です。そこで、手作業のオペレーターの出番です。ボールが投げられる前に、MLB のスタッフは、現在のピッチャー、バッター、イニングなどのメタデータを手作業でタグ付けします。

試合中も、MLB は定期的に試合データを Google Cloud にアップロードしています。そのデータ量は、1 シーズンで実に 25 テラバイトを超えます。選手のポジショニングの追跡データは Bigtable に、それ以外の試合データはすべて Cloud SQL for PostgreSQL に保存されています。毎晩、MLB は  Dataflow を使ってバッチジョブを実行し、試合データを Bigtable と  Cloud SQL から  Cloud Storage バケットと  BigQuery に移動させます。

https://storage.googleapis.com/gweb-cloudblog-publish/original_images/MLB_Video_architecture_clip_short_7.gif

150 年の歴史を持つ野球のルール体系をロジック化した MLB Gameday Engine では、MLB のライブ トラッキング統計と、打率、三振、打席数などの従来の統計が組み合わされています。そのため、選手が秒速 9 メートルで疾走して三塁への盗塁を決めると、MLB ではスピードがランク付けされ、その選手がランナーとしてトップレベルかどうかがコンテキストとともにすぐに提供されます。

データの無限の可能性を提案

今行われている試合の記録、これまでの試合の記録、そして試合前、試合後の記録はすべて MLB Stats API へと送られ、Baseball Savant といった消費者向けツールに配信されます。ファンはこのツールで、飛距離や打球角度などを検索することができます。これは放送局にリアルタイムのユースケースのほか、MLB アプリ、 Film Room なども活用されています。「メジャーリーグにおける成績の確認から、選手の獲得、モデルの実行、選手の成績の推移まで、あらゆるデータを API で取り込んでいます。エンドレスです」と Arizona Diamondbacks™ のベースボール システム ディレクターの John Krazit 氏は話します。

データの無限の可能性とともに、MLB はさらに新しく素晴らしい経験を準備しています。今年、次にバッター ボックスに入るのは、FieldVision です。これは、Bigtable に蓄積された Hawk-Eye のモーション追跡データを使って、グラウンドを 3D で見ることができる技術です。FieldVision のサービスは MLB がこれまで提供してきたサービスをはるかに凌駕し、グラウンドにおけるあらゆるモーションを再現可能で、観客はデスクトップからでもモバイルアプリからでも、まるで実際に球場にいるかのような臨場感を楽しむことができます。

さあ、ホームランをかっ飛ばしましょう。


メジャーリーグ ベースボールの商標および著作権は、メジャーリーグ ベースボールの許可を得て使用されています。MLB.com をご覧ください。

- Google、デベロッパー アドボケイト リード、Priyanka Vergadia
投稿先