コンテンツに移動
AI & 機械学習

Kaggle コンペ: 野球がファンを魅了する要因を機械学習で明らかに

2021年7月20日
https://storage.googleapis.com/gweb-cloudblog-publish/images/MLB.max-2600x2600.jpg
Google Cloud Japan Team

※この投稿は米国時間 2021 年 7 月 14 日に、Google Cloud blog に投稿されたものの抄訳です。

野球の試合は打率から打球速度、三振から Wins Above Replacement(WAR)まで、統計情報に事欠きません。あらゆるスポーツの中で特に分析とデータが好きな関係者とファン層がいるのは、メジャーリーグ ベースボール(MLB)であることに間違いありません。球場の選手と監督、どこでも見守っているファン層は、無意識あるいは直感的に試合の傾向と予想に基づいて常に評価し、決定を下しています。たとえば、重要な状況で打者がヒットで塁に出るかどうか、投手が打たれるかどうかなどを判断します。ところが、ファンが特定の選手やチームに熱中する理由や、試合に夢中になる要因はあまり分析されていません。これが、メジャーリーグ ベースボールが選手のデジタル エンゲージメント予測を目的とした Kaggle コンペで投げかけている課題の背後にある動機です。機械学習を利用して野球ファンの心理を分析できるのでしょうか?

このコンペでは、MLB シーズン中に現役選手ごとのデジタル エンゲージメントの測定を毎日予測するように求められます。たとえば、Joe Musgrove がパドレス創設以来初めてノーヒット ノーランを達成した後、ファンの関心はどれくらい急上昇したか?大谷翔平が好投したとき、特大ホームランを打ったとき、あるいはその両方の場合にエンゲージメントは上昇したか?試合、チーム、選手に関する豊富な情報(詳細な統計情報、受賞歴、名簿、交渉情報)に加え、ソーシャルやデジタルのエンゲージメント データが入力データとして提供されます。データ サイエンティストは、これを従来の回帰コンポーネントと時系列コンポーネントの両方に関する興味深い予測問題として認識します。こうした入力データを予測日の直前に入手するのは、最もエンゲージメントを獲得した選手を判断するために欠かせません。

試合には数多くの変数があり、ファンのエンゲージメントに影響する可能性のあるベクトルは無数にあります。オールスター ゲームに 11 回選出された Miguel Cabrera は、雪の中、シーズン初のホームランを放ってファンを歓喜させました。ときには、Musgrove や Carlos Rodón のようなあまり知られていない選手が、予想外のノーヒット ノーランで「勝利を収める」こともあります。また、ヤンキースなどの有名なチームにトレードされるだけで、4 月初旬に移籍した Rougned Odor のようにファンの関心が非常に高まることもあります。

https://storage.googleapis.com/gweb-cloudblog-publish/images/2021-04_4_MLB_Players_Digital_Engagement_Tim.max-900x900.jpg

上述の例が示すとおり、選手のデジタル エンゲージメントはシーズン中に変動が激しくなることがあり、特定の日に「トレンド」になっている選手には、さまざまな貢献者が潜在的に存在しています。各選手のデジタル コンテンツへのエンゲージメントに最も影響を与える要因を明らかにするには、データをどのように活用すればよいでしょうか?

参加の準備ができたら、Kaggle のコンペに関する詳細をご覧ください。$50,000 の賞金は 2 つの賞金カテゴリで獲得できます。コードコンペでは、機械学習スキルをテストし、全現役選手のデジタル エンゲージメントを毎日予測する最も正確な予測モデルを作成できる方を見極めます。モデルの作成期間は 7 月 31 日までで、その後の期間で評価され、受賞者が決定されます。世界中にいるデータ可視化やデータ探索の専門家にとって、説明性に関する賞は、デジタル エンゲージメントに最も影響を及ぼす要因(私たちが直接提供しているもの以外の要因も含めて)をさらに広く分析する機会になります。調査結果を裏付けるために、データが指し示す内容をどれだけうまく利用できるかが評価されます。

また、参加を検討されている方に、紹介動画ノートブック チュートリアルをご用意しています。その中には、Cloud Notebooks、Explainable AI、Vizier などのツールを通じて Vertex AI の機能を活用するためのガイドも含まれています。

シーズン後半に入った今こそ、MLB ファンになる絶好のタイミングです。今回の Kaggle コンペは、データ サイエンスを使用して野球ファンを理解し、その過程で称賛を得られる絶好の機会でもあります。ぜひご参加ください。


メジャーリーグ ベースボールの商標および著作権は、メジャーリーグ ベースボールの許可を得て使用されています。MLB.com をご覧ください。


-Kaggle コンペティション プログラム管理担当責任者 Julia Elliott

-データ サイエンス デベロッパー アドボケイト Alok Pattani

投稿先