JapanTaxi株式会社の導入事例:BigQuery を活用して、国内最大級のタクシー配車アプリ『JapanTaxi』を支えるデータ分析基盤を構築
Google Cloud Japan Team
2011 年にリリースされ、今では、全国 47 都道府県、約 7 万台(全国のタクシー台数の約 30%)をネットワークする国内最大級のタクシー配車アプリにまで成長した『JapanTaxi』(旧 全国タクシー)。そのアプリを支えるデータ分析基盤には、2017 年冬から BigQuery が活用されています。なぜ、BigQuery が必要だったのか、同社データエンジニア 饗庭 秀一郎さんにお話いただきました。
利用している Google Cloud Platform サービス
BigQuery、Google Cloud Storage、Cloud Dataflow など写真
- データエンジニア 饗庭 秀一郎氏
BigQuery は高速で、運用の手間がなく先進的なプロダクト
そんな JapanTaxi が、そのデータ分析基盤に BigQuery を採用したのはほぼ 1 年前。サービスを通じて得られたビッグデータを BigQuery に集約して意志決定支援のためのデータ分析を行い、さらなるユーザビリティ向上や、業務効率の改善を目指しています。
「BigQuery では、数十秒おきに送られてくるタクシーの位置情報や、アプリからの注文情報(位置情報、利用時間、ユーザー情報などが含まれる)など、JapanTaxi のサービスにまつわるさまざまなデータを取り扱っています。BigQuery を選んだのは、こうしたデータを高速に、効率的に運用できるから。前者については、特にアドホック分析時の待ち時間のストレスがなくなりましたね。従来の仕組みでは数時間待たされることもざらだったので、その分、本質的な分析の方に専念できるようになりました。もちろん、後者についても BigQuery 導入の効果は大。通常、このような大規模分散処理の仕組みを自前で運用すると、そのメンテナンスには無視できない労力が発生します。その点、フルマネージドな BigQuery ではそうした手間を考える必要がなく、少人数で運用していくことが可能です。実際我々も、私ともう 1 人のエンジニアだけでこのデータ分析基盤を運用しています。」(饗庭さん)
また、BigQuery 導入の大きな目的の 1 つとして、利用者の拡大がありました。これまでは、データ分析基盤にアクセスできるのは一部のエンジニアだけだったのですが、BigQuery への移行を機に、多くの社員にこれを開放することになりました。
「データ分析基盤では、あらゆる関連データにアクセスできるよう、散在するデータの集約と共有を行っています。データベースにアクセスするのは、主に経営層、アプリ開発部隊、そしてマーケティング部隊、セールス部隊のメンバー。それぞれの組織は、マーケティング部隊がユーザーや流入元を、セールス部隊は地域や会社を軸にと、それぞれ異なる観点で分析を行うため、素早く見たい軸で分析できるようにしています。その際、大きな進歩となったのが、経営層とセールス部隊のように、普段データベースに直接アクセスしない人たちが、BI ツール経由で BigQuery に自分でアクセスできるようにしたこと。ここでポイントになるのが「自分で」という部分。従来はこうした分析を、分析チームに依頼をして処理しており、大きなボトルネックになっていたのですが、データ分析を当人が直接やれるようにしたことで、効率アップしています。ただしこの場合、使い方を誤って大きなコストを発生させる恐れもあるので、利用状況の客観的把握は必要。具体的には、先日提供が開始された分割テーブルや、β 版のクラスタ化テーブルのような新機能を利用することで、利用者が意識することなく、パフォーマンスやコストを最適化できるようにしています。こうした新機能が次々と登場してくることも、BigQuery を選んだ理由の 1 つです。」(饗庭さん)
こうした取り組みは、利用者からとても好評。これまではデータが必要になる度に開発メンバーに依頼をしてデータ収集や編集を行っていたのですが、非エンジニア層が、それぞれツールを介してデータ分析基盤にアクセスできるようになったことで、ビジネスのスピード感が大幅に増したそうです。「たとえば、セールス部隊のメンバーが、お客先のタクシー会社で、直接その場でデータを取り出しお見せするといったことが可能になりました。これはとても大きな成果だと感じています。」(饗庭さん)
Google 得意の AI サービスでさらなるデータ活用を推し進めたい
JapanTaxi では、タクシー配車アプリらしい活用方法として、β 版の BigQuery GIS(Geographic Information System)も活用しています。その具体的な使い方についても、饗庭さんに聞いてみました。「タクシーの位置情報や、注文データに含まれる位置情報は、後の分析で、地区ごとに修正するといった要件が出てきます。この際、タクシーが営業できるエリアは “行政区” で構成されているので、その中で集計する必要があります。しかし、“緯度・経度” の情報しかないと、そうした集計ができません。今回、そこに GIS をご提供いただいたことで、地理的座標(緯度・経度)情報さえあれば、直接 BigQuery 上でデータ集計ができます。特に取引先のタクシー会社にデータを提供するときは、営業区域を意識されることが多いので、そういった情報をすぐに取り出せるのはとても助かります。」(饗庭さん)
今後の活用方法と、そこに向けて求められる機能についてもお伺いしたところ、以下のような回答をいただきました。
「これまではアプリのログであったり、ユーザーの注文情報であったりとか、比較的構造化された、BigQuery と相性のよいデータを取り扱ってきました。しかし、今後は弊社で開発しているタクシー向けのドライブ レコーダーの映像や、非構造化データをいかに上手く取り扱っていくかが課題となっていきます。そこで役立ってくれそうなのが、Google Cloud Platform が誇る、画像認識系の AI サービス。Cloud Auto ML や、Cloud Vision API などといったサービスを活用して、ドライブ レコーダーの映像を分析し、車や構造体を抽出して、非構造化データを構造化するなどといったことを、運用コストを抑えつつ、行っていきたいと考えています。」(饗庭さん)
なお、AI サービスについては非構造化データだけでなく、従来のデータ分析にも活用していきたいとのこと。「BigQuery ML に注目しています。現在進めている施策の、一歩先の世界観として、社内の予測モデルのようなものを自律的に使えるようになっていったら、データ活用がより拡がっていくのではないかと期待しています。」(饗庭さん)
その他の導入事例はこちらをご覧ください。