アフリカのスーパーアプリ Yassir、BigQuery への移行でデータ活用を促進
Hamdi Amroun
Head of AI, Yassir
Maniganda Perumal
Data Platform Lead, Yassir
Yassir は、アルジェリア、モロッコ、チュニジア、南アフリカ、セネガルの 45 以上の都市で、配車サービス、ラスト ワンマイル配送、金融サービスのソリューションによってユーザーの日常生活をサポートするスーパーアプリです。消費者だけでなく、ドライバー、宅配業者、レストランなど、当社のプラットフォームを利用してビジネスを運営している事業者にもサービスを提供しています。
Yassir では、あらゆるサービスにおいて最適で信頼性の高いソリューションをユーザーに提供するために、さまざまなデータセットを処理しています。また、そのデータに基づいてサービスを継続的に改善しています。しかし、以前のインフラストラクチャでは、データと AI の統合が困難であるという問題がありました。
以前は、2 つの別々のデータシステムがありました。1 つは、Databricks を使用して ML モデルのデプロイとトレーニングを行うもの、もう 1 つは、Google Cloud と BigQuery を使用してデータを保存および分析するものです。そのため、フォーマットの非互換性など、解決できない問題がいくつか発生していました。さらに、Databricks からデータを取得して Google Cloud 内で処理することもできず、この断絶がアプリケーションのパフォーマンスに直接影響していました。
こうしたサイロ化された環境により、データ プロジェクトの開発や保守では作業が重複することが多く、別々の環境を維持するための費用もかかっていました。そのうえ、チームが必要とする情報をタイムリーに入手できないこともよくありました。
こうした問題に対処するため、Yassir では、Google Cloud でデータ インフラストラクチャを統合し、これらのすべての機能を 1 か所に集約することにしました。この移行により、データへのアクセス性やスケーラビリティが向上し、パフォーマンスを分析、確認、改善する新たな機会が生まれることを見込んでいます。
より柔軟な統合データ プラットフォームの構築
Google Cloud チームとのこれまでの関係が強固な基盤となり、データ接続の問題の解決だけでなく、BigQuery を使用した新しいデータ処理ワークフローの実装や、Vertex AI による新しい AI モデルや ML モデルのデプロイにも役立ちました。また、データ プロバイダを 1 つに絞ることで、費用の確認と管理を 1 か所で行えるようになり、データ ガバナンスのシンプルな一元管理も実現できました。成長を続ける当社にとって、費用最適化のためにクラウド使用量をスケールアップ / スケールダウンしてプロジェクトごとの厳密なコミットメントなしでテストや反復処理を行えるという柔軟性は、非常に貴重です。
当社は Google Cloud チームと緊密に連携して、成長目標に合致するソリューションを設計しました。具体的には、技術ワークショップや戦略ワークショップに参加することで、BigQuery の詳細やそのリアルタイム性、ガバナンス、オープンソースなどの側面について学べるようチームを支援し、エンジニアが試験的運用に必要なツールやリソースを活用できるようにしました。この共同アプローチは、Yassir で推進したいと考えているエンジニアリング文化を育むことにもつながります。つまり、すぐに使用できるソリューションを単に利用するのではなく、柔軟性のある既存のソリューションを特定のユースケースに適応させることで、より複雑な問題にも取り組むことができるような文化です。
社内での互換性評価を実施した後、以前のソリューションから個々のモデルをVertex AIに移行して整合性をテストしました。こららのモデルは、現在ではほぼ自動的に稼働しています。Databricks から BigQuery に移行し、当社独自のモデルを Google Cloud が提供するモデルと組み合わせることで、ML プロセスのパフォーマンスと効率が向上し、継続的な成長に向けてより良い体制を整えることができました。まだペタバイト規模のデータを処理しているわけではありませんが、必要となったときにそれが可能であることがわかっています。


データ処理からデータ分析情報への進化
以前は、データ ソリューションが分断されていたため、特定のチームに特定のデータへの安全なアクセスを提供することが困難でした。データは BigQuery に保存していましたが、モデルを Databricks でデプロイしていたため、ユーザーやチームに情報へのアクセス権を付与することは、すべての情報への鍵を渡すことと同じでした。現在では、ロールベース アクセス制御と Infrastructure as Code(IaC)の Terraform スクリプトを導入して、個人やチームに対してデータセットへのアクセス権を自動的に付与したり取り消したりできるようになりました。また、Looker Studio Pro を介してデータを共有し、技術系ユーザーに対して BigQuery テーブルへの直接のアクセス権を付与することで、必要なデータを適切なユーザーに確実に届けられるようになりました。
データは BigQuery で統合され ML モデルに接続されているため、そこからプロダクトの使用状況や顧客データに関するインサイトが得られ、顧客の獲得と維持から Marketplace の最適化に至るまで、あらゆる取り組みをより適切にサポートできます。社内目標や顧客に関連する目標を達成していることを確認するために、運用データセットと分析データセットのダッシュボードを作成して、細かくモニタリングしています。
運用ダッシュボードは、販売チームやマーケティング チームに対して、事業者や消費者をより的確にターゲット設定してリーチするために必要なインサイトを提供してくれます。また、人員配置プロセスに関する分析情報も得られ、配達時間の短縮、配車から目的地到着までの時間短縮、特定の市場のサポート改善に役立てています。また、プロダクト レベルでの検出とモニタリングにより、リアルタイムの動的な料金設定や、不正な移動や注文の特定を実現しています。収集するデータポイント一つひとつが、よりパーソナライズされた一貫性のあるカスタマー エクスペリエンスを構築する機会を当社にもたらしてくれます。
当社の経営陣は、迅速に利用できるデータセットを活用することで、戦略的な意思決定を推進しています。これには、ビジネスを成長させるための地域投資の決定、成長軌道やマーケティング予算に関するマクロレベルの計画、サポートや注意を必要とするビジネス分野の特定などが含まれます。こうしたロードマップに関する意思決定は、当社の総合的な成長戦略の中核であり、BigQuery で実現した柔軟性とスケーラビリティなしでは不可能なことでした。
-Yassir、AI 責任者 Hamdi Amroun 氏
-Yassir、データ プラットフォーム リード Maniganda Perumal 氏