PayPal 史上最大規模のデータ移行が生成 AI イノベーションの基盤に

Mani Iyer
SVP & Global Head of Data, AI & ML Technology, PayPal
Vaishali Walia
Sr Director Data Analytics, PayPal
※この投稿は米国時間 2026 年 2 月 27 日に、Google Cloud blog に投稿されたものの抄訳です。
生成 AI 時代の到来により、企業には革新的なプロダクトを生み出す前例のない機会が訪れており、それに対応するため、テクノロジー インフラの戦略的な見直しが求められています。数年前、数億人の顧客にサービスを提供するデジタル ネイティブ企業である PayPal は、大きな課題に直面していました。同社は 25 年にわたりサービスと機能を拡大してきましたが、その結果、データ分析インフラは複雑化していました。さらに、規模拡大の制約や Venmo、Braintree などの企業買収の影響により、約 400 ペタバイトものデータが 12 のサイロ化されたシステムに分散していました。
成長とイノベーションで成功を重ねた結果、複雑さが増し、それが次の進化の足かせになりかねない状況でした。
金融サービス分野における次なるイノベーションの波を引き続き牽引していくために、私たち PayPal はデータ基盤のモダナイゼーションが不可欠だと判断しました。今回は、PayPal が、おそらく史上最大級のデータ移行の一つを成功させ、最終的に分析基盤を Google Cloud のエンタープライズ向けデータ ウェアハウスである BigQuery に移行した経緯をご紹介します。この取り組みは、事業の重点領域を拡大および推進し、絶えず変化するお客様の金融ニーズに応えていくために必要となる強固なデータ基盤を構築するうえで、大きな前進となりました。
この移行は不可欠でしたが、規模の大きさは圧倒的でした。実際、(すでに運用を終了した)Teradata システムをはじめ、いくつかの指標で見ても、これは史上最大級のデータ移行の一つだったと私たちは考えています。こうした規模の移行にふさわしく、私たちがどのようにこの移行を進めたのか、また皆さんが自社で大規模な移行に取り組む際に検討すべき点は何かについて、いくつかの示唆を共有したいと思います。
データに眠る可能性
デジタル決済の草分け的存在の一つとして、PayPal は数十億件の取引を処理し、数十年にわたる貴重なお客様インサイトを蓄積してきました。当社には、お客様や加盟店のために十分活用しきれないまま、何十年もかけて蓄積されてきた膨大なデータがあります。まさに「山」ではなく「山脈」と呼ぶべき規模です。
買収や新サービスの追加によって有用な機能は増えましたが、その一方で新たなデータ課題も生まれました。たとえば、小規模事業者がオンライン販売では PayPal を、地域での取引では Venmo を使うといったことがあります。しかし、事業全体を一元的に把握できる形で見せるには、コストも時間もかかる複雑な処理が必要でした。
データが分断されていたため、消費者一人ひとりに合わせた体験を提供しにくくなり、その結果、利用者がお金の価値を最大限に引き出せる可能性も小さくなっていました。加えて、データからより深いインサイトを得ることも難しくなっていました。
生成 AI の時代が始まるにつれ、この分断は単なる技術的な不便さでは済まなくなってきました。金融サービスにおいて AI が大きな変革をもたらし、費用対効果も大きいと見込まれる中、データが断片化したままでは、お客様が期待する高度で賢い体験を生み出す力が大きく制約されてしまうことは明らかでした。具体的には、業界をリードする不正検知モデルをさらに強化することから、競争の激しいグローバル経済で加盟店が成功できるよう最高水準のコマース基盤を提供することまで、幅広い取り組みが含まれます。
そこに到達するには、まず分散していたデータ基盤を整える必要がありました。
レガシーシステムとこれからの目標
対象範囲は非常に大規模でした。世界最大規模とされる Teradata 環境に加え、Hadoop クラスタ、Redshift、Snowflake、さらにペタバイト級の取引データを処理するさまざまなシステムを含む、複数のデータ プラットフォームを統合する必要がありました。しかもこの移行は、お客様が求めるセキュリティと信頼性を損なうことなく、サービスを止めずに実行しなければなりませんでした。
テクノロジー企業として PayPal には相応の社内リソースがあるため、まずはこの課題に自前で取り組むべきかどうかを判断する必要がありました。コストと効果を比較検討した結果、将来のニーズに対応するためにオンプレミス基盤を統合し、拡張していくやり方では、費用も完了までの期間も現実的ではないと分かりました。さらに、AI のイノベーションはクラウド上で急速に進んでいました。データの力を真に活用するには、そのイノベーションが生まれている場所に身を置く必要がありました。
私たちはさまざまなデータウェアハウス ソリューションを評価した結果、多くの利点を備えた BigQuery を選択しました。BigQuery は、コンピューティングとストレージが分離され、それぞれを独立してスケールできる、フルマネージドのクラウドネイティブ プラットフォームです。また、私たちが必要としていた規模とパフォーマンスに対応する強力な機能を備えており、使い慣れた SQL インターフェースを利用できるため、開発者コミュニティにとっても学習のハードルが比較的低いという利点がありました。
最も重要なのは、BigQuery が AI とネイティブに統合されている点です。これにより、データ分析をシームレスかつ効率的に行えます。
統合データに向けた歩み
データ パートナーとして Google Cloud を選定したのち、私たちはこの歴史的なデータ移行プロジェクトに着手しました。大げさに聞こえるかもしれません。しかし、PayPal の事業規模、展開する地域の広さ、地域ごとに異なる規制、そしてこのデータが高い機密性を持ち、文字どおり大きな価値を有することを踏まえると、この取り組みがいかに大規模で難易度の高いものだったかが見えてきます。
Google Cloud コンサルティングのパートナーや専門家の支援を受けながら、私たちは 300 ペタバイト超のデータを移行し、運用を効率化しました。同時に、全体の約 25% に相当するワークロードを廃止しました。そしてこれらを、事業運用のダウンタイムを一切発生させることなく、またお客様への影響もなく実現しました。成功につながった主な要因は、次のとおりです。
連携: 大規模な変革を実現するうえで最初のハードルは、関係者の間で共通の目標に対する認識をそろえることです。そこで私たちは、この取り組みを全社的な最優先事項と位置付けました。
調査と分析: 移行の範囲、作業量、予算見込みを定義するためには、データ、ワークロード、入出力のデータ ストリームについて詳細な棚卸しを行うことが不可欠です。データリネージを確立することで、さまざまなコンポーネントの起点や相互関係を追跡できるようになり、依存関係の構造を明確かつ包括的に把握できるようになりました。
戦略: 移行プロセスの基本原則を定めることも重要です。たとえば、リフト&シフトを採用するのか、それともモダナイゼーションを進めるのかを判断すること、セキュリティ原則を定義すること、ガバナンスのガードレールを設定すること、利用状況をどのように追跡するかを決定することなどが含まれます。
実行: 可能な限りあらゆる作業を自動化し、移行の進捗を継続的に把握できるよう、リアルタイムのダッシュボードも構築しました。また、移行プロセス全体に FinOps を組み込み、利用状況とパフォーマンスを明確に可視化できるようにしました。
BigQuery で得られた成果とその先にある価値
より迅速にインサイトを得られるようになりました。データ サイエンティストが用いる複雑なクエリも含め、クエリの実行速度は 2.5 倍から 10 倍に向上しました。これによりリアルタイムの分析情報が得られるようになり、PayPal は商品レコメンド、オファー、カスタマー サポートをより個別化できるようになりました。
新たな AI の土台も整いました。モデルのトレーニングに利用できるデータは、鮮度が 16 倍向上しました。AI 開発上重要な工程である特徴量エンジニアリングも、整備されたガバナンス下のクリーンなデータに即時アクセスできるようになったことで改善されています。その結果、個人および企業の双方に向けた、パーソナライズされた金融ガイダンスや予測分析の開発が加速しました。
業務の最適化も実現しました。BigQuery への移行により、データインフラのベンダーは 4 社から 1 社に集約され、運用が簡素化されるとともに複雑さも大きく軽減されました。また、プラットフォーム間で発生していたデータの重複も完全に解消されました。
BigQuery 上に構築した新しい統合データ プラットフォームは、PayPal の次なるイノベーションを支える基盤となっています。これにより、エコシステム全体にわたって、より直感的でパーソナライズされた体験を提供できるようになり、生成 AI の力も最大限に活用できるようになりました。
AI を活用したイノベーションの可能性
今後、この統合データ プラットフォームを基盤として、これまで実現できなかった AI を活用した体験の提供を検討しています。たとえば、次のような取り組みです。
-
お客様に影響が及ぶ前に潜在的な問題を検知する予測型の不正防止。
-
加盟店がビジネスを最適化できるよう支援するパーソナライズされた金融インサイト。
-
お客様一人ひとりの好みや行動パターンに合わせて最適化されるシームレスな決済体験。
-
より高度なリスク評価を通じた、これまで十分な金融サービスを受けられていなかったコミュニティに対する金融アクセスの拡大。
さらに、エージェント型コマースをはじめとする新たな可能性も見据えています。
AI 時代の教訓
私たちの移行は規模の面で特別な取り組みに見えるかもしれませんが、抱えている課題や目指している方向性は、決して私たちだけのものではありません。今まさに自社のデータ基盤を見直そうとしている金融サービス業界の企業はもちろん、それ以外の業界にとっても、参考になる論点は数多くあります。
まず、データがどれほど十分に活用されていないか、そしてどれほど整理されていないかを過小評価しないことです。
データを一元化し、正確性と整合性を担保できれば、AI の実験や本番投入に向けた土台が整います。データ ファブリックの整備に時間を投じる組織ほど、ML や生成 AI のアプリケーションを、より早く、しかも大規模に市場へ投入できるようになります。
次に重要なのは、適切な統制のもとで、組織内の誰もがデータにアクセスできる状況を整えることです。これにより、多くの可能性が開かれます。データ オーケストレーションとエンタープライズ検索を生成 AI と組み合わせれば、長年固定化してきた部門間のサイロを取り払い、組織全体の意思決定を加速できる可能性があります。これは、AI 活用の中でも特に有望な領域の一つです。
金融の世界は、新たなテクノロジーと変化する顧客の期待に後押しされ、今後も進化し続けるでしょう。PayPal のデータ変革は、老舗企業であっても、立ちはだかる根本課題に正面から向き合う意思さえあれば、この変化に先回りする形で自らを再構築できることを示しています。
その結果、私たちはデジタル決済のパイオニアとしての地位を守っただけでなく、デジタル コマースにおける次なるイノベーションの波を牽引し続けるための基盤も整えることができました。
- PayPal、SVP 兼データ、AI、ML テクノロジー担当グローバル ヘッド、Mani Iyer 氏
- PayPal、データ分析担当シニア ディレクター、Vaishali Walia 氏



