コンテンツに移動
DevOps & SRE

Vodafone、「Unlocking the secrets of DevOps(DevOps の秘密の解明)」で DevOps Awards を受賞

2023年8月2日
https://storage.googleapis.com/gweb-cloudblog-publish/images/image1_9OgQgIg.max-2000x2000.png
Google Cloud Japan Team

※この投稿は米国時間 2023 年 7 月 26 日に、Google Cloud blog に投稿されたものの抄訳です。

このブログ投稿では、2022 年の DevOps Awards で「Unlocking the secrets of DevOps(DevOps の秘密の解明)」賞を獲得した Vodafone による DevOps の事例をご紹介します。DevOps Awards の受賞者と、各受賞者が DevOps Research and Assessment(DORA)の指標と手法を活用してビジネスを成長させた事例の詳細については、まずこちらをご覧ください。

欧州およびアフリカ地域の大手通信事業者である Vodafone は、テクノロジーを活用して、人々の暮らしの向上とインクルーシブでサステナブルなデジタル社会を実現しています。英国ニューベリーを本拠地として 1984 年に創設された同社は、グローバル企業として大躍進を遂げ、今や世界 17 か国で数百万人のユーザーにサービスを提供しています。

課題

Vodafone の「新しいテクノロジーを活用してより良いカスタマー エクスペリエンスを作り出す」取り組みの一環として、成長への次のステップはお客様を中心に据え、シンプルさを追求しながら、さらなる拡大を目指す戦略に基づくものでした。しかし、過去の成功が未来への足枷となっていた面も否めません。

これらの課題が最も顕著に表れたのは、以下の点です。

  • 環境のプロビジョニングが複雑化: Vodafone のデータ サイエンティストが手動で行う必要のある手順がいくつかあり、データ サイエンス ノートブックから本番環境への道筋が必要以上に長く、複雑になった

  • スケールできない: 手動によるプロビジョニングでは、各データ サイエンティストの Google Cloud AI デプロイ用にカスタマイズされたインストールが必要となり、各市場に固有のエコシステム全体で ML ワークロードを再利用するのが困難だった

  • 自動化が不十分: Vodafone はクラスタで Jenkins をホストし、自社管理していたので、自動化の利点を活かせなかった

目標

AI を活用したソリューションを構築するために、Vodafone は、標準化、明確な安全策を備えた柔軟性、高水準の自動化の 3 つの側面で実用性を高める施策を必要としていました。どのような方法をとるにせよ、私たちは、高いスケーラビリティとエンドツーエンドの自動化を実現し、価値を大規模に創出して、効率性を高めることの必要性を認識していました。

ソリューション

これらの課題に対処し、企業内と市場全体での連携を強化するために、Vodafone は Google Cloud と提携し、テクノロジーとアジャイルな設計の原則の組み合わせを礎として新しいプラットフォームを構築しました。そして、18 か月間にわたる学習と改善への徹底した取り組みを経て、「AI Booster」と銘打った新しいイニシアチブを立ち上げました(このプロジェクトの技術的な説明については、こちらをご覧ください)。Vertex AI の実装では、Cloud BuildArtifact RegistryBigQuery などの Google Cloud ネイティブ ツールの活用により、「一度の開発で何度でもデプロイ」という考えに基づくエンドツーエンドな ML ライフサイクルを推進しています。この手法は、Vodafone のセキュリティ要件を満たしながらも、製品化までの時間を劇的に短縮しました。

AI Booster の核となる Vertex AI によって、Vodafone に ML モデルのスケーリング、管理、モニタリング、ガバナンスを実現する力がもたらされました。この新しいプラットフォームは、概念実証から本番環境への縦方向と、レプリケーションをローカル市場全体に行きわたらせる横方向の二次元で、AI と ML のソリューションのスケーリングを可能にしています。これはまた、DevSecOps の原則を中心に設計されたリアルタイムの公開パッケージとイメージ スキャニングを使用した、データ サイエンティストのタスクを念頭に置いた設計になっています。

要するに、AI Booster とは「Vodafone が市場全体で AI と ML のイニシアチブにグローバルなプライバシーと AI ガバナンス プロセスを導入するための原動力」であると、Vodafone のグローバル プライバシー オフィサー Mikko Niva は評価しています。

AI Booster とクラウドの利点を組み合わせることで、Vodafone はクラウドネイティブ、ツールの標準化、API ファースト、常時可用性、再利用性といった社内の 10 大原則に対し、より徹底して準拠できるようになりました。また、事前構築済みの CI / CD パイプラインによって、環境のプロビジョニングからその後の設定まで、個々のステップがすべて自動化されます。Vodafone のデータ オーシャンは、オンプレミスでホストされた GitHub、Secure Vault、ミラーリング / オーケストレーション システムを使用して Google Cloud 上に構築されているので、ボタンをクリックするだけで完全な自動化が簡単に達成できます。このゼロタッチ環境は、プラットフォームのプロビジョニングにかかる時間を 3 か月から 30 分に短縮したうえ、チームが最初の数か月で各市場に作成した AI Booster インスタンスは全体で 100 件を超えています。

結果

Google Cloud との緊密な連携のおかげで、Vodafone における新しい AI / ML のユースケースはすべて AI Booster で処理できるようになりました。既存のユースケースも移行して、この適用の拡大を加速させる計画が進行中です。さらに、Vodafone では、DORA の 4 つの主要な指標の改善と並行して、以下の分野でも著しい改善が見られました。

  • リードタイム: AI Booster によって、1 人のユーザーが製品を概念実証から本番仕様に完成させるのにかかる開発時間が 20 週間から 2 週間に短縮され、効率が 80% 向上しました。

  • デプロイ頻度: Cloud Build などの Google Cloud ネイティブ ツールによってパイプラインが自動化され、再利用が進みました。おかげで Vodafone ローカル市場全体で年間のプラットフォーム プロビジョニングの工数が 49,000 時間分も削減され、ML エンジニアの作業効率が 4 倍向上しました。

  • 変更時の障害率: バックエンドの自動化により、従業員はプラットフォームのセットアップを API 経由のリクエストのみで完遂でき、変更時の障害発生率が 3% にまで低減されました。

  • サービス復旧時間: 最近は重大なサービス中断が発生していませんが、仮にあったとしても約 1 時間での問題解決が可能になりました。

AI Booster の実用例として、Vodafone の「Recommender」があります。Recommender は、お客様にプロフィールや利用中のサービスに基づいて新しい製品やサービスを提案します。当初は正確性の課題を克服するために複数のテンプレートを作成する必要がありましたが、モデルのデプロイと再デプロイのサイクルタイムが短縮されたことにより、製品化までの時間が最初の市場で 5 か月、2 回目以降の市場ではわずか 6 週間に短縮されました。Recommender の自動化された再トレーニング パイプラインでは、再トレーニングのためにオフラインにする必要がなく、障害率も低く抑えられます。自動デプロイとアクティブ モニタリングのおかげで、全体で 12 日かかっていた復旧時間も数時間に短縮されました。

私たちはテクノロジー企業として、業界最高クラスの Google Cloud アーキテクチャを基盤とし、自動化、スケーラビリティ、セキュリティが組み込まれた Vodafone の最先端の MLOps プラットフォームを、大変誇りに思っています。Vodafone は、AI Booster を使ってデータ サイエンスからより多くの価値を引き出すと同時に、信頼性エンジニアリングの原則を組織全体に浸透させています。

2022 年 DevOps Award 受賞者を紹介するシリーズの今後のブログにも引き続きご注目ください。DORA リサーチについて詳しくは、2022 年の State of DevOps Report をご覧ください。


- Vodafone、アナリティクス / AI 変革マネージャー Ashish Vijayvargia 氏
投稿先