デベロッパー

独創的な発想: Sky はどのようにして FinOps 導入を再考したのか

#da.jpg

※この投稿は米国時間 2021 年 7 月 19 日に、Google Cloud blog に投稿されたものの抄訳です。

欧州で有数のメディアおよびエンターテイメント企業である Sky Group と Google Cloud のパートナーシップは、Sky が診断データを数百万の Sky Q TV ボックスから Google Cloud データ プラットフォームに移行して以来、4 年間以上続いています。

クラウド導入に向けて動き出して数年経過した 2019 年 6 月に、Sky は当初から懸念していた課題に直面しました。主要なすべてのクラウド プロバイダの最近の請求金額が急速に増加し、計画していた 1 年間の予算にわずか半年で達してしまいました。Sky は予測が低すぎたのか、使用量が多すぎたのか、あるいはその両方なのかを判断できませんでした。

「初めは、節約できる場所を調べることを目標として、内部のクラウド費用を調査するよう指示を受けましたが、実際は何を発見できるのかは予測できませんでした」と、Cloud Enablement Center のクラウド アーキテクトであり、現在は 2020 年始めから Sky のクラウド財務管理(FinOps)担当責任者となった Nathan King 氏は語っています。

同氏は小規模のチームを結成し、Cloud Billing ツールを使用して Google Cloud の費用を調べ始めました。最初に、チームは Google Cloud の最大の費用のカテゴリを調査し、BigQuery、Compute Engine、Cloud Storage の費用をすぐにでも最適化できることに気づきました。その後半年間の慎重な分析により、期待を上回る 150 万ドルをすぐに削減可能なことを発見しました。

しかしその後すぐ、これは氷山の一角にすぎないことに気づきました。さらに数百万ポンドの削減が可能なことは明らかでしたが、それを大規模に実現するためには慎重な計画が必要でした。「これらの削減を目指すために FinOps ファンクション チームを結成しましたが、Google Cloud だけで 4 つの Google Cloud 組織にまたがり 600~700 プロジェクトが存在するため、手動作業となりチームが推奨事項に対応するのは困難でした」と、King 氏は語っています。

Google 主導の FinOps ワークショップに参加し、FinOps 戦略を決定後、同氏のチームは、情報提供、最適化、運用からなる FinOps のライフサイクルの各フェーズの反復と、経時的な削減の実現に重点を置きました。その方法をご説明します。

1. 情報提供: 情報の可視化

最初のステップは、費用の割り当てとリチャージに対する明確なビジョンを開発することに重点を置いていました。これには、財務、調達、税金のチーム(特に社内と関連会社)と緊密に連携し、柱となるビジネス ロジックとプロセスを理解することが必要でした。チームは、多大な努力の結果、財務などのより広いビジネス ファンクションに、新しいプロセスを実装および組み込むための障壁を取り除くことができました。

リチャージ モデルの導入により、チームは多数のパイロットを実施して、ニーズに合った FinOps のツールを探しました。データポータルの使用と BigQuery のエクスポートの可視化を含む、多くのパイロットを実施しました。企業全体でグローバルにスケールするという目標の下、ビジョンの実現のために、チームは Google Cloud の Looker を選び、直感的なダッシュボードを構築し、すべてのクラウド プロバイダ全体の費用と推奨事項を可視化しました。King 氏は、「顧客がクラウドの費用とインテリジェントな最適化案を 1 か所で動的に確認できる、すべてのクラウドの単一のビューを必要としていました」と語っています。

開発の 3 週間以内に、Looker ダッシュボードの準備が整い、それ以来変革的なツールとなっています。同氏は、「当社の上層部とさまざまな部門が Looker ダッシュボードを見始めた瞬間、FinOps チームが追加していた価値が即座に明確なものとなりました」と語っています。

各関係者グループについて異なるレポートのページがあり、それぞれが Looker と BigQuery を使用してカスタムに開発および自動化されています。例えば、BigQuery の最適化のページには、各クエリの費用、その書き込み方法、送信者、使用されたスロット数などの詳細なクエリデータに至るまでの、組織全体で消費されたスロットに関する情報が表示されます。ダッシュボードでは、保持ポリシーが設定されていない BigQuery データセットや、データがパーティショニングされていない場所などの、最適化の潜在的な対象領域も表示されます。

最近のブレークスルーは、Sky の場合はライブ配信やチャンネル登録者あたりの費用など、ビジネスの価値を計る単位に対し、関連するクラウドの消費を表示し貢献度を示すページを、ビジネスチーム向けに構築していることです。これは本質的に取得が困難な指標ですが、FinOps チームの進歩により機会が実現しており、ビジネスの投資の意思決定を促進し始めています。

2. 最適化: クラウドの効率性を促進

FinOps のライフサイクルの第 2 のステージでは、最適化の実現に重点を置きます。Sky の FinOps ダッシュボードが稼働し、削減の機会が示されたことで、ユーザーは2020 年だけでも Google Cloud で 300 万ドル以上、他のクラウド プロバイダでは 80 万ドル以上を削減できるようになりました。

チームは、BigQuery、Compute Engine、Cloud Dataflow、Cloud Storage のもっとも費用が高い 4 つのプロダクトに焦点を当て始めました。Google アカウント チームと連携し、Google のホワイトペーパークラウド費用の最適化: 成功し続けるための諸原則などのブログ投稿を読むことで、独自のベスト プラクティスのガイドを発展させ、推奨をダッシュボードに組み込みました。

独自の推奨事項を作成し Google Cloud の推奨ツールを活用することで、チームは多くのコスト最適化の機会を発見しました。King 氏は、「非常に高価なクエリ、保持ポリシーなしで設定されたストレージ バケット、自動スケーリングが有効化されていない VM などが主な例です」と語っています。その後チームは削減を自力で行えるようになりました。数千もの最適化の推奨事項が含まれるダッシュボードを入手するまで、年間費用が過剰になると予測されていた NowTV ビジネス部門はその一例です。チームはわずか 3 週間で推奨事項の 90% を実現し、50% 以上の削減を実現し、費用を年間の予算内に抑えました。

FinOps チームは引き続き毎日新しい推奨事項を探し、Google のプロダクト マネージャーと連携して知見をさらなるレベルへ高めようとしています。「Google のプロダクト マネージャーとの連携によって、市場投入前に、新機能に関するフィードバックを提供するようになりました。社内の推奨ツールを共有して、Active Assist の一環であるアイドル状態の VMアイドル状態の永続ディスクに関する推奨事項など、Google が開発する機能にも影響を与えています」と、King 氏は語っています。

da

3. 運用: FinOps の組み込みと自足性の促進

チームはクラウドの費用を可視化し、コスト最適化の推奨事項に基づいてリアルタイムの決定を行えるようになったため、FinOps チームは機械学習を使用した組み込みプロセスに取り組み、チームが行う業務の効率性を向上させ始めました。

Looker の広範な機能はここにおいても大きな役割を果たします。King 氏は、「Looker を使用する前は、当社で最も人気のレポートは、顧客の詳細な月間のクラウド消費量、前月の比較、翌月の予測を示した、電気の請求書でした。このレポートの実行には数日間、時には数週間かかりました。Looker により、プロセス全体を自動化して時間をわずか数分間に短縮できました」と語っています。

静的なレポートのスナップショットの代わりに、インタラクティブなダッシュボードを会議で使用するようになった財務チームや、推奨事項を使用して、あらゆるテクノロジーのデプロイ前にクラウドの費用を最適化する社内の Google Cloud アーキテクトのように、より多くのチームが、ダッシュボードを独自のプロセスに組み込んでいます。

CX / UX を考慮して設計し、異常報告、予算警告、機械学習に基づいた予測などの新機能を反復的にリリースして、FinOps チームが製品ファンクション チームのように運営を続けるにあたり、クラウド財務管理がビジネスの広範囲にわたる部分に大規模に影響する可能性がある、主要な機能およびマインドセットであることがますます明確になっています。

Sky の FinOps の過程をさらなるレベルへと高める

実際、より多くのビジネスチームが FinOps ファンクション チームと連携するにあたり、機会は成長しています。「FinOps チームがクラウドの費用の見方と管理方法を変えたことで、財務と連携して CFO にわかりやすいレポートを提示できるようになりました。ダッシュボードを進化させて、Google のデータセンターのサステナビリティの指標を取り込むことにより、Google Cloud の使用が Sky の実質カーボンゼロの目標をどのようにサポートしているのかを理解するなど、分析情報の範囲をさらに広くすることを検討しています」と、Sky のアーキテクチャ マネージャーである Vince Marco 氏は語っています。

そのため、クラウド費用が増加した要因がわからなかった 2019 年から 18 か月経過し、Sky は投資に関する意思決定に強い自信を持てるようになりました。チームは、消費されるお金が最適に使用され、投資に対して最大の価値をもたらしていることを把握しています。

クラウドを使用する大企業であり、クラウドの費用をさらに管理したい場合は、FinOps 機能を用意して FinOps のマインドセットを作り出すことを検討してください。Looker は、クラウド支出に対するレポートと分析情報を提供し、初期の削減対象を特定することで、導入に役立ちます。学習し拡大するにつれ、ビジネスの請求アクティビティの詳細や部門固有のチャージバックをモニタリングし、カスタマイズするために、組み込みの機能を活用して、チームが自力で削減できるよう支援します。Sky のように、クラウドの財務をどのように管理および最適化できるのかを再考しましょう。

Looker のクラウドコスト管理ブロックの詳細については、Looker Marketplace をご覧ください。

- テクニカル アカウント マネージャー James Ma