AI 導入で失敗しないために: コスト最適化の 3 つの秘訣
Marcus Oliver
Managing Director, delta, Google Cloud Consulting
Eric Lam
Head, Cloud FinOps, delta, Google Cloud Consulting
生成 AI イニシアチブを成功させ、経済的なメリットを最大化するためには、具体的なユースケースを特定すること、AI モデルの総所有費用(TCO)の把握すること、そして Cloud FinOps を導入することが重要です。
※この投稿は米国時間 2024 年 10 月 23 日に、Google Cloud blog に投稿されたものの抄訳です。
例として、マーケティング チームが、マーケティング コンテンツをパーソナライズすることに何年も苦戦し続けて来たことについて考えてみましょう。生成 AI を活用することで、あらゆるキャンペーン、オファーを即座にカスタマイズでき、また、顧客一人ひとりに合わせたやり取りが身近なものになりました。しかし、課題は、それを実行するための予算があるかどうかです。
生成 AI は計り知れない可能性を秘めていますが、予算には限りがあります。この強力な新しいテクノロジーを導入する際には、予期せぬ費用が発生してしまう事態になることもありえます。AI には膨大な計算リソースが必要です。そして、AI の導入と運用にかかる総費用は、規模、モデルの複雑さ、データの要件、インフラストラクチャのメンテナンス、利用できる人材の確保など、さまざまな要素により大きく左右されます。
費用の最適化は、財務と戦略の両方の点において喫緊の課題です。ただ、生成 AI 関連の費用の見積もりと、創出されるビジネス価値の評価は、多くの企業にとって容易ではありません。費用の正確な予測と管理、より効果的な形でのリソースの割り当て、生成 AI イニシアチブの価値の測定が必要不可欠になります。
Google Cloud は、AI 費用を理解し、最適化することが、今後の成功に不可欠だと考えています。そして、経営幹部やリーダーの方々からは、組織の長期的目標の達成に向けた投資から目に見える価値を引き出せるとともに、生成 AI 実装に関連する予算を効果的に管理できる手法が求められています。
今回はこれを踏まえて、Google が自社の業務で実践し、また、生成 AI の使用を開始するお客様を支援するために使用している、AI 費用の最適化のための 3 つの実践的な戦略をご紹介します。
AI のユースケースを特定する
生成 AI を導入するにせよ、他の AI テクノロジーを導入するにせよ、AI イニシアチブとビジネスの目標の足並みをそろえることが重要です。AI はたしかに強力ですが、それでも、利用可能なテクノロジーのひとつであることに変わりはありません。何の意図もなく AI を独立した形で使用することは、地図を使わないで車を運転するようなものです。道に迷うことは目に見えており、また最悪の場合は袋小路に陥ることになります。投資の成果を最大化するには、AI のユースケースを特定することが必要不可欠です。
優れたユースケースは、ユーザーの課題を解決する機能に関する内容が取り込まれたものである必要があり、また、全体としての戦略ビジョンとの整合性がとれたものである必要があります。お客様からは、主なユースケースとして、生産性の改善、プロセスの自動化、カスタマー エクスペリエンスのモダナイズを可能とするインテリジェントな AI エージェントの開発に関するユースケースが増えており、また、過去 1 年の間でそのようなソリューションが何百と実現しているとお聞きしています。
Google Cloud コンサルティング チームはお客様と協力して、最大のビジネス成果を達成する AI ユースケースの特定と優先順位付けに取り組んでいます。Google は、AI で対処しようと考えている具体的で測定可能なビジネスの目標をまず特定して、そこから逆算してその目標の達成に直接貢献するソリューションを特定する手法を推奨しています。このプロセスには、成功を測定するための計画の決定、実際に特定された問題を解決するために必要な出力が AI から得られるかどうかの評価、ソリューションが全体としての戦略的目標や優先事項と合致していることの確認が含まれます。Google Cloud コンサルティングのバイス プレジデント、Lee Moore は、「重要な点は、AI は単なる技術的実装ではなく、お客様のビジネスのための戦略的イネーブラーであるということです」と言及しています。
特定のビジネス上の課題を中心に据えてユースケースの枠組みを固定することで、大きな価値を生み出さないプロジェクトにリソースが割かれることを回避できるようになることはもちろん、AI を正常に実装するために必要な個々の要素や次の手順を明確に定義できるようになります。この手法は、プロジェクトの技術的実現可能性、ビジネス上の実現可能性の判断に役立つものであり、また、成功を測定するための明確な目標や基準の設定にも貢献するため、より効果的なリソースの割り当てにつながります。
AI の総所有費用(TCO)を把握する
効果的な AI 費用最適化のための重要な要素には、支出を総体的に把握すること、特に、AI プロジェクトの拡大に伴い増大する可能性がある費用を把握することもあります。Google は、各 AI ユースケースごとに総所有費用(TCO)をモデル化し、最適化の意思決定や機会特定のための判断に役立つことを確認しています。この最適化には、より効率的なモデル、ライセンシング オプションの模索、ハードウェアのサイズ適正化、データ品質の改善などが挙げられます。
私たちの手法は、ビジネス ユースケースをプロダクト固有のユースケースに分割して、それぞれを特定の生成 AI モデルにマッピングするというものです。その後、それぞれのモデルを異なる費用の要素に分解して、生成 AI プロジェクトの構築とスケーリングに必要になる将来の投資を見積もれるようにします。これは、AI 投資の TCO の削減や最適化のために組織で使える、以下のようなさまざまな手段を示すためにも役立ちます。
- モデル提供の費用: モデル提供における推論にかかる費用
- トレーニングとチューニングの費用: 追加のモデルのトレーニングとチューニングにかかる費用
- クラウド ホスティングの費用: クラウド インフラストラクチャでのモデル実行にかかる費用
- トレーニング データの保存とアダプタレイヤの費用: 追加のトレーニング データとそれに伴うアダプタレイヤの保存にかかる費用
- アプリケーション レイヤとセットアップの費用: モデルを実行するための追加のクラウド サービスにかかる費用
- 運用サポートの費用: AI モデルの継続的なサポートにかかる費用
たとえば、事前トレーニング済み AI モデルにかかる費用は、カスタム生成 AI モデルをゼロから構築、トレーニング、デプロイする場合とは異なります。事前トレーニング済みモデルの使用に伴う TCO には、モデルの提供、モデルのトレーニング、モデルのチューニング、クラウド インフラストラクチャにかかる費用などが含まれます。対して、独自のカスタム生成 AI モデルを構築、トレーニングする場合、運用サポート、アプリケーション レイヤ、トレーニングとチューニング、モデル提供と推論を含むすべての費用カテゴリに対応する費用が発生することになるでしょう。
Google Cloud の目標は、エンタープライズ ユースケースにマッチした最適なモデルをお客様が利用できるようにすること、および、お客様が AI プロジェクトの費用をさまざまなニーズや要件に応じて簡単に最適化できるようにすることです。
Vertex AI の Model Garden には、160 を超える厳選されたファーストパーティ モデル、サードパーティ モデル、オープンモデルが用意されており、組織はこれを活用してモデルを試し、ユースケース、予算、パフォーマンス ニーズに最も適したモデルを選択することができます。必要に応じてモデルを切り替えることも可能です。Google は、データの保存やクエリ実行での大幅な費用削減につながる堅牢なデータ分析、ストレージ サービスを提供しており、お客様のすべてのデータをひとつにまとめ、まとめたデータを革新的 AI テクノロジーと簡単につなげられるようにすることに取り組んでいます。
Gemini モデル ファミリーに新しく加わった Gemini 1.5 Flash は、大規模な大量かつ高頻度のタスク向けに最適化されており、サービス提供の費用対効果が高くなっています。Google はまた、さらなる費用削減を達成できる新しい手法の模索にも継続的に取り組んでおり、Dynamic Workload Scheduler、コンテキスト キャッシュ保存、プロビジョナル スループットなどの新機能を導入してリクエストの費用を削減し、生成 AI の費用をより予測可能なものにしようとしています。
このような TCO の各種手段を組織で効果的に活用することで AI 戦略を適応および調整し、費用の最適化、効率の改善、生成 AI の活用によりもたらされる全体としての価値の増大、を達成できます。
Cloud FinOps を取り入れる
クラウドの費用を管理するための効果的な手法を見出すことは、生成 AI 導入における最も困難な課題のひとつです。生成 AI モデルは、トレーニング データの処理と保存、出力の生成を行うための膨大な量の計算リソースやデータ ストレージが必要になります。また、クラウド サービスに対して要求されるものはプロジェクトの規模拡大に応じて増加する傾向があるため、結果的にクラウドの使用量が増え、費用がさらに増大することになります。
費用を抑えるためには、技術チーム、財務チーム、ビジネスチームをひとつにまとめ、持続可能な経済的価値やクラウド投資の成果の最大化を実現する、運用規範であり文化的変革である Cloud FinOps をチームで導入する必要があると Google は考えています。また、生成 AI テクノロジーは FinOps ワークフローの強化にもつながります。取り組みの成果を増幅させることができ、また、クラウド費用の最適化目標の達成をより早期に実現できるようになります。
たとえば、Looker などのビジネス インテリジェンス(BI)ツールに生成 AI の機能が導入されることで、BI データの操作、探索の手法が刷新され、組織内の誰もが自然言語を使用してパターンや傾向の特定を行えるようになります。例を挙げると、CME Group と Palo Alto Networks は、Google Cloud を使用して費用の異常検出を実装することで、想定外のクラウド支出を検出し、問題の特定と対処を早期に行って想定外の支出を回避できるようにしました。
Google Cloud は、生成 AI のための Cloud FinOps フレームワークを開発して、お客様が生成 AI の導入に向けた準備状況を、人材、プロセス、テクノロジーの観点で評価できるようにしています。このフレームワークは、以下の 5 つの重要な柱に基づいています。
- 生成 AI の支援: 支援キャンペーンやオンデマンド トレーニングを使用し、技術担当者や財務担当者から役員レベルまで、すべての役割の財務的観点から、生成 AI の統合を確実に成功させます。
- 費用の割り当て: 生成 AI の価値を、生成 AI モデルの開発とデプロイにかかる全体としての費用とあわせて把握します。これには、さまざまな費用分解や、それが最終的な損益におよぼす影響の測定などが含まれます。
- モデルの最適化: モデルデータと特徴、トレーニングとデプロイのプロセス、モデル開発自動化(MLOps)の継続的なモニタリングと最適化を行い、パフォーマンスを改善します。
- 料金モデル: さまざまな種類の生成 AI モデルとプロバイダの各種料金構造を理解することで、どのモデルを使用するか、どのようにそのモデルを実装するかに関する意思決定にその理解を役立てます。
- 価値のレポート: 生成 AI の費用と価値に関する指標をレポートして、もたらされる生成 AI の価値をビジネスチームと財務チームに示し、組織全体に生成 AI を拡大させる際の情報に基づいた意思決定を行えるようにします。
Cloud FinOps の原則と実践は、生成 AI への投資における価値の最大化に役立つものであり、ビジネス価値実現までの時間の短縮やイノベーションの加速、財務アカウンタビリティの改善、クラウドの使用量や費用の最適化、クラウド支出の無秩序な増大の回避に貢献します。
Google Cloud コンサルティング delta FinOps チームの貴重な支援のおかげで、中枢となる FinOps 機能を組織の中に確立することができました。これにより、クラウドの価値を開始段階から引き出せるようになりました。
CME Group、財務デジタル トランスフォーメーション担当エグゼクティブ ディレクター, Leslie Nolan 氏
収益を伸ばす
AI を取り巻く環境は広大ですが、予算は有限です。リーダーは、AI 費用の詳細な把握に喫緊の課題として取り組む必要があります。また、情報に基づいた意思決定を行い、イニシアチブへの継続的な取り組みと、生成 AI が持つ能力の最大限の活用につなげる必要があります。ユースケースを把握すること、AI プロダクトや機能の費用をよく把握すること、組織の中で Cloud FinOps を中心に据えた文化を育むこと、これらすべての戦略が AI のデプロイでかかる費用の大幅な改善に役立ちます。これらは究極的に、投資からの成果の増大につながります。
Google Cloud コンサルティングは、世界中のお客様の AI テクノロジーの導入とビジネス成果の実現をサポートしています。組織のためのイノベーションと変革のサービスについて、その詳細をご覧ください。
-Google Cloud コンサルティング、delta マネージング ディレクター Marcus Oliver
-Google Cloud コンサルティング、delta Cloud FinOps 責任者 Eric Lam