新しい Generative AI Ops サービスで生成 AI がビジネスに及ぼす影響を拡大
Lee Moore
Vice President, Global Google Cloud Consulting
※この投稿は米国時間 2024 年 5 月 24 日に、Google Cloud blog に投稿されたものの抄訳です。
生成 AI ワークロードを概念実証から本番環境へと移行し、AI への投資がビジネスに及ぼす影響を実感している Google Cloud のお客様が増えています。こうしたお客様の多くは、Google Cloud コンサルティングと連携して重要な領域で AI を活用し、その恩恵を受けています。たとえば、Bristol Myers Squibb は、臨床研究チームがより簡単に重要な情報を特定し、ドキュメントを生成できるようにする新しい AI 搭載インターフェースを開発しました。また、Palo Alto Networks は、Gemini を利用してコパイロットのユーザー エクスペリエンスを効率化し進化させる新しい AI ツールをリリースすることで、セキュリティ担当者の生産性を改善しています。
AI ワークロードを本番環境に移行するには、生成 AI のシステム設計、大規模言語モデルのアーキテクチャ、プロンプト エンジニアリング、評価などに関する深い知識が必要です。そこで Google は、これらの領域に関する専門知識を幅広いお客様に提供するために、Generative AI Ops サービスという新たなソリューションをリリースすることにしました。Google Cloud コンサルティングまたは広範なパートナー エコシステムによって提供されるこの新ソリューションは、組織が生成 AI プロトタイプを本番環境グレードのソリューションに成長させることができるよう支援し、セキュリティ、モデルのチューニング、フィードバック、最適化などの重要な領域に関するサポートを提供します。
Generative AI Ops のリリースにより、Google Cloud は AI 構築のためのオープンで最適化された技術スタックと、検討から本番環境まで、AI 変革のあらゆる段階にいるお客様を支援するための包括的なサービスセットの両方をお客様に提供することになります。
新ソリューションである Generative AI Ops サービスは、AI アプリケーションをプロダクション レディにするために必要なあらゆる手順に関してお客様を支援します。たとえば次のようなものです。
-
プロンプト エンジニアリング、プロンプトの設計と最適化: モデルが確実に質の高い出力を生成し、ユーザーの信頼を得られるようにするには、十分に最適化されたプロンプトを設計することが重要です。Google Cloud コンサルティングは、プロンプト エンジニアリングのベスト プラクティスと、ReAct、検索拡張生成(RAG)、Chain-of-Thought などの手法を利用して、お客様が生成 AI アプリケーションのパフォーマンスとモデルの出力を改善するソリューションを構築できるよう支援します。重要な点は、ユースケースによって適切なモデルは異なり、モデルごとに異なるプロンプト構造が必要であるということです。Google の専門家チームは、ユースケースに応じた適切なモデルの適用とモデルに応じた適切なプロンプト手法の適用に関してもお客様を支援します。
-
パフォーマンスとシステムの評価: AI の本番環境への移行を成功させるには、モデルとアプリケーションのパフォーマンスを改善するための継続的な評価とフィードバックが必要です。このサービスは、お客様がアプリケーションに応じてカスタマイズした評価フレームワークを設計してデプロイし、AutoSxS や生成 AI の評価などのツール、人間による評価、またはこれらを組み合わせたハイブリッド アプローチを使用して自動評価指標のメカニズムを構築できるよう支援します。
-
モデルの最適化と継続的なチューニング: パフォーマンスとシステムの評価のためのフレームワークを導入した後も、生成 AI アプリケーションおよびモデルを継続的にチューニングし、最適化する必要があります。Generative AI Ops は、人間によるフィードバックとベンチマークに基づいてモデルを最適化し、チューニングするためのソリューションとマネージド サービスを提供します。たとえば、システム アーキテクチャとモデルの選択の改善、レイテンシと費用の削減、最新の API の統合が可能です。また、LangChain や DIY オーケストレーターを使用して AI エージェントのオーケストレーションと構築を行い、アプリケーションを最適な形で実行できるようにするためのツールも用意されています。
-
モニタリングとオブザーバビリティ: AI アプリケーションをプロダクション レディにするには、牢獄なモニタリング ソリューションを導入することが重要です。Google Cloud コンサルティングは、お客様が生成 AI アプリケーションのオペレーションとパフォーマンスを継続的にモニタリングするためのオブザーバビリティ ソリューションを構築できるよう支援します。モニタリングの対象は、モデルの精度とハルシネーション、レイテンシ、スループット、ハードウェアの使用率、モデルのドリフト、トラフィック、費用などの広範な要素に及びます。
-
ビジネスへの統合とテスト: お客様のアプリケーションとモデルが現実世界のさまざまなシナリオで適切に機能し、ビジネス プロセスと問題なく統合できることが重要です。Google Cloud コンサルティングは、この目的を達成するための慎重なプランニングを介してお客様を支援します。たとえば、Google Cloud でのスケーラブルかつ安全な環境の構築や、各種モデルとのやり取りを効率的に管理するための API の設計に加えて、さまざまな条件下でモデルのパフォーマンスを評価するための厳格な単体テスト、統合テスト、負荷テストの実装が可能です。
お客様のチームを対象としたトレーニングと支援
AI アプリケーションを本番環境に移行するために必要なビジネス プランニングと技術的な手順に加えて、トレーニングとチームへの支援も、クラウド デプロイの成功を目指すお客様にとって重要な優先事項です。Google Cloud は、Google Cloud Skills Boost プラットフォームを介して、チームが生成 AI に関するスキルアップを図れるよう支援する幅広いトレーニング、ハンズオンラボ、ブートキャンプ、コースワークを提供しています。これにより、お客様のチームは新しい AI アプリケーションを確実に構築、デプロイ、使用、管理できるようになります。
使ってみる
詳細については、こちらのページをご覧ください。Google Cloud コンサルティングがどのようにお客様の学習やソリューションの構築と運用を支援し、お客様を成功に導くかをご紹介しています。
-グローバル Google Cloud コンサルティング、バイス プレジデント Lee Moore