Google Cloud、エンタープライズ向け生成 AI の利用を拡大
Google Cloud Japan Team
※この投稿は米国時間 2023 年 7 月 19 日に、Google Cloud blog に投稿されたものの抄訳です。
生成 AI の開発は猛烈な勢いで続いており、この破壊的技術を活かせるようなエンタープライズ向け機能を利用できるかどうかがかつてなく重要となっています。
Google の数十年に及ぶ調査とイノベーション、そして AI への投資を活用することで、Google Cloud は常に、セキュリティとデータ ガバナンス、そして全体的なスケーラビリティが用意されている状態で生成 AI を利用できるようにしています。
この目的のため、先月 Google は Vertex AI での生成 AI サポートの一般提供を発表しました。これにより Google Research から優れた基盤モデルにアクセス可能となり、これらのモデルをカスタマイズして利用するためのツールも利用できるようになります。
このたび、Vertex AI 用の特に重要な 4 つの基盤モデル、Imagen、PaLM 2 for Chat、Codey、Chirp について、一般提供(GA)を発表いたしました。これらの基盤モデルに対しては、いずれも Model Garden にある API にアクセスし、Generative AI Studio 上ですぐに設計と調整ができます。
Imagen の主な機能は次の 4 つです。
Image generation では、高品質な画像を大規模に作成できます
Image editing では、生成された画像や既存の画像をテキスト プロンプトで編集できます
Image captioning では、画像のキャプションを大規模に作成できます
Visual Question & Answering(VQA) では、画像の情報を確認し、分析、説明できます
PaLM 2 for Chat は、6 月の PaLM 2 for Text の GA に続いての発表となります。
Codey は、コードの生成と補完、コードチャットをサポートします。
Chirp は、多言語に対応した Speech AI をサポートします。
また、Multimodal Embeddings API のプレビュー版についてもお知らせします。これにより、Vertex AI の生成 AI モデルの機能とお客様の占有データを組み合わせて、テキストおよび画像データのエンベディングまたは交換可能なベクトル表現を作成できます。これらの機能により、画像の分類、コンテンツ レコメンデーション、画像検索といったさまざまな下流タスクにデータ サイエンス チームが対応できるようになります。
このブログ投稿では、これらの優れたモデルでできることや、生成 AI を活用し始めるためのエンタープライズ向け機能を Vertex AI がどのように提供しているかについて解説します。
生成 AI モデルからエンタープライズの価値を引き出す
生成 AI では優れたモデルが基礎となっていますが、エンタープライズ向けの用途ではその周囲にあるソフトウェア、ツール、インフラストラクチャも同様に重要です。組織が直面する課題は、モデルへのアクセスだけではありません。AI のインテグレーションを進める一方で、知的財産権の保護やデータ セキュリティとプライバシー規制の遵守を維持し、モデルとアプリケーション使用時の安全性を確保する必要があります。また多くの組織は、生成 AI の使用によって莫大な費用や膨大なクラスターの管理が発生することは望んでいません。
Google はこれらの課題への取り組みを、Vertex AI のプラットフォームの機能によるアプリケーションのスケーラブルなインテグレーション、目的特化型の AI インフラストラクチャ、セキュアで公開を限定できるデータのカスタマイズ、さらにこの技術の責任ある使用によって、正面からサポートします。
このそれぞれの柱がどのように役立つのか、詳しく確認していきましょう。
モデルにアクセスし、本番環境に対応した生成アプリケーションを構築
今回の発表の通り、Vertex AI は基盤モデルへのアクセスを容易にします。モデルは生成 AI と切り離せませんが、この技術のエンタープライズによる使用を支援するソフトウェアも同じく重要です。だからこそ、Vertex AI は幅広いツールを提供し、モデルの調整、デプロイ、モニタリング、メンテナンスを可能にしています。これにより、お客様は自身の所有するデータを使って、差別化されたアプリケーションを構築できます。
今回の発表について言えば、Google は画像生成用の基盤モデルである Imagen について 5 月にお知らせしていました。このたび、Imagen が許可リスト付き(営業担当者がアクセスを承認します)で一般提供となり、オンボーディング済みのお客様が画像生成と編集機能を使えるようになったことを発表いたします。また、本番環境のワークロード用の Visual Question & Answering と Captioning も、すべてのお客様に一般提供となりました。Visual Question & Answering は、小売商品や画像ライブラリなど画像ベースのデータを扱う新しい方法です。この新機能では画像についての質問に対する回答を得られ、膨大な量のデータを素早く分析するために役立ちます。また、画像やグラフを見ることのできない視覚障がいのある人が、それらを理解できるように支援します。一方の Captioning は、画像に合った説明文を簡単に作成できるようにします。説明があれば、インデックス登録と検索だけでなく、e コマースサイト上の商品リスティングに画像の説明文を割り振る際にも役立ちます。
Omnicom で Annalect チーフ プロダクト オフィサーを務める Art Schram 氏は、次のように述べています。「Omnicom のオープン オペレーティング システムである Omni の主要な機能で、Imagen の利用が開始されます。つまり、トレーニングを受け認証された 17,000 人以上のユーザーが、オーディエンス ドリブンのカスタマイズした画像を数分で作成可能になるということです。Imagen は画像生成とカスタマイズ用のスケーラブルなプラットフォーム提供の手段となっています。当社のプラットフォームに統合することで、これまで不可能だったスケールでオーディエンスによる創造的発想の範囲を拡大できます。Omnicom では、スタイルや詳細設定など最新の機能を取り入れ始め、データドリブンなプロンプトの開発も始めています。当社のユーザーが求める視覚的なインスピレーションを、責任のある方法で提供し続けられることを楽しみにしています。」
また、Typeface のプロダクト責任者である Vishal Sood 氏は次のように説明しました。「Imagen の製品保護における最近の改良は、ブランドに合わせてカスタマイズされた AI という Typeface が焦点を当てる部分に完璧にマッチしています。私たちは Google Vertex AI の Imagen と Typeface のブランドにカスタマイズされた AI を組み合わせることで、企業がほんのわずかな時間で 10 倍もカスタマイズされたコンテンツを作成できるように支援します。」
Google ショッピングは最近、Vertex AI で Imagen を使用し、Product Studio というアプリケーションを構築しました。Product Studio は、販売業者が素早く、また簡単に見栄えの良い商品画像を作成できるようにします。プロが商品写真を撮影するよりもはるかに短時間で作成できます。Google で販売業者購買担当プロダクト管理シニア ディレクターを務める Jeff Harrell は、次のように話しています。「初期のパイロット版について業者の方から寄せられているフィードバックに、私たちは喜んでいます。Vertex AI で Imagen を活用した Product Studio が、ライフスタイル製品の写真を作成して商品カタログに直接、掲載するために役立っているからです。」
5 月に発表された PaLM 2 は、Bard や Google Cloud の Duet AI をはじめとする多数の Google プロダクトに役立つ各種モデルの一つです。今では一般提供となった PaLM 2 for Chat モデルを使用することで、Google の PaLM に備わっている、ショッピング アシスタントや顧客サポート エージェントといったマルチターン チャット アプリケーションのさまざまな機能を活用できます。
ThoughtSpot は、広く利用されているビジネス インテリジェンス プラットフォームのプロバイダで、PaLM 2 を使用して、Google スプレッドシート用の ThoughtSpot の新機能「AI Explain」を構築しました。これはグラフ、画像や動画、異常値などの説明を一瞬で作成するものです。また、新しい対話型 AI と ML 対応の候補予測機能を、その分析プラットフォームでリリースする予定です。
Codey は開発者のさまざまなコーディング タスクを加速させ、作業を効率化してスキルギャップを埋めるために役立ちます。このモデルは、コード補完とコード生成の機能だけでなく、デバッグや文書化、新しいコンセプトの学習などもチャットで行います。5 月にプレビュー版がリリースされてから、プログラミング言語に Go、Google Standard SQL、Java、JavaScript、Python、Typescript が追加されました。また、コード レスポンスの品質を改善し、サービスを提供する容量を増やして、ジェネレーティブ エンジニアリング時代にふさわしいツールが利用できるようにしました。
GitLab のチーフ プロダクト オフィサー、David DeSanto 氏は、「AI をソフトウェア開発ライフサイクルに組み込むには、セキュリティとプライバシーが重要になります」と話しています。「GitLab では、AI 搭載の新機能の開発に Vertex AI を活用しており、当社独自のモデルを実行する機能や PaLM 2 上に構築された Cody の基盤モデルを利用する機能など、プライバシーを最優先するアプローチを取っています。GitLab DevSecOps プラットフォームにより、AI の恩恵を活かした迅速なソフトウェア デリバリーが可能になります。また同時に、データ、知的財産権、ソースコードを確実に保護できます。」
プレビュー版が 5 月にリリースされた Chirp は、20 億のパラメータを持つスピーチモデルのバージョンで、数百万時間の音声でトレーニングされており、100 を超える言語に対応しています。Chirp は、英語で 98% の精度を実現し、話者が 1,000 万人に満たない言語では、以前と比較して最大 300% の改善率を達成しています。該当のユースケースがカスタマー サポート、文字起こし、音声操作のいずれであっても、顧客や関係者全員との包摂的なコミュニケーションにそれぞれの母語で対応することで Chirp が支援します。
最後に、今回はプレビュー版のリリースとなる Google の Multimodal Embeddings API は、数々の新アプリケーションへの可能性を開くものです。たとえばテキストと画像を入れ替えて処理できるようにすることでの、画像とテキストベースのレコメンデーションなどが挙げられます。Multimodal Embeddings API は 6 月に一般提供となった Google の Text Embeddings API を補完する機能です。完全にテキストベースのユースケースには、Text Embeddings API が今後も推奨されます。Multimodal Embeddings API は、画像とテキストをまとめて分類できるようにします。小売のレコメンデーション システムで、関連性のある結果を商品画像と説明テキストの両方から得られるようにするといったユースケースでは不可欠となる場合があります。
生成 AI とインフラストラクチャの合致
生成 AI アプリを構築するためのモデルとツールへのアクセスに加えて、そのアプリのスケーリングと確実な動作を保証できるインフラストラクチャが必要になります。気が遠くなるようなコンピューティング費用や管理オーバーヘッドも、技術的な才能のある人たちの労力をイノベーティブな製品開発からそらしてしまうため、ないほうが理想的です。Google Cloud では、有限タスクを最低のレイテンシ レベルで実行する、より小さいモジュールを選択し動作させることができます。また、最新のテストも対応可能な大規模なモジュールも実行できます。
Google の大規模言語モデルのお客様は、Google のモデルを使用してプロジェクトとアプリケーションの規模を拡大したいと考えているため、多くの場合、リクエストに対して許容範囲のパフォーマンスが得られる保証を必要とします。特にカスタマー サービスが最重要となるリアルタイム アプリケーションの提供では不可欠です。Vertex AI では 8 月以降、スループットの保証を実現できる、プロビジョニング済みの専用の生成 AI 機能のサポートを開始します。この機能は、継続的なワークロードが大量にある場合に特に有益です。
データとプライバシーを保護しながら生成 AI を活用する
Google Cloud により有効になる機能の一つが、お客様独自のデータを使ったモデルのカスタマイズです。Vertex AI は、お客様のデータを保護し、安全性と機密性を維持するために役立ちます。Vertex AI の基盤モデルを企業が調整するときも、非公開データ、モデル出力、プロンプトは非公開のまま維持され、基盤モデルのトレーニング コーパスで使用されることは決してありません。最近 Google が発表したホワイトペーパー Adaptation of Large Foundation Models(大規模な基盤モデルの適応)では、Google がどのように顧客データ保護に役立つかを概説しています。
顧客データのセキュリティとプライバシーを確保するには、監査可能性とコンプライアンスが必須です。また、包括的な GDPR のプライバシーの取り組みにも従事しています。たとえば、顧客データの使用に関する透明性の取り組みや、お客様のデータ保護影響評価(DPIA)へのサポートなどです。Vertex AI の一般提供モデルの多くで、HIPAA コンプライアンスに対応するようにもなりました。これにより、Google と業務提携契約を結んでいるヘルスケアとライフ サイエンス分野のお客様に、Google Cloud で保護医療情報(PHI)を含むワークロードを実行していただけます。
責任のあるイノベーション
Google の AI に関する原則は、有益な利用、ユーザーの安全、損害の回避をビジネス成果より重視しており、Google の AI プロダクト開発方法に組み込まれています。生成 AI プロダクトはさらに詳細にレビューし、潜在的なリスクを特定して、リスク発生時のインパクトを軽減するための防御策を開発してきました。たとえば安全性の懸念への対処として、偏見や悪影響があるなどの有害なコンテンツに対するセーフティ フィルタを導入しています。Google はまた、お客様が所有するアプリケーション内のリスク低減に役立つようなツールや、責任ある AI につながるような推奨事項も提供しています。
生成 AI のパワーを組織に提供
基盤モデルの幅広い選択肢と、エンタープライズ グレードのプラットフォームが備えた多様な機能により、Vertex AI は今後もお客様のビジネスと組織が基盤モデルにアクセスするための道を開き、お客様の専有データに合わせて基盤モデルを調整し、それらを活用してアプリとデジタル体験の差別化につなげていきます。さらに詳細を知りたい方は、プロダクトのページをご覧いただくか、Google の営業担当者にご連絡いただき、最新機能にアクセスしてご確認ください。