コンテンツに移動
Transform with Google Cloud

The Prompt: モデルだけでなく AI プラットフォームにも投資する + Google I/O のまとめ

2023年6月20日
https://storage.googleapis.com/gweb-cloudblog-publish/images/GettyImages-1197257945.max-2600x2600.jpg
Google Cloud Japan Team

変革をもたらすジェネレーティブ AI の最新トレンド

※この投稿は米国時間 2023 年 5 月 13 日に、Google Cloud blog に投稿されたものの抄訳です。

このところ、ビジネス リーダーたちの間では、ジェネレーティブ AI が話題の中心となっています。急速に進化を続け、変革をもたらすこの分野の話題をフォローできるよう、「The Prompt」と題したシリーズを通じ、Google がお客様やパートナーと接するなかでの気づきや、Google の AI の最新動向を紹介していきます。今回は、Google Cloud の AI & ビジネス ソリューション担当グローバル VP の Philip Moyer が、Google I/O を振り返り、組織においてデータとジェネレーティブ AI を組み合わせる方法について解説します。

Google I/O を終えたばかりで、まだ興奮冷めやらぬといったところでしょう。この度の Google I/O で印象に残ったのは、PaLM 2 の登場をはじめとした基盤モデルに関連する発表です。PaLM 2 は本番環境としては Google 最先端のモデルで、AI エンジンとして数十の Google プロダクトに搭載されます。さらに、Vertex AI では、PaLM 2 のテキストとチャット機能だけでなく、画像生成、コード生成、音声用の新しい基盤モデルまでアクセスが拡張されます。

モデルに関するこれらの発表に関連し、今回はエンタープライズ データと生成モデルを組み合わせる方法について解説します。私が話をした経営幹部の方々は、ジェネレーティブ AI モデルが画期的であると口を揃えていました。ただし、エンタープライズで使用するには「画期的」であるだけでは不十分なため慎重にもなっています。

たとえばリーダーたちは、ジェネレーティブ AI 基盤モデルの出力が自社のユースケースで使用するに十分な信頼性と正確性を備えているかどうかを強く懸念しています。多くのケースで役には立つが、間違いもあり、この点で多くのシナリオで使用できる水準には達していません。

さらにリーダーたちを悩ませるのは、信頼性を確保する方法を簡単に実装または拡張できるかという点です。大規模な組織であっても、高度なカスタマイズに対応できるデータ サイエンティストや開発者の数が限られているからです。経営幹部は、ジェネレーティブ AI を迅速に活用する方法を知りたいと考えており、無駄に投資をしたりブランドを傷つけたりする可能性のある「成長痛」には興味がありません。

このような要件や課題があることから、組織のリーダーたちは、ジェネレーティブ AI モデルだけでなく、モデルを使いやすくするプラットフォームにも投資を行う必要があるということをますます実感するようになってきました。

このコラムでは、これらのプラットフォームで必要とされる機能とは何か、そしてエンタープライズで導入する場合、強固なモデルだけでは不十分なのはなぜかを探っていきます。例として、エンタープライズ検索に焦点を当てます。これは、業界を問わず経営幹部との話題にのぼる、最も幅広く該当するユースケースです。

対象を絞って精度を向上させる

シリーズ「The Prompt」の以前の記事で書いたように、ほとんどすべての企業は、自社のデータをジェネレーティブ AI と組み合わせ、従業員の質問に対して、職務に関連するすべてのリソースから実用的で信頼性の高い回答を導き出せるようにしたいと考えています。

考えられるユースケースは無限にあります。たとえば、一連調査に携わる研究者、顧客対応をする店員、異なるチーム間で協働したり最新の情報を関係者に共有する場合など、基本的に人々が情報をやり取りするあらゆるシナリオが対象となります。しかし、これを行うこと自体は簡単ではありません。では、自社のデータとジェネレーティブ AI を組み合わせることが何を意味するのかを見てみましょう。

特殊なユースケースの場合、組織は追加データを微調整することで基盤モデルのトレーニングを更新できます。これは、Google が Med-PaLM 2Sec-PaLM で行ったように、特定の言語と要件を持つ分野にモデルを確実に適合させるのに役立ちます。

ただし、このアプローチはエンタープライズ検索では機能しません。というのも、情報があまりにも頻繁に更新され、再トレーニングが非常に複雑で維持費用もかかるからです。

このような頻繁に変化するデータの場合には、モデルが考慮する情報を制限することができます。トレーニング データから回答を導き出すようにモデルに依頼するのではなく、内部リポジトリや公開データベースなど、常に更新されている特定のソースに誘導します。モデルの対象を絞り込んで、これまでに公開されたすべてのデータではなく特定の情報に集中させることで、最新データに基づいたより正確な回答を得られます。

適切な検索方法で答えを得る

残念ながら「モデルの対象を集中させる」方法の多くには問題があります。たとえば、ドキュメントのテキストをジェネレーティブ チャットに貼り付けるだけで質問する人もいます。1 回限りの質問であればこれで良いのですが、拡張性はありません。ドキュメントが長い場合や 1 つの大きなドキュメントが複数のプロンプトに分割されている場合、モデルは文脈を見失います。

組織が生成モデルを検索 API に接続して、適切なデータに誘導できるようにする場合もありますが、関係する検索テクノロジーによっては、このアプローチにも限界があります。たとえば、キーワード ベースの検索では、ソース間の最も明示的なつながりのみが検索されるため、より詳細な分析情報を見つけたり、ソースを全体的に統合したりするモデルの能力が制限されます。

もっと良いアプローチとして、キーワードだけでなくデータ内の多次元の関係を調べるセマンティック検索など、より高度な検索および取得方法にモデルをつなげる方法もあります。しかし、やはりこれも難しい場合があります。IT チームは Embeddings API を使用してセマンティック関係をマッピングする場合がありますが、絶えず更新される多くのソースにわたってカスタム パイプラインを作成するのは、労力と複雑さが増すだけでなく、新しい基盤モデルへの切り替えなど、将来の戦略が制限されるリスクも生じます。特に、ジェネレーティブ AI の活用をすぐに始めたいと考えている組織には、もっとユーザー フレンドリーな方法が望ましいでしょう。  

AI は複雑ですが、AI の導入まで複雑にする必要はありません

優れた AI プラットフォームは、パワフルなモデルへのアクセス、対象データモデルを絞り込む方法、そのデータを取得するための高度な検索手法に加えて、複雑さを取り除き、企業が前進できるようにするシンプルな実装も備えている必要があります。これこそが、経営幹部の皆様からいただく強いご要望であり、特にエンタープライズ検索などの幅広く適用されるユースケースにおいて、ジェネレーティブ AI の導入を容易にするために Google が構築してきたものです。

たとえば、Google Cloud の Gen App Builder などのサービスでは、カスタマイズされたジェネレーティブ チャット インターフェースを数分で作成できます。エンタープライズ検索のシナリオだけでなく、小売 chatbot やその他さまざまなユースケースにも対応でき、そのすべてにエンタープライズ グレードのガバナンス、オーケストレーション、セキュリティが組み込まれます。Google I/O の以下のセッションで示されているように、ユーザーは公開 URL を入力するか、利用可能なリソースのリストから選択するだけで、あとはサービスが処理してくれます。

https://storage.googleapis.com/gweb-cloudblog-publish/images/Screenshot_2023-05-12_at_11.22.54_AM.max-2200x2200.png

また、きめ細かいカスタマイズや高度な使用方法にも対応できるように、モデルの微調整や Embeddings API なども提供しています。これは重要なポイントです。組織は優れたモデルだけでなく、多面的なプラットフォーム機能を必要としているのです。

Google のにおける AI に関する最新情報(※ 英語のコンテンツを含みます)

今回の Google I/O は全体を通して驚くべきニュースが満載でした。

ハイライトとして、Bard、Cloud、Workspace に関する AI の最新情報と発表、PaLM 2 と開発中の Gemini モデルの詳細、ジェネレーティブ AI による検索強化のビジョン、Androidマップフォト向けの AI を活用した機能、そして責任ある AI への取り組みが挙げられます。基調講演全体はこちらでご覧いただけますが、見逃せないポイントを一部以下にご紹介します。

お客様の動向: Google Cloud CEO の Thomas Kuran は、Adore Me、Canva、Character.AI、Deutsche Bank、Instacart、Orange、Replit、Uber、Wendy's など、ジェネレーティブ AI および AI インフラストラクチャのお客様が成し遂げた革新的な成果について紹介しました。以下の動画で、お客様がジェネレーティブ AI と Google Cloud について語る様子をご覧ください。

https://storage.googleapis.com/gweb-cloudblog-publish/images/Screenshot_2023-05-12_at_11.29.00_AM.max-2200x2200.png
  • ジェネレーティブ AI と検索の融合 新しい配送エクスペリエンス、トピックをより迅速に理解する方法や多様な分析情報を得る方法など、ジェネレーティブ AI が Google 検索の新しい可能性を広げていることを紹介しました。詳細については、こちらのブログをご覧ください。また、新たな試みである Search Labs に登録して、開発途中の新しいプロダクトやアイデアのテストにご参加ください。
  • Duet のご紹介: Duet AI for Google Cloud および Duet AI for Google Workspace では、常時稼働するジェネレーティブ AI を搭載し、ユーザの作業の迅速化を支援します。
  • Model Garden の提供開始: 前述したように、Google は PaLM 2 を発表しました。また、Google の AI 開発プラットフォーム、Vertex AI に数多くのアップデートを導入した結果、開発者とデータ サイエンティストが基盤モデルを活用する最も簡単な方法の一つとなりました。Google I/O で発表した内容には、コード生成、画像生成、音声のための新しい基盤モデルの登場、Embeddings API の発表、人間によるフィードバックを用いた強化学習(RLHF)などの追加のモデル カスタマイズ ツール、Generative AI Studio、Model Garden、Palm 2 for Text and Chat へのプレビュー アクセスなどがあり、Google Cloud アカウントをお持ちのすべての方にご利用いただけます。
  • より高度な AI のためのより高度なインフラストラクチャ: Google は、NVIDIA H100 Tensor Core GPU と Google の最先端ネットワーキングを組み合わせて、最も要求の厳しい AI モデルをトレーニングして提供することに特化した次世代 A3 GPU スーパーコンピュータを発表しました。
  • Google AI が広く使用されているエンタープライズ アプリケーションに登場: Box、Canvas、Dialpad、Jasper、Salesforce、UKG など、多くのエンタープライズ企業が Google Cloud のジェネレーティブ AI 機能をアプリケーションに統合していることを発表しました。
  • PaLM 2 で Bard がより利用しやすくスマートに: Bard に PaLM 2 が搭載され、マルチモーダル機能や外部パートナー向けの拡張機能が追加されるなど、よりスマートになりました。Google I/O では、180 以上の国と地域で Bard を利用できるようになったこと、それが近い将来さらに増える予定であることを発表しました。  
  • 責任ある AI の取り組み: これらの発表で繰り返されたテーマは、責任ある AI への取り組みです。Google I/O では、AI が生成したコンテンツをユーザーが識別できるようにする機能など、すべての人にとって安全で有用な AI を提供するために行っている取り組みの一部を紹介しました。

Google I/O では継続的な取り組みの直近の状況を紹介したにすぎず、すぐにまた最新情報をお届けすることになるかと思いますが、当面は企業のリーダーの方々と Google の最新の発表について話し合い、ジェネレーティブ AI を活用して構築した素晴らしいユースケースが生まれることを楽しみにしています。

- Google Cloud、AI & ビジネス ソリューション担当グローバル VP、Philip Moyer

投稿先