新しいモデルやツールを盛り込んだ Vertex AI、エンタープライズ向け生成 AI の開発を拡張
Google Cloud Japan Team
※この投稿は米国時間 2023 年 8 月 30 日に、Google Cloud blog に投稿されたものの抄訳です。
6 か月弱前に Vertex AI での生成 AI のサポートについて発表して以来、さまざまな業種のお客様による革新的なユースケースを目にしますが、感激すると同時に、身の引き締まる思いもいたします。たとえば、GE Appliances によるユーザーアプリ SmartHQ を使用すると、自宅の台所にある食材を使ってカスタムレシピを生成できます。また、起業したてのユニコーン企業である Typeface は、顧客組織が AI を活かして魅力的なブランド ストーリーを作成できるように支援しています。強力な需要のもと、Vertex AI の顧客アカウント数は前四半期の 15 倍以上に増加しています。
このたび、Google Cloud Next において、Vertex AI の機能拡張に関していくつかのお知らせがあります。これにより、お客様はこれまで以上に簡単に基盤モデルをテストして構築でき、企業データを使用してカスタマイズし、これらをスムーズに統合して、プライバシー、安全機能、責任ある AI を組み込んだアプリケーションにデプロイできるようになります。
多様で開かれたエコシステムによる選択肢を提供するという、Google のお客様へのコミットメントを深める新たなモデル群を Model Garden に追加。新たに追加されたのは、Meta の Llama 2 と Code Llama、および Technology Innovation Institute の Falcon LLM です。さらに、Anthropic の Claude 2 も追加されることを事前にお知らせしておきます。今回のお知らせをもって、Google Cloud はファースト パーティ、オープンソース、サードパーティのモデルを網羅した、厳選されたモデルのコレクションを提供することになります。
Google の基盤モデルをいくつか更新し、Google DeepMind の深い専門知識をお客様に提供します。その一環としてアップグレードされた PaLM は、より高品質な出力、32,000 トークンものコンテキスト ウィンドウを実現し、より大規模なドキュメントの分析を容易にします。さらに、企業データの根拠づけ機能も強化されました。Google のコード生成およびチャットモデルである Codey ではパフォーマンスが改善され、画像生成モデルである Imagen の画像品質も向上しています。
Google DeepMind の SynthID を活用した、Imagen の新たな電子透かし機能。
企業が Google の各種モデルから最大限の価値を引き出すための、新たなツール群。たとえば、Vertex AI Extensions を使用すると、モデルがリアルタイム データを取得して、現実の行動を実施できるようになります。また、Vertex AI データコネクタは、さまざまなソースに対するデータの取り込みと読み取り専用権限を提供します。
Llama 2、Claude 2 を含む 100 以上の大規模モデルを Model Garden に追加
多くのお客様は、生成 AI の取り組みを Vertex AI の Model Garden で開始します。ここでは、厳選された大規模モデルの多様なコレクションに、API を介してアクセスできます。開発者とデータ サイエンティストは、Model Garden 内を機能、サイズ、カスタマイズの可能性など、さまざまな要素に基づいて移動し、各自のユースケースに適したモデルを選択できます。こうすることで、優れたモデルにアクセスできるだけでなく、モデルを調整し、大規模にデプロイするために必要な選択肢と柔軟性を確保することができます。
Google は本日、2 つの優れた新モデル、Meta の Llama 2 と TII の Falcon というさらなる選択肢を皆様にお届けします。また、Anthropic の Claude 2 が追加されることについても、事前にお知らせしておきます。多様性に優れた Model Garden により、企業は自社のニーズに適合するモデルを見つけることができます。また、コンプライアンスや監査支援の目的など、モデルのウェイトやアーティファクトに対する完全な透明性が求められる場合には、Llama 2 や Falcon といったオープンソース オプションが大きな力を発揮します。
組織のデータは、モデルのパフォーマンスにとって最も重要な要素の一つです。そのため、Google ではモデルを簡単に調整できるようにしました。実際、アダプター チューニングと、人間によるフィードバックを用いた強化学習(RLHF)の両方で Llama 2 をサポートしているクラウド プロバイダは Google だけです。このため、組織は自社データの完全な管理と所有権を維持したまま、独自のエンタープライズ データによって Llama 2 を調整できます。これらのモデルは、フルマネージドのデータ サイエンス ノートブック環境である、Google が新たにリリースした Colab Enterprise で調整できます。
PaLM 2、Codey、Imagen でのモデルおよび調整機能のアップグレード
Google はモデルのエコシステムを拡大し続ける一方で、独自のモデルやツールにも投資しています。本日は、以下の進化についてお知らせします。
PaLM 2: PaLM が 38 言語で一般提供されたことをお知らせします。これにより、お客様は独自の企業データやプライベート コーパスを使用して、回答の根拠づけを行えるようになります。長めの質問応答チャットをサポートしたり、論文、書籍、弁論趣意書のような大きなドキュメントを要約および分析したりできるように、テキストとチャットに対応した新バージョンの PaLM 2 では、32,000 トークンのコンテキスト ウィンドウがサポートされます。これは、1 回のプロンプトで 85 ページのドキュメントを含めることができる規模のサイズです。
Codey: Codey の品質は、サポートされる主要言語でのコード生成とコードチャットにおいて、最大 25% 向上しました。
Imagen: 視覚的な魅力を向上させるとともに、最近では画像編集、字幕機能、視覚的な質疑応答などの機能を追加しました。また、実験的な電子透かし機能についてもお知らせしましたが、詳細については後述します。
Google はモデルの更新だけではなく、アダプター チューニングによって、企業が独自のデータと指示でモデルをカスタマイズできるように支援します。これには、現在一般提供されている PaLM 2 for Text、公開プレビュー段階にある、人間によるフィードバックを用いた強化学習(RLHF)を使用できます。さらに、Imagen 用にスタイル チューニングという新機能を導入し、10 個以下の画像であれば、ブランド ガイドラインに従って画像を調整できるようになりました。
お客様はすでに、多大な価値を見出しています。
「Google Cloud と連携し、ソフトウェア開発のライフサイクル全般にわたって、AI を活用したワークフローを提供できることを嬉しく思います。」GitLab の最高製品責任者である David DeSanto 氏はこう語ります。「GitLab は、Codey モデル ファミリーを含む PaLM 2 基盤モデルを活用し、安全なソフトウェアの作成に携わるすべてのユーザーに、AI による新しい体験を提供します。AI を活用したワークフロー群である GitLab Duo を使用すると、組織は安全なソフトウェアをより効率的に配信できるようになります。」
「Omnicom のオープン オペレーティング システムである Omni の主要な機能で、Imagen の利用が開始されます。これにより、トレーニングを受け認証された 17,000 人以上のユーザーが、オーディエンス ドリブンのカスタマイズされた画像を数分で作成できるようになります。Imagen は画像生成とカスタマイズ用のスケーラブルなプラットフォーム提供の手段となっています。当社のプラットフォームに統合することで、これまで不可能だったスケールでオーディエンスによる創造的発想の範囲を拡大できます」と Omnicom で Annalect 担当最高製品責任者を務める Art Schram 氏は述べています。「Omnicom では、スタイルやファイン チューニングなど最新の機能を取り入れ始め、データドリブンなプロンプトの開発も始めています。当社のユーザーが求める視覚的なインスピレーションを、責任のある方法で提供し続けられることを楽しみにしています。」
「Workiva プラットフォームは、生産性と効率をさらに高めるために生成 AI 技術を組み込んでおり、データドリブンな意思決定をより的確かつ迅速に行うための分析情報の取得を可能にします」と、Workiva の最高技術責任者(CTO)である David Haila 氏は語ります。「Vertex AI で PaLM 2 を使用することで、生成 AI の真の可能性が引き出され、豊かなユーザー エクスペリエンスが実現されます。ワークフローのどこであっても、新たな機能を活用できるようになります。また、モデルの改善により、信頼性が高く保証された統合レポート ソリューションを今後も提供し続けることができます。ビジネス レポーティングの状況は変わり、世界規模で有意義な変革が推進されるでしょう。」
「Google Cloud のすぐに使える AI と API サポートにより、私たちのワークフローは一変しました。Google Cloud が提供する統合 AI 環境は、私たちのアプリケーション アーキテクチャにおける重要な要素です。これにより、基盤モデルと自社独自の ML モデルを融合でき、コンテンツをリアルタイムでパーソナライズするためのスケーラビリティの問題が解決されます。Vertex API を介して Imagen を統合することで、お客様はコンテンツを迅速に作成し、かつてないレベルのパーソナライズを達成し、より粒度の高い分析情報を生成できるようになり、パフォーマンスの向上につながりました」と Connected Stories の共同創業者である Tommaso Vaccarella 氏は述べています。「イノベーションの実現だけではありません。厳格なデータ セーフティ措置が規定されていることで、私たちもお客様も、機密情報が常に保護されていることに安心できます。Google Cloud は私たちに、最先端のエンタープライズ向けソリューションを市場投入するために必要となるパワーとスピードを与えてくれます。」
Imagen で生成した画像を DeepMind SynthID による電子透かしで検証
責任ある AI の取り組みを可能な限り加速させようと、Google は全社を挙げて力を注いでいます。Google DeepMind とのパートナーシップに基づき、試験運用フェーズで、Vertex AI に電子透かしを導入する試みを開始しました。これにより、お客様は Imagen(テキストから画像を生成する Google のモデル)による AI 生成画像を検証できます。
画像生成では、合成して生成されたコンテンツを見分けるためのツールが必要になります。メタデータなど、合成画像を識別するための既存の手法は、除去が可能な場合もあり、画質に影響を及ぼすこともあります。Google Cloud は Vertex AI に試験運用で電子透かしを導入したことで、目に見えない改ざん防止機能を持つ透かしを作成し、AI 生成画像に埋め込むことのできる、初のハイパースケール クラウド プロバイダとなりました。この技術は Google DeepMind SynthID を活用しています。Google DeepMind SynthID は、電子透かしをピクセル画像に直接埋め込むことのできる最先端技術であり、この透かしは人の目には見えず、また、画像を損傷せずに改ざんすることは非常に困難です。
拡張機能により現実世界のデータに接続し、現実の行動を促進
基盤モデルはパワフルですが、トレーニング後は固定されてしまいます。つまり、新しい情報が入っても更新されないため、古い結果が返される可能性があります。Vertex AI Extensions は拡張機能を提供する、フルマネージドのデベロッパー ツール群であり、モデルを API に接続することで、リアルタイム データと現実世界の行動に対応できます。
開発者は Extensions の導入により、一般的なエンタープライズ API 向けの、事前構築済みの拡張機能を使用することも、プライベート API や公開 API 向けに独自の拡張機能を構築することもできます。拡張機能を使用することで、デジタル アシスタント、検索エンジン、自動化されたワークフローなど、高度な生成 AI アプリケーションを構築できます。
たとえば、HR データベース向けに事前構築された拡張機能と Vertex AI Search を使用して、人事業務の遂行を自然言語で支援できるような chatbot を作成できます。従業員はこれを利用して、給付期限や出張規約など、経時的に変化する可能性のある内容を検索できます。別の例としては、コードを分析して脆弱性の有無を確認するアプリが考えられます。開発者は拡張機能を使用して内部コードベースを取り込み、進化するセキュリティ脅威をリアルタイムで検索できます。ユースケースはほぼ無限にあります。
Vertex AI の事前構築済み拡張機能は、BigQuery、AlloyDB のようなクラウド サービスや、DataStax、MongoDB、Redis のようなデータベース パートナーにも対応しています。Vertex AI を使用することで、LangChain との統合や、プライベート API および公開 API の認証が可能になります。また、Google Cloud の堅牢なエンタープライズ向けのセキュリティ、プライバシー、コンプライアンス管理によるアプリケーション保護を実現できます。
ユーザーそれぞれの状況に対応する
このような Vertex AI の更新は、Google の AI ポートフォリオ全体で行われた数々の改善の、ごく一部にすぎません。これらはすべて、それぞれの持つ ML の専門知識レベルにかかわらず、現時点でのデベロッパーの状況に適合するよう設計されています。
GA Telesis や Vodafone など、生成 AI を活かして業務の効率化を向上させた企業、Priceline のような、Vertex AI を顧客エンゲージメントのイノベーションに活用した企業など、お客様の勢いに私たちも刺激を受けています。Google はこれからも、エンタープライズ グレードの AI を提供し続けます。これが、より多くのお客様の成功につながるなら、こんな嬉しいことはありません。
Model Garden と、このプラットフォームのさまざまなチューニング ツールは、開発者とデータ サイエンティストの両方にとって魅力的です。利用を開始するには、こちらをクリックしてください。モデルのテスト、構築、デプロイに携わるデータ サイエンティストであれば、Google が新たに発表した Colab Enterprise も見逃せないリソースです。詳細はこちらをご覧ください。
chatbot やカスタム検索エンジンなど、生成 AI を使用した一般的なユースケースをすぐに開始したいと考えるデベロッパーには、Vertex AI Search and Conversation をおすすめします。これにより、AI の使用経験がまったくなくても、また多くの場合、コードを記述した経験さえなくても、スムーズに利用を開始できます。
Vertex AI の詳細情報を確認して使用を開始するには、こちらのウェブページとドキュメントをご覧ください。生成 AI の管理の詳細については、Google の AI 導入フレームワークに基づく新たなツールである AI Readiness Quick Check をご覧ください。
- Cloud AI および業界別ソリューション担当バイス プレジデント June Yang