コンテンツに移動
AI & 機械学習

Google Cloud、I/O にてジェネレーティブ AI を加速 - Vertex AI の新しい基盤モデル、エンべディングとチューニング ツール

2023年5月11日
https://storage.googleapis.com/gweb-cloudblog-publish/images/IO23_Blog_Images-09.max-2500x2500.jpg
Google Cloud Japan Team

※この投稿は米国時間 2023 年 5  月 11 日に、Google Cloud blog に投稿されたものの抄訳です。

ジェネレーティブ AI は、新しい種類のデジタル アシスタント、コンテンツ作成ツール、アプリケーションを創出しており、アプリケーションの開発方法、開発できる人材、およびエンドユーザーの期待する機能に変化をもたらしています。

Google は、ジェネレーティブ AI を実現する Transformer アーキテクチャの開発から、本日発表した、多言語、推論、コーディング機能を向上させた次世代言語モデル PaLM 2 の発表に至るまで、この分野をけん引してきました。Google Cloud では、これらの革新的な基盤モデルをお客様に提供し、開発者がまったく新しい方法でイノベーションを起こすことができるよう支援しています。

2023 年 3 月、私たちは重要な機能を 2 つ発表し、大きな一歩を踏み出しました。 機械学習 (ML) の経験が浅い開発者でも生成チャットや検索アプリを簡単に素早く作成できる「Gen App Builder」、そして、機械学習開発プラットフォームを拡張し、Model Garden の API を通じて基盤モデルにアクセスできるほか、Generative AI Studio でモデルのカスタマイズや実験を行うためのさまざまなツールを提供する、「Vertex AI のジェネレーティブ AI サポート」です。

本日、Google I/O 2023 では、新しいジェネレーティブ AI 基盤モデルへのアクセスや、モデルの活用と調整の方法を拡大する、さまざまな機能の発表を行いました。私たちは、これらのサービスをさらに充実させていきます。

  • Vertex AI では、新たに 3 つの基盤モデルを用意し、API でアクセスしたり、Generative AI Studio のシンプルな UI でチューニングしたり、データ サイエンス ノートブックにデプロイすることができるようになりました。

    • Codey はテキストからコードを生成する基盤モデルで、SDK やアプリケーションに組み込むことで、開発者のベロシティ向上、コード生成とコード補完、コード品質の向上を支援します。

    • Imagen は、テキストから画像への変換を行う基盤モデルで、あらゆるビジネスニーズに対して、スタジオで撮影したレベルの画像を大規模に生成し、カスタマイズすることができます。

    • Chirp は、最先端のスピーチモデルであり、キャプションや音声アシストによって、企業が顧客やステークホルダーと母国語でより深く、包括的に関わることができるよう支援します。

  • Embeddings APIs for Text and Images は、 テキストや画像のセマンティックな理解に基づく、レコメンデーション エンジン、分類機能、質問に回答するシステム、その他の高度なアプリケーションの構築を支援します。

  • Reinforcement Learning from Human Feedback(RLHF)は、ユーザーのフィードバックを組み込んでモデルのパフォーマンスをカスタマイズおよび改善できるようにし、Vertex AI のチューニングを拡張し、デザイン機能の向上を促します。

  • Generative AI Studio、Model Garden、PaLM 2 for Text and Chat は、テスト環境からプレビューに移行し、Google Cloud のアカウントを持つすべての人がアクセスできるようになりました。

これらの発表は、エンタープライズ グレードの安全性、セキュリティ、プライバシーに支えられたジェネレーティブ AI の技術で、開発者が大胆かつ責任を持って構築できるようにするための重要なステップです。以下で詳しくご説明します。 

新しい基盤モデルにより、開発者とデータサイエンティストにより多くの機能を提供し、 ジェネレーティブ AI のアプリケーションを構築できるよう支援します。

新しい基盤モデルの第一弾は、Codey です。Codey では、お客様が独自のコードベースにカスタマイズできるリアルタイムのコード補完・生成でソフトウェア開発を加速させます。このコード生成モデルは、Go、Google Standard SQL、Java、Javascript、Python、Typescriptなど、20 以上の言語をサポートしています。さまざまなコーディング作業を可能にし、開発者の作業の迅速化とスキルギャップの解消を支援します。 

  • コード補完:プロンプトに入力されたコードの文脈に基づいて、Codey が次の数行を提案します。

  • コード生成:開発者が入れた自然言語のプロンプトをもとに、Codey がコードを生成します。

  • コードチャット:デバッグ、ドキュメント作成、新しいコンセプトの学習など、コードに関連する質問に対して、ボットと会話することができます。

https://storage.googleapis.com/gweb-cloudblog-publish/original_images/codey.gif

2 つ目の基盤モデルは Imagen です。Imagen により、お客様はあらゆるビジネスニーズに対応した高品質の画像を生成・編集することができます。テキストから画像を生成するこのモデルによって、低レイテンシーとエンタープライズグレードのデータガバナンスで、高品質の画像を大規模に作成・編集することが容易にします。Vertex AI では、既存の製品やロゴなど独自のコンテンツで画像を生成し、Imagen をビジネスニーズに合わせてカスタマイズして適応させることができます。マスクなしの編集や画像のアップスケール、および 300 以上の言語に対応した画像キャプション機能を活用することで、すぐに本番環境に対応した画像を生成することができます。

Vertex AI の Imagen を使えば、プロンプトとして数語入力するだけで、スタジオで撮影したレベルの画像を作成できるようになります。オブジェクトの色を変更するなどの画像の修正も、追加で数語入力するだけで完了します。また、Imagen には、画像に説明文を付けて分類する機能があり、内蔵のコンテンツ モデレーションは、最高レベルの安全対策でサポートされています。Vertex AI で生成された画像は、すべてお客様のデータであり、マーケティング資料などのために使用することができます。

自社製品の画像を生成する場合、Vertex AI に組み込まれているセキュリティとガバナンスの管理下で、既存の画像をアップロードしてデータの安全を確保することができます。生成された画像は、その後も無限に複製することができ、必要な解像度にアップスケールしたり、キャプションやメタデータを簡単に追加したりすることもできます。

Video Thumbnail

3 つ目の基盤モデルが Chirp です。Chirp は、母国語で顧客やステークホルダーとより包括的に関われるよう支援します。コンタクトセンターのバーチャルエージェントとスペイン語でやり取りしたり、コーサ語のビデオにキャプションをつけたり、バリ語で音声アシストを実施したりすることができ、音声コントロールからキャプション、音声アシストに至るまで、音声タスクに大規模モデルのパワーをもたらします。

Chirp は、数 100 万時間の音声で訓練された 20 億パラメータの音声モデルで、100 以上の言語をサポートしており、世界で最も話されている言語のモデルを、さらに多くの方言にまで拡大しています。Chirp は、英語で 98% の精度を達成し、話者が 1 千万人以下の言語においても約 300% の相対的な向上を実現しています。

https://storage.googleapis.com/gweb-cloudblog-publish/original_images/chirp.gif

Embeddings APIs: データから新たな関係を見つけ、洗練されたジェネレーティブ アプリケーションを加速

Embeddings APIs for Text and Images が Vertex AI で利用可能になり、開発者はより魅力的なアプリとユーザー体験を創出できるようになりました。Embeddings は、テキストや画像データのセマンティックな関係をマッピングする多次元数値ベクトルに変換し、それを大規模なモデルで処理することができ、特に数千のトークンを持つ長いテキストなどの入力に有用です。

Vertex AI で Embeddings API が利用可能になったことで、開発者は、セマンティック検索やテキスト分類機能の構築、組織のデータに基づく Q&A チャットボットの作成、クラスタリング、異常検知、感情分析などを改善でき、より魅力的なアプリやユーザー体験を創出できます。

Embeddings APIs for Text and Images は現在、プレビューで利用可能で、テストユーザーはテキストと画像の両方の API を活用することができます。

RLHF で基礎モデルから多くの価値を獲得

Vertex AI は、マネージドサービスとして RLHF を提供するハイパー スケーラー初のエンドツーエンド機械学習プラットフォームであり、企業が長期にわたってモデルのパフォーマンスを効率よく維持し、より安全で正確、かつ有用なモデルを本番環境に導入できるようにします。

このユニークなチューニング機能により、組織は人間のフィードバックに沿った報酬モデルを作成し、その報酬モデルを使って基礎モデルの微調整を行うことができるようになります。これは、最終的に顧客満足度とエンゲージメントの向上につながるため、特にヘルスケアなどの正確性が肝要な業界、または金融や電子商取引など、顧客満足度が重要な業界のお客様に有用です。 また、モデルの回答に偏りがないか、有害なものが含まれていないかなど、より正確に確認し、不適切な出力を回避するようにモデルを調整することができます。

すぐに開発を開始しましょう

Vertex AI で利用できる新しい基盤モデルと、それらのモデルをカスタマイズして活用するための拡張ツールセットにより、私たちはあらゆる業界や技術的専門性のレベルにある組織がクラウドで AI を構築して利用する方法を変革し続けています。

Codey、Imagen、Embeddings API for images、および RHLF は、テスタープログラムを通じて Vertex AI で利用可能です。また、Chirp、PaLM 2、Embeddings API、Generative AI Studio for text は、Google Cloud アカウントを持つすべての人に Vertex AI 上でプレビュー提供しています。

また、Google と Google Cloud の最新の AI ニュースについては、The Prompt のブログ、および Google Cloud のブログをぜひご覧ください。

投稿先