AI & 機械学習

新しい Vertex AI テキストエンベディングモデルのご紹介

2024年4月24日

https://storage.googleapis.com/gweb-cloudblog-publish/images/Next24_Blog_blank_2-08.max-2500x2500.jpg

Google Cloud Japan Team

Gemini 1.5 モデルをお試しください。

Vertex AI からアクセスできる、Google のもっとも先進的なマルチモーダルモデルです。

※この投稿は米国時間 2024 年 4 月 11 日に、Google Cloud blog に投稿されたものの抄訳です。

エンベディング（テキスト、音声、画像、動画などの実世界のデータの数値表現）は、生成 AI を強化する基盤モデルがデータ内の関係を理解する方法です。これらは固定次元のベクトルとして表現され、ベクトル空間内の 2 つのベクトルの幾何学的な距離は、ベクトルが表す 2 つの現実世界のオブジェクト間の関係を投影したものです。

テキストエンベディングモデルは、ドキュメント検索や類似性測定から分類とクラスタリングまで、多くの多様な自然言語処理（NLP）アプリケーションに不可欠です。Google のテキストエンベディングモデルは、BigQuery、Cloud Database、Vertex AI Search、Workspace など、Google Cloud 全体にわたるアプリケーションを強化します。

本日開催される Google Cloud Next '24 では、さまざまなタスクでパフォーマンスが向上した 2 つの新しい Vertex AI テキストエンベディングモデルを公開プレビュー版として紹介します。

英語のみ: text-embedding-preview-0409
多言語対応: text-multilingual-embedding-preview-0409

パフォーマンスが強化された新しいテキストエンベディングモデル

Google は新しいモデルを評価し、Google 調査「Gecko: 大規模言語モデルから抽出した汎用テキストエンベディング」で指標とより技術的な詳細を公開しました。

以前のバージョンと比較して、新しい英語版のエンベディングモデルでは、MTEB ベンチマーク（8 つのタスクカテゴリをカバーする、英語タスクに一般的に使用されるベンチマーク）で平均スコアが 66.31% に向上しました。Google の調査では、これは、エンベディングのサイズ 768 の既存の MTEB エントリすべてを上回り、多くの場合、最大 7 倍のサイズまたは 5 倍高い次元のモデルを上回りました。これらすべてが、検索、再ランキング、クラスタリング、分類、意味的類似性などのダウンストリームタスクにおける新しいモデルのテキストのパフォーマンスを証明しています。

Google の新しい i18n（多言語のエンベディングモデル）では、MIRACL ベンチマーク（18 の異なる言語をカバーする、一般的に使用される多言語取得ベンチマーク）の平均スコアが 56.2% に向上しました。

テキストエンベディングモデルの料金は、オンラインリクエストの場合は 1,000 文字あたり $0.000025、バッチリクエストの場合は 1,000 文字あたり $0.00002 です。詳細については、https://cloud.google.com/vertex-ai/generative-ai/pricing をご覧ください。新しいモデルのオンライン予測のサポートはすでに提供されており、これらのモデルのバッチ予測のサポートは近日提供予定です。

動的なエンベディング次元

新しいテキストエンベディングモデルでは、動的なエンベディングサイズも用意されています1。ユーザーはより小さいエンベディング次元を出力する方法を選択して、パフォーマンスの損失を最小限に抑えながらコンピューティングとストレージの費用を削減することもできます。パフォーマンスのトレードオフについては、以下の表をご覧ください。

モデル	MTEB スコア
モデル	256 dim	768 dim
text-embedding-preview-0409	64.37	66.31

他のサービス

また、安定バージョンのモデル向けにテキストエンベディングのカスタマイズも提供しています。上記 2 つの新しいモデル向けのカスタマイズのサポートは近日提供予定です。

Google ではパラメータ効率の高いチューニング方法を使用してカスタマイズを行っています。この方法では、一般公開されている検索ベンチマークデータセットで実施したテストで、品質が最大 41%（平均 12%）向上しています。

次のステップ

Google の公開ドキュメントと colab に沿って最新モデルを試し、フィードバックをお寄せください。

-Cloud AI および業種別ソリューション担当ソフトウェアエンジニア Xiaoqi Ren
-Google DeepMind、リサーチサイエンティスト Jinhyuk Lee

1. 動的エンベディングサイズのトレーニングには、マトリョーシカ表現学習を使用します。

投稿先

https://storage.googleapis.com/gweb-cloudblog-publish/images/aiml2022.max-700x700.png

AI & Machine Learning

BigQuery で LangChain を使用する検索拡張生成のスタートガイド

執筆者: Jeff Nelson • 所要時間: 11 分

https://storage.googleapis.com/gweb-cloudblog-publish/images/FINGen_AI_Blog_photo.max-700x700.png

AI & Machine Learning

生成 AI 活用事例大募集！第 2 回生成 AI Innovation Awards を開催します！

執筆者: Google Cloud Japan Team • 所要時間: 2 分

https://storage.googleapis.com/gweb-cloudblog-publish/images/image1_A1zLY0S.max-700x700.jpg

AI & Machine Learning

Anthropic の Claude 3 Opus とツール使用を Vertex AI 上で一般提供開始

執筆者: Nenshad Bardoliwalla • 所要時間: 9 分

https://storage.googleapis.com/gweb-cloudblog-publish/images/Google_Cloud_AIML_thumbnail.max-700x700.jpg

AI & Machine Learning

Google が The Forrester Wave™: AI Foundation Models for Language, Q2 2024 のリーダーに選出

執筆者: Warren Barkley • 所要時間: 13 分

新しい Vertex AI テキスト エンベディング モデルのご紹介

Google Cloud Japan Team

Gemini 1.5 モデル をお試しください。

パフォーマンスが強化された新しいテキスト エンベディング モデル

動的なエンベディング次元

他のサービス

次のステップ

-Cloud AI および業種別ソリューション担当ソフトウェア エンジニア Xiaoqi Ren-Google DeepMind、リサーチ サイエンティスト Jinhyuk Lee

関連記事

BigQuery で LangChain を使用する検索拡張生成のスタートガイド

生成 AI 活用事例大募集！ 第 2 回 生成 AI Innovation Awards を開催します！

Anthropic の Claude 3 Opus とツール使用を Vertex AI 上で一般提供開始

Google が The Forrester Wave™: AI Foundation Models for Language, Q2 2024 のリーダーに選出

新しい Vertex AI テキストエンベディングモデルのご紹介

Gemini 1.5 モデルをお試しください。

パフォーマンスが強化された新しいテキストエンベディングモデル

-Cloud AI および業種別ソリューション担当ソフトウェアエンジニア Xiaoqi Ren
-Google DeepMind、リサーチサイエンティスト Jinhyuk Lee

生成 AI 活用事例大募集！第 2 回生成 AI Innovation Awards を開催します！