ベクトル検索のインタラクティブなデモで、最先端のベクトル検索技術のパワーを体験してください。このデモでは、実際のデータセットを活用して、ベクトル検索の仕組み、セマンティック検索とハイブリッド検索、再ランキングの実例を紹介します。動物、植物、e コマース商品などのアイテムの簡単な説明を送信すると、ベクトル検索が残りの作業を行います。
試してみましょう
デモでさまざまなオプションを試して、ベクトル検索をすぐに使い始め、ベクトル検索技術の基本を理解しましょう。
実行する手順は次のとおりです。
[クエリ] テキスト フィールドに、クエリするアイテムの説明を入力します(例:
vintage 1970s pinball machine
)。または、[クエリを生成] をクリックして説明を自動生成します。[送信] をクリックします。
デモでできることの詳細については、ユーザー インターフェースをご覧ください。
ユーザー インターフェース
このセクションでは、ベクトル検索で返される結果とそのランク付けを制御するために使用できる UI の設定について説明します。
データセット
[データセット] プルダウンを使用して、ベクトル検索でクエリを実行するデータセットを選択します。各データセットの詳細については、データセットをご覧ください。
クエリ
[クエリ] フィールドに説明または 1 つ以上のキーワードを追加して、ベクトル検索で検出するアイテムを指定します。または、[クエリを生成] をクリックして説明を自動生成することもできます。
変更
ベクトル検索で返される結果を変更するには、次のオプションを使用できます。
[行] をクリックし、ベクトル検索で返す検索結果の最大数を選択します。
ベクトル検索で意味的に類似した結果を返す場合は、[密エンベディングを使用する] を選択します。
クエリのテキスト構文に基づいてベクトル検索で結果を返す場合は、[スパース エンベディングを使用する] を選択します。利用可能なデータセットによっては、スパース エンベディング モデルがサポートされていない場合があります。
ベクトル検索でハイブリッド検索を使用する場合は、[高密度エンベディングを使用する] と [スパース エンベディングを使用する] の両方を選択します。すべてのデータセットがこのモデルをサポートしているわけではありません。ハイブリッド検索では、高密度エンベディングとスパース エンベディングの両方の要素を組み合わせて、検索結果の品質を高めることができます。詳しくは、ハイブリッド検索についてをご覧ください。
[RRF アルファ] フィールドに 0.0 ~ 1.0 の値を入力して、RRF のランキング効果を指定します。
検索結果のランキングを再作成するには、[再ランキング] プルダウンから [ranking_api] を選択します。再ランキングを無効にするには、[なし] を選択します。
指標
クエリの実行後、検索の各ステージの完了に要した時間を分類したレイテンシ指標が表示されます。
クエリ処理
クエリが処理されると、次の処理が行われます。
クエリ エンベディングの生成: 指定されたクエリテキストのエンベディングが生成されます。
ベクトル検索クエリ: ベクトル検索インデックスを使用してクエリが実行されます。
Vertex AI Feature Store の取得: ベクトル検索から返されたアイテム ID のリストを使用して、Vertex AI Feature Store から特徴(アイテム名、説明、画像 URL など)が読み取られます。
再ランキング: 取得されたアイテムは、クエリテキスト、アイテム名、アイテムの説明を使用して関連性スコアを計算するランキング API によって並べ替えられます。
エンベディング
マルチモーダル: 商品画像のマルチモーダル セマンティック検索。詳しくは、マルチモーダル検索とは何か: 「視覚を備えた LLM」がビジネスを変えるをご覧ください。
テキスト(意味的類似性): 意味的類似性に基づいて、商品名と商品説明のテキスト セマンティック検索を行います。詳細については、Vertex AI Embeddings for Text: LLM の根拠づけが容易にをご覧ください。
テキスト(質問応答): 商品名と説明に関するテキスト セマンティック検索。タスクタイプ QUESTION_ANSWERING により検索品質が向上しています。これは、Q&A タイプのアプリケーションに適しています。タスクタイプのエンベディングの詳細については、Vertex AI エンベディングとタスクタイプを使用して生成 AI のユースケースを強化するをご覧ください。
スパース(ハイブリッド検索): TF-IDF アルゴリズムで生成された商品名と商品説明に対するキーワード(トークンベース)検索。詳細については、ハイブリッド検索についてをご覧ください。
データセット
インタラクティブなデモには、クエリを実行できる複数のデータセットが含まれています。データセットは、エンベディング モデル、スパース エンベディングのサポート、エンベディング ディメンション、保存されるアイテムの数によって異なります。
データセット | エンベディング モデル | スパース エンベディング モデル | エンベディング ディメンション | アイテム数 |
---|---|---|---|---|
Mercari マルチモーダル + スパース エンベディング | マルチモーダル エンベディング | TF-IDF (商品名と説明) |
1408 | 300 万人 |
Mercari Text(意味的類似性)+ スパース エンベディング | text-embedding-005 )(タスクタイプ: SEMANTIC_SIMILARITY) |
TF-IDF (商品名と説明) |
768 | 300 万人 |
Mercari Text(質問応答)+ スパース エンベディング | text-embedding-005 )(タスクタイプ: QUESTION_ANSWERING) |
TF-IDF (商品名と説明) |
768 | 300 万人 |
GBIF 花マルチモーダル + スパース エンベディング | マルチモーダル エンベディング | TF-IDF (商品名と説明) |
1408 | 約 330 万 |
GBIF 動物のマルチモーダル エンベディング | マルチモーダル エンベディング | なし | 1408 | 約 700 万人 |
次のステップ
デモを理解できたので、ベクトル検索の使用方法について詳しく学びましょう。
クイックスタート: サンプル データセットを使用して、30 分以内にインデックスを作成してデプロイします。
始める前に: エンベディングを準備するために必要な作業を確認し、インデックスをデプロイするエンドポイントの種類を決定します。