このページでは、カスタムアプリ向けの Vertex AI Search の機能を紹介し、一覧表示します。このページには、カスタムアプリ向け Vertex AI Search の使用を開始するための利用可能な機能、チュートリアル、チェックリストへのリンクも記載されています。
カスタムアプリ用の Vertex AI Search とは
カスタムアプリ用の Vertex AI Search は、ウェブサイト データやその他の構造化データまたは非構造化データを含むアプリケーションに統合できる、強力な Google 品質の検索とコンテンツ検出エンジンです。検索機能は基本的なキーワード マッチングを超えており、AI を使用して関連性の高い結果を提供し、パーソナライズされたブラウジングと検索のエクスペリエンスを提供し、データに基づいて AI の回答を生成します。
カスタム検索アプリは、一般公開ウェブサイトにある、または構造化形式または非構造化形式の、業種に依存しないデータに使用できます。また、Vertex AI Search には、業種固有の検索アプリとレコメンデーション アプリも用意されています。
- メディアデータについては、メディア検索とレコメンデーションの概要をご覧ください。
- コマースと小売業のデータについては、Vertex AI Search for Commerce をご覧ください。
- 医療データについては、医療検索チェックリストをご覧ください。
主な機能
Vertex AI Search の主な機能は次のとおりです。
- 高品質の検索: 複雑なクエリや自然言語クエリでも、Google の検索に関する専門知識を活用してユーザーの意図を理解します。キーワード検索とセマンティック検索を組み合わせて、最適な結果を提供します。
- パーソナライズされたブラウジング: 特定の検索クエリなしでパーソナライズされた結果を提供し、ユーザーのコンテキストとナビゲーション パターンに基づいてパーソナライズされたフィードを提供します。パーソナライズされたカテゴリ ページやホームフィードを表示するディスカバリ エクスペリエンスに最適です。
- データソース: 次のようなさまざまなデータソースに対応しています。
- ウェブサイト: 公開ウェブサイトのインデックス登録を行い、ウェブサイトの構造化データによるインデックスの拡充などの高度な機能を使用します。
- 構造化データ: データベース、Cloud Storage の JSON ファイル、BigQuery テーブルなど、定義された形式で整理されたデータを検索します(ホテル カタログ、不動産リスティング、レストラン ディレクトリなど)。
- 非構造化データ: Cloud Storage または BigQuery に保存されている PDF、HTML ファイル、TXT ファイルなどのドキュメントや、JPEG ファイルや PNG ファイルなどの画像ファイルを検索します。
- 統合検索: 上記のデータソースからデータを統合する複数のデータストアを検索します。たとえば、検索アプリを作成して、ウェブサイト データストアとドキュメント データストアに接続できます。これにより、ユーザーはすべてのコンテンツを一度に検索できます。
- 根拠のある AI 回答の生成: データに基づいて AI 回答を生成し、ソース ドキュメントへの引用を付加します。フォローアップの質問や関連するクエリを尋ねることもできます。
- パーソナライズ: クリックやコンバージョンなどのユーザー イベントでキャプチャされたユーザー インタラクションから学習することで、時間の経過とともに結果とランキングが改善されます。
- カスタマイズ: ビジネスニーズに合わせて検索とブラウジングのエクスペリエンスを調整、構成するためのさまざまな方法を提供します。
概要
次の図は、カスタム検索の主要なコンポーネントと、それらの連携の仕組みを示しています。
カスタム検索用の Vertex AI Search のコンポーネントは、次のように説明できます。
- データストア: さまざまなデータソースのコンテンツが Vertex AI Search データストアに保存されます。ソースデータには、公開ウェブサイトのデータや構造化データと非構造化データを使用できます。
- データ処理とインデックス登録: Vertex AI Search はデータを理解してインデックス登録し、検索可能で取得可能な表現を作成します。これには、次の処理が含まれます。
- キーワードの抽出: 正しい情報を取得するために必要な重要な用語を特定して生成します。
- エンベディングを使用したセマンティックな理解: コンテンツの意味を捉えるベクトル エンベディングを作成します。
- メタデータの処理: ドキュメントの構造化データまたはメタデータを使用してドキュメントを処理します。たとえば、ホテルのカタログの場所、ウェブページのメタデータの変更日や作成日などです。
- 高度なドキュメント解析: ドキュメントの構造を理解し、OCR またはレイアウト解析を使用して、表、画像、グラフなどの高度な情報をアノテーションします。
- 検索アプリ: カスタム検索の中心となるのは検索アプリです。このアプリは、さまざまなソースからデータを取得する 1 つ以上のデータストアに接続します。統合検索の場合、データはコネクタを介して取り込まれます。検索とブラウジングの動作はアプリレベルで構成します。
- ユーザー クエリ: アプリから情報を取得するためにユーザーが入力するもので、次の 2 種類があります。
- 検索クエリ: ユーザーはテキストまたは画像を使用して、ターゲットを絞った検索クエリを入力します。テキスト検索は予測入力によって強化されています。
- ナビゲーション クエリまたはブラウジング: 特定のクエリなしで、パーソナライズされた関連性の高いコンテンツを提供するための探索的検索。ユーザーの過去のアクティビティや、現在のカテゴリ ページや位置情報などの他のシグナルに基づいて動作します。
- 取得とランキング: 結果の取得とランキングには、いくつかのサブコンポーネントがあります。
- 検索のクエリ理解: Vertex AI Search は、次のものを使用して検索クエリを分析します。
- 自然言語処理: 意図を理解します。
- 自然言語理解によるフィルタ: 自然言語クエリの位置情報を地理座標に変換し、自然言語クエリの条件をフィルタに変換します。
- ナレッジグラフ: 用語の曖昧さを解消し、検索を拡大します。
- オプション機能: スペル修正、同義語、クエリの言い換えが含まれます。
- 取得: Vertex AI Search は、次の方法に基づいて最も関連性の高いドキュメントまたはチャンクを検索します。
- 検索のキーワード マッチング: 語句に基づく従来の検索。
- セマンティック検索: エンベディングを使用して、概念的に類似したコンテンツを見つけます。
- フィルタリング: 構成したフィルタ(日付、カテゴリ、関連性スコアなど)を適用します。
- ランキング: Vertex AI Search は、次の要素に基づいて結果をランク付けします。
- 関連性: 検索時のキーワードとセマンティック マッチングの組み合わせ。
- ウェブサイト検索のウェブ シグナル: ページの品質や人気度などの要素。
- ブースティングと目立たないようにする: 特定の結果を昇格または降格させるカスタムルール。
- パーソナライズ: ユーザー インタラクションから学習します。これは省略可能ですが、強くおすすめします。
- 並べ替え: 並べ替え手順(日付など)を適用します。
- 検索のクエリ理解: Vertex AI Search は、次のものを使用して検索クエリを分析します。
- 結果と回答の生成:
- 検索結果: 関連性の高いドキュメントまたはチャンクのランク付けされたリストが、スニペット、抽出回答、抽出セグメントなどのオプション機能とともに返されます。サービス提供コントロールを使用すると、提供される結果を構成できます。検索結果を調整することもできます。
- 回答の生成: 上位の関連性の高い検索結果に基づいて、引用を含む簡潔な回答が生成されます。これには高度な LLM 機能が使用されます。
- パーソナライズされたブラウジング: エンゲージメントまたはコンバージョンが発生する可能性が最も高いと予測される、パーソナライズされたドキュメントのセットが返されます。この予測では、ユーザーの操作から学習する高度なモデルが使用されます。
- ユーザー イベント: クリックやビューなどのユーザー インタラクションを追跡するもので、Vertex AI Search が検索とパーソナライズを学習して改善するのに役立ちます。ユーザー イベントは、エンゲージメント、コンバージョン、収益などのビジネス KPI の最適化に役立ちます。
主な機能と構成
カスタム検索アプリでは、次の機能と構成を使用できます。各ステージでこれらの設定をカスタマイズして、ユーザーに最適な結果を提供できます。
使用可能な構成は次のとおりです。
- データ準備:
- 構造化データのスキーマ: フィールド名と型を使用してデータの構造を定義します。独自のスキーマを指定することも、Vertex AI Search に自動検出させることもできます。詳細については、スキーマを指定または自動検出するをご覧ください。
- メタデータ: 構造化ドキュメントまたは非構造化ドキュメントとウェブページにメタデータを追加して、検索を改善し、フィルタリングを有効にします。詳細については、以下をご覧ください。
- チャンキング: 関連性と LLM 処理を向上させるために、ドキュメントを小さなチャンクに分割します。詳細については、ドキュメントを解析してチャンクするをご覧ください。
- 解析: 次のいずれかのオプションを使用して、テキスト、画像、その他のアノテーションを抽出します。
- 機械読み取り可能なテキストを抽出するデジタル パーサー。
- PDF 用の OCR パーサー。スキャンした PDF や画像からテキストを抽出します。
- レイアウト パーサー: ドキュメント構造を検出し、画像やグラフにアノテーションを付けて、チャンク化とドキュメントの理解を向上させます。これは、複雑なドキュメントと RAG アプリケーションに必要です。
- カスタム エンベディング: 準備したベクトル エンベディングをアップロードします。詳細については、カスタム エンベディングを使用するをご覧ください。
- データの取り込み: Vertex AI Search では、さまざまなソースのデータに対して、次のようなさまざまな取り込み方法が用意されています。
- ウェブサイトのデータをクロールする
- Cloud Storage と BigQuery から、または REST API を介して構造化データと非構造化データを取り込む
- 検索とブラウジングの構成:
- フィールド設定: 検索や回答の生成用にフィールドを構成する方法(検索可能、取得可能、インデックス登録可能など)を制御します。詳細については、フィールド設定を構成するをご覧ください。
- 予測入力: ユーザーの入力に応じてクエリの候補を提示します。詳細については、予測入力を構成するをご覧ください。
- サービス提供コントロール: 検索動作を変更するルールを作成します。詳細については、検索のサービス提供コントロールを構成するをご覧ください。
- ブースト/埋め込み: フィルタに基づいて特定の結果の優先度を上げたり下げたりします。
- フィルタ: フィルタに基づいて結果を削除します。
- 類義語: 特定のキーワードを同義語として扱います。
- リダイレクト: 特定のクエリに対してユーザーを特定の URL に誘導します。
- プロモーション コントロール: Vertex AI Search データストア内外で結果をプロモーションします。
- 検索チューニング(プレビュー版): クエリとテキスト抽出のペアに基づいてモデルをさらにトレーニングします。詳細については、検索チューニングで検索結果を改善するをご覧ください。
- ウェブサイト固有の構成:
- 高度なインデックス登録: 詳しくは、ウェブサイトの高度なインデックス登録を有効にするをご覧ください。
- ウェブページを更新する: 自動または手動の更新を使用してウェブサイトのドキュメントを定期的に更新するか、サイトマップ ベースの更新を選択できます。
- 取得: 次の取得方法を構成します。
- ランキング: 取得した結果のブーストまたは埋め込み、ウェブ検索結果の並べ替え、構造化データストアからの結果の並べ替えを行います。
- 検索結果: Vertex AI Search を使用して、次の操作を行います。
- 回答とフォローアップを取得。
- 検索のサマリーを取得する。
- スニペットと抽出コンテンツを取得する。
- ユーザー イベントを必要とするパーソナライズされたブラウジング エクスペリエンスを生成する
- ユーザー イベント: クリックや視聴などのユーザー操作を記録して、検索とパーソナライズを改善します。詳細については、ユーザー イベントについてをご覧ください。
次のステップ
- カスタム検索を使ってみる。
- カスタム検索のチェックリストとウェブサイト検索のチェックリストに沿って、すべての構成で独自のカスタム検索アプリを設定します。