アプリとデータストアについて

このページでは、Gemini Enterprise アプリとデータストアについて説明します。

Gemini Enterprise では、アプリを作成してそれをデータストアに接続できます。1 つの Google Cloud プロジェクトに複数のアプリを含めることができます。

主な用語:

  • アプリ: Gemini Enterprise のアプリは、エンドユーザーに検索結果、アクション、エージェントを提示します。API では、「アプリ」という用語と「エンジン」という用語が同じ意味で使用される場合があります。

  • データストア: データストアは、ファーストパーティ データソース(Cloud Storage など)、またはサードパーティ アプリケーション(Jira や Salesforce など)から取り込まれたデータを含むエンティティです。サードパーティ アプリケーションのデータを含むデータストアは、「データコネクタ」とも呼ばれます。

アプリとデータストアの関係

データストアのデータを使用して検索結果、回答、アクションを提示するには、アプリがデータストアに接続される必要があります。

アプリはデータストアと多対多の関係にあります。複数のデータストアが 1 つのアプリに接続される場合は、統合検索と呼ばれます。1 つの検索アプリを複数のデータストアに接続する際の制限事項については、統合検索についてをご覧ください。

アプリ作成とデータ取り込みの方法

アプリを作成してデータを取り込む方法は、データの種類によって次のように異なります。

  • サードパーティ データの場合、API ではなく Google Cloud コンソールを使用してアプリを作成し、データを取り込みます。

  • 他のデータについては、 Google Cloud コンソールと API のどちらも使用できます。

ドキュメント

各データストアには、「ドキュメント」と呼ばれるデータレコードが 1 つ以上あります。ドキュメントが何を表すかは、データストア内のデータの種類によって次のように異なります。

  • サードパーティ データソースのデータ。ドキュメントは、サードパーティ データソースに固有のエンティティです(Jira の課題や Confluence のスペースなど)。

  • 構造化データ。ドキュメントは、特定のスキーマに従うテーブルの 1 行または 1 つの JSON レコードです。このスキーマを独自に指定することも、取り込んだデータから Agentspace Enterprise で自動的にスキーマを取得することもできます。

  • 非構造化データ。ドキュメントは、HTML 形式、TXT 形式、またはテキストが埋め込まれた PDF 形式のファイルです。プレビューでは PPTX および DOCX 形式を使用できます。

データストアとアプリ

Gemini Enterprise には、さまざまな種類のデータストアがあります。各データストアには 1 種類のデータのみを含めることができます。

サードパーティ データストア用の構造化データ

次のサードパーティ データソース コネクタを、許可リスト付きのプレビューで利用できます。

  • Confluence
  • Jira
  • Salesforce
  • SharePoint Online
  • Slack

これらのサードパーティからのデータは、構造化データと見なされます。

新しいコネクタを設定するときに、同期の頻度を選択してください。また同期する対象のエンティティも選択します。エンティティは、ソース(Jira の課題、Confluence のコンテンツとスペースなど)によって異なります。エンティティごとに一意のデータストアが 1 つ作成されます。複数のエンティティ データストアがコネクタ インスタンスごとにグループ化されます。

次のステップ

構造化データ

構造化データを含むデータストアでは、構造化データに対するセマンティック検索やレコメンデーションを利用できます。BigQuery または Cloud Storage からデータをインポートできます。また API を使用して構造化 JSON データを手動でアップロードすることもできます。

たとえば、e コマース エクスペリエンスの場合は、商品カタログに基づいた検索やレコメンデーションを有効にできます。また、サービス提供者の場合は、医師名簿に基づいた検索やレコメンデーションを有効にできます。

Gemini Enterprise は、インポートしたデータから自動的にスキーマを検出します。あるいは、必要に応じてデータのスキーマを自分で指定することもできます。データのスキーマを指定すると、通常は結果の品質が向上します。

次のステップ

非構造化データ

非構造化データストアを使用すると、ドキュメントや画像などのデータに対してセマンティック検索やレコメンデーションを実行できます。

非構造化データストアでは、HTML 形式、テキストが埋め込まれた PDF 形式、TXT 形式のドキュメントがサポートされます。プレビューでは PPTX および DOCX 形式を使用できます。

検索の結果として、10 個の URL と、自然言語クエリへの回答の要約が提供されます。ドキュメントは、適切なアクセス権限を持つ Cloud Storage バケットにアップロードされる必要があります。たとえば金融機関は、金融調査出版物を収めた自社の非公開コーパスに対する検索やレコメンデーションを有効にできます。また、バイオテクノロジー企業は、医療研究を収めた自社の非公開リポジトリに対する検索やレコメンデーションを実行できます。

次のステップ

統合検索について

統合検索では、複数のデータストアを 1 つのアプリに接続できます。これにより、アプリで複数のソースと複数の種類のデータにまたがって検索できます。

統合検索アプリを作成するには、新しいアプリを作成するときに複数のデータストアを選択します。作成時に複数のデータストアを選択しない場合、後でデータストアを追加することはできません。

検索結果を取得する際には、すべてのデータストアを検索することも、単一のデータストアの結果に絞り込むこともできます。

統合検索には次の制限事項があります。

  • データストアの追加と削除:
    • アプリでの統合検索を有効にするには、アプリ作成時に少なくとも 2 つのデータストアをアプリに接続する必要があります。
    • 統合検索アプリにデータストアを追加したり、データストアを削除したりできますが、アプリに接続されているデータストアの数を 2 つ未満にすることはできません。
    • 検索アプリの作成時に 1 つのデータストアをアプリに接続した場合、後でデータストアを追加または削除することはできません。
  • BigQuery を使ってインポートされた非構造化データを含むデータストアは、サポートされていません。
  • 統合検索では、検索リクエストで次のフィールドを使用できます。
    • boostSpec
    • contentSearchSpec
    • dataStoreSpecs
    • facetSpecs
    • filter
    • languageCode
    • offset
    • oneBoxPageSize
    • orderBy
    • query
    • pageSize
    • pageToken
    • relevanceScoreSpec
    • relevanceThreshold
    • session
    • sessionSpec
    • spellCorrectionSpec
    • userInfo
    • userPseudoId
  • 統合検索では、dataStoreSpecs で次のフィールドを使用できます。
    • dataStore
    • boostSpec: SearchRequestdataStoreSpecs の両方にブースト仕様が指定されている場合、両方のブースト仕様が検索結果に適用されます。
    • filter: SearchRequestdataStoreSpecs の両方にフィルタが指定されている場合、両方のフィルタが検索結果に適用されます。
  • 統合アプリでは、サービス提供構成に対する作成、読み取り、更新、削除(CRUD)オペレーションがサポートされています。サービス提供構成では、次のフィールドだけを追加または更新できます。
    • boostControlIds
    • displayName
    • filterControlIds
    • genericConfig:
      • contentSearchSpec
    • name
    • solutionType
    • synonymsControlIds
  • 統合検索アプリでは、次のコントロールに対する CRUD オペレーションがサポートされています。
    • boostAction
    • synonymAction
    • filterAction
  • 検索アプリあたりのデータストア数の上限は 50 個です。
  • 1 つのデータストアで CMEK 構成を使用している場合、他のすべてのデータストアでも同じ CMEK 構成を使用する必要があります。