自定义搜索简介

本页面介绍并列出了 Vertex AI Search for custom apps 的功能。该页面还提供指向可用功能、教程和清单的链接,帮助您开始使用 Vertex AI Search for Custom Apps。

什么是 Vertex AI Search for custom apps?

Vertex AI Search for custom apps 是一款强大的 Google 品质搜索和内容发现引擎,您可以将其集成到包含网站数据和其他结构化或非结构化数据的应用中。搜索功能不仅限于基本的关键字匹配,还会使用 AI 来提供高度相关的结果、打造个性化的浏览和搜索体验,并根据您的数据生成 AI 回答。

您可以针对公共网站上或采用结构化/非结构化格式的行业无关数据使用自定义搜索应用。此外,Vertex AI Search 还提供其他特定于垂直领域的搜索和推荐应用。

主要功能

Vertex AI Search 的主要功能如下:

  • 高质量搜索:利用 Google 的搜索专业知识来理解用户意图,即使是复杂的查询和自然语言查询也能应对。它结合了关键字搜索和语义搜索,可提供最佳结果。
  • 个性化浏览:无需使用特定的搜索查询即可提供个性化结果,并根据用户的上下文和导航模式提供个性化 Feed。非常适合用于发现体验,以便查看个性化的类别页面和首页 Feed。
  • 数据源:可与以下各种数据源搭配使用:
    • 网站:为您的公开网站编制索引,并使用高级功能,例如使用您网站中的结构化数据来丰富索引。
    • 结构化数据:搜索以定义格式整理的数据,例如数据库、Cloud Storage 中的 JSON 文件或 BigQuery 表,例如酒店目录、房地产房源信息和餐厅目录。
    • 非结构化数据:搜索 Cloud Storage 或 BigQuery 中存储的 PDF、HTML 文件和 TXT 文件等文档,或 JPEG 和 PNG 文件等图片文件。
    • 混合搜索:搜索多个数据存储区,这些存储区会混合上述数据源中的数据。例如,您可以创建一个搜索应用,并将其连接到网站数据存储区和文档数据存储区。这样一来,用户就可以同时搜索您的所有内容。
  • 以数据为依据的 AI 回答生成:生成以您的数据为依据的 AI 回答,并附上来源文档的引用。您还可以提出后续问题和相关查询。
  • 个性化:通过从用户事件(例如点击和转化)中捕获的用户互动中学习,随着时间的推移改进结果和排名。
  • 自定义:提供多种方式来调整和配置搜索和浏览体验,以满足您的业务需求。

概览

下图显示了自定义搜索的关键组件以及它们如何协同工作:

通用自定义搜索的关键组件
图 1. 自定义搜索的不同组成部分

Vertex AI Search for Custom Search 的组件可说明如下:

  • 数据存储区:来自不同数据源的内容存储在 Vertex AI Search 数据存储区中。源数据可以是公开网站数据,也可以是结构化和非结构化数据。
  • 数据处理和索引编制:Vertex AI Search 会理解您的数据并为其编制索引,从而创建可搜索和可检索的表示形式。这包括以下内容:
    • 关键字提取:识别并生成检索正确信息所需的重要字词。
    • 使用嵌入进行语义理解:创建向量嵌入以捕捉内容含义。
    • 元数据处理:使用文档的结构化数据或元数据处理文档。例如,酒店目录中的位置信息、网页元数据中的修改日期或创建日期。
    • 高级文档解析:使用 OCR 或布局解析来理解文档结构并注释表格、图片和图表等高级信息。
  • 搜索应用:自定义搜索的核心是搜索应用,该应用可连接到一个或多个数据存储区,这些数据存储区可从不同来源提取数据。对于混合搜索,数据通过连接器注入。您可以在应用级配置搜索和浏览行为。
  • 用户查询:用户旨在从您的应用中检索信息的输入内容,可分为两种类型:
    • 搜索查询:用户使用文字或图片输入有针对性的搜索查询。 文字搜索由自动补全功能提供支持。
    • 导航查询或浏览:一种探索性搜索,旨在提供个性化的相关内容,而无需指定具体查询内容。它会根据用户的过往活动和其他信号(例如当前类别页面和位置)提供建议。
  • 检索和排名:结果检索和排名有多个子组件:
    • 搜索的查询理解:Vertex AI Search 使用以下方式分析搜索查询:
      • 自然语言处理:了解意图。
      • 采用自然语言理解技术的过滤器:将自然语言查询中的位置信息转换为地理坐标,并将自然语言查询中的条件转换为过滤器。
      • 知识图谱:用于消除字词歧义并扩大搜索范围。
      • 可选功能:包括拼写更正、同义词和查询改述。
    • 检索:Vertex AI Search 会根据以下方法查找相关度最高的文档或块:
      • 基于字词的常规搜索
      • 语义搜索:使用嵌入来查找概念上相似的内容。
      • 过滤:应用您配置的任何过滤条件,例如日期、类别或相关性得分。
    • 排名:Vertex AI Search 会根据以下因素对结果进行排名:
      • 相关性:搜索期间关键字匹配和语义匹配的组合。
      • 网站搜索的 Web 信号:网页质量和热门程度等因素。
      • 提升和掩埋:用于提升或降低某些结果的自定义规则。
      • 个性化:从用户互动中学习。此为可选操作,但强烈推荐执行。
      • 排序:应用排序指令,例如按日期排序。
  • 结果和答案生成
    • 搜索结果:系统会返回相关文档或块的排名列表,其中包含可选功能,例如摘要、提取式答案和提取式片段。借助投放控件,您可以配置所投放的结果。您还可以调整搜索结果。
    • 生成回答:根据排名靠前且相关的搜索结果生成简明扼要的合成回答,并附上引用。此功能使用高级 LLM 功能。
    • 个性化浏览:返回一组个性化文档,这些文档预计最有可能促成互动或转化。此预测使用可根据用户互动情况进行学习的高级模型。
  • 用户事件:用于跟踪用户互动(例如点击和浏览)的跟踪器,可帮助 Vertex AI Search 学习并改进搜索和个性化功能。用户事件有助于优化您的业务 KPI,包括互动度、转化次数和收入。

主要功能和配置

以下功能和配置适用于您的自定义搜索应用。在每个阶段,您都可以自定义这些设置,以便为用户提供最佳结果。

通用自定义搜索的关键组件
图 2. 自定义搜索中的主要功能和配置

具体来说,以下是可用的配置:

后续步骤