本页面介绍并列出了 Vertex AI Search for custom apps 的功能。该页面还提供指向可用功能、教程和清单的链接,帮助您开始使用 Vertex AI Search for Custom Apps。
什么是 Vertex AI Search for custom apps?
Vertex AI Search for custom apps 是一款强大的 Google 品质搜索和内容发现引擎,您可以将其集成到包含网站数据和其他结构化或非结构化数据的应用中。搜索功能不仅限于基本的关键字匹配,还会使用 AI 来提供高度相关的结果、打造个性化的浏览和搜索体验,并根据您的数据生成 AI 回答。
您可以针对公共网站上或采用结构化/非结构化格式的行业无关数据使用自定义搜索应用。此外,Vertex AI Search 还提供其他特定于垂直领域的搜索和推荐应用。
- 如需了解媒体数据,请参阅媒体搜索和推荐简介。
- 如需了解商务和零售数据,请参阅 Vertex AI Search 商务解决方案。
- 如需了解医疗保健数据,请参阅医疗保健搜索核对清单。
主要功能
Vertex AI Search 的主要功能如下:
- 高质量搜索:利用 Google 的搜索专业知识来理解用户意图,即使是复杂的查询和自然语言查询也能应对。它结合了关键字搜索和语义搜索,可提供最佳结果。
- 个性化浏览:无需使用特定的搜索查询即可提供个性化结果,并根据用户的上下文和导航模式提供个性化 Feed。非常适合用于发现体验,以便查看个性化的类别页面和首页 Feed。
- 数据源:可与以下各种数据源搭配使用:
- 网站:为您的公开网站编制索引,并使用高级功能,例如使用您网站中的结构化数据来丰富索引。
- 结构化数据:搜索以定义格式整理的数据,例如数据库、Cloud Storage 中的 JSON 文件或 BigQuery 表,例如酒店目录、房地产房源信息和餐厅目录。
- 非结构化数据:搜索 Cloud Storage 或 BigQuery 中存储的 PDF、HTML 文件和 TXT 文件等文档,或 JPEG 和 PNG 文件等图片文件。
- 混合搜索:搜索多个数据存储区,这些存储区会混合上述数据源中的数据。例如,您可以创建一个搜索应用,并将其连接到网站数据存储区和文档数据存储区。这样一来,用户就可以同时搜索您的所有内容。
- 以数据为依据的 AI 回答生成:生成以您的数据为依据的 AI 回答,并附上来源文档的引用。您还可以提出后续问题和相关查询。
- 个性化:通过从用户事件(例如点击和转化)中捕获的用户互动中学习,随着时间的推移改进结果和排名。
- 自定义:提供多种方式来调整和配置搜索和浏览体验,以满足您的业务需求。
概览
下图显示了自定义搜索的关键组件以及它们如何协同工作:
Vertex AI Search for Custom Search 的组件可说明如下:
- 数据存储区:来自不同数据源的内容存储在 Vertex AI Search 数据存储区中。源数据可以是公开网站数据,也可以是结构化和非结构化数据。
- 数据处理和索引编制:Vertex AI Search 会理解您的数据并为其编制索引,从而创建可搜索和可检索的表示形式。这包括以下内容:
- 关键字提取:识别并生成检索正确信息所需的重要字词。
- 使用嵌入进行语义理解:创建向量嵌入以捕捉内容含义。
- 元数据处理:使用文档的结构化数据或元数据处理文档。例如,酒店目录中的位置信息、网页元数据中的修改日期或创建日期。
- 高级文档解析:使用 OCR 或布局解析来理解文档结构并注释表格、图片和图表等高级信息。
- 搜索应用:自定义搜索的核心是搜索应用,该应用可连接到一个或多个数据存储区,这些数据存储区可从不同来源提取数据。对于混合搜索,数据通过连接器注入。您可以在应用级配置搜索和浏览行为。
- 用户查询:用户旨在从您的应用中检索信息的输入内容,可分为两种类型:
- 搜索查询:用户使用文字或图片输入有针对性的搜索查询。 文字搜索由自动补全功能提供支持。
- 导航查询或浏览:一种探索性搜索,旨在提供个性化的相关内容,而无需指定具体查询内容。它会根据用户的过往活动和其他信号(例如当前类别页面和位置)提供建议。
- 检索和排名:结果检索和排名有多个子组件:
- 搜索的查询理解:Vertex AI Search 使用以下方式分析搜索查询:
- 自然语言处理:了解意图。
- 采用自然语言理解技术的过滤器:将自然语言查询中的位置信息转换为地理坐标,并将自然语言查询中的条件转换为过滤器。
- 知识图谱:用于消除字词歧义并扩大搜索范围。
- 可选功能:包括拼写更正、同义词和查询改述。
- 检索:Vertex AI Search 会根据以下方法查找相关度最高的文档或块:
- 基于字词的常规搜索:
- 语义搜索:使用嵌入来查找概念上相似的内容。
- 过滤:应用您配置的任何过滤条件,例如日期、类别或相关性得分。
- 排名:Vertex AI Search 会根据以下因素对结果进行排名:
- 相关性:搜索期间关键字匹配和语义匹配的组合。
- 网站搜索的 Web 信号:网页质量和热门程度等因素。
- 提升和掩埋:用于提升或降低某些结果的自定义规则。
- 个性化:从用户互动中学习。此为可选操作,但强烈推荐执行。
- 排序:应用排序指令,例如按日期排序。
- 搜索的查询理解:Vertex AI Search 使用以下方式分析搜索查询:
- 结果和答案生成:
- 搜索结果:系统会返回相关文档或块的排名列表,其中包含可选功能,例如摘要、提取式答案和提取式片段。借助投放控件,您可以配置所投放的结果。您还可以调整搜索结果。
- 生成回答:根据排名靠前且相关的搜索结果生成简明扼要的合成回答,并附上引用。此功能使用高级 LLM 功能。
- 个性化浏览:返回一组个性化文档,这些文档预计最有可能促成互动或转化。此预测使用可根据用户互动情况进行学习的高级模型。
- 用户事件:用于跟踪用户互动(例如点击和浏览)的跟踪器,可帮助 Vertex AI Search 学习并改进搜索和个性化功能。用户事件有助于优化您的业务 KPI,包括互动度、转化次数和收入。
主要功能和配置
以下功能和配置适用于您的自定义搜索应用。在每个阶段,您都可以自定义这些设置,以便为用户提供最佳结果。
具体来说,以下是可用的配置:
- 数据准备:
- 结构化数据的架构:使用字段名称和类型定义数据的结构。您可以自行提供架构,也可以让 Vertex AI Search 自动检测架构。如需了解详情,请参阅提供或自动检测架构。
- 元数据:向结构化或非结构化文档和网页添加元数据,以改进搜索并启用过滤功能。如需了解详情,请参阅以下内容:
- 分块:将文档拆分为更小的块,以提高相关性并改进 LLM 处理。如需了解详情,请参阅解析文档并将其分块。
- 解析:使用以下任一选项提取文本、图片和其他注释:
- 数字解析器,用于提取机器可读的文本。
- PDF 的 OCR 解析器,用于从扫描的 PDF 或图片中提取文本。
- 布局解析器,用于检测文档结构并注释图片和图表,以便更好地进行分块和文档理解,这对于复杂文档和 RAG 应用是必需的。
- 自定义嵌入:上传您自己准备的向量嵌入。 如需了解详情,请参阅使用自定义嵌入。
- 数据注入:Vertex AI Search 提供不同类型的数据注入,用于注入来自不同来源的数据,例如:
- 抓取网站数据
- 从 Cloud Storage 和 BigQuery 中提取结构化和非结构化数据,或通过 REST API 提取数据
- 搜索和浏览配置:
- 字段设置:控制如何配置字段以用于搜索和生成答案,例如可搜索、可检索或可编入索引。如需了解详情,请参阅配置字段设置。
- 自动补全:在用户输入内容时提供查询建议。如需了解详情,请参阅配置自动补全。
- 投放控件:创建规则以修改搜索行为。如需了解详情,请参阅为搜索配置投放控制。
- 提升/掩埋:根据过滤条件提升或降级特定结果。
- 过滤:根据过滤条件移除结果。
- 同义词:将某些字词视为等效字词。
- 重定向:针对特定查询将用户引导至特定网址。
- 提升控制:提升 Vertex AI Search 数据存储区内外的结果。
- 搜索调整(预览版):根据查询和文本提取对进一步训练模型。如需了解详情,请参阅利用搜索调参,提高搜索结果的准确性。
- 网站专用配置:
- 高级索引编制:如需了解详情,请参阅启用高级网站索引编制。
- 刷新网页:您可以使用自动或手动刷新定期刷新网站中的文档,也可以选择基于站点地图的刷新。
- 检索:配置以下检索方法:
- 排名:提升或掩埋检索到的结果、对网页搜索结果进行排序,或对结构化数据存储区中的结果进行排序。
- 搜索结果:使用 Vertex AI Search 可执行以下操作:
- 获取答案和后续跟进。
- 获取搜索摘要。
- 获取摘要和提取式内容。
- 生成需要用户事件的个性化浏览体验
- 用户事件:记录用户互动(例如点击和查看),以改进搜索和个性化功能。如需了解详情,请参阅用户事件简介。