Responsible AI

Vertex AI Agent Builder 让开发者能够充分利用 Google 基础的强大力量 模型、搜索专业知识和对话式 AI 技术, 通过 Vertex AI Agents 和 Vertex AI Search。作为一项处于早期阶段的技术,其不断发展的功能和用途可能会造成误用、滥用以及意外后果。例如,Vertex AI Agent Builder 可能会生成意料之外的输出,包括令人反感、不顾他人感受或事实上不正确的文本。

鉴于这些风险和复杂性,Vertex AI Agent Builder 采用了 Google 的 AI 原则。不过, 开发者理解和测试自己的模型以安全部署非常重要 和负责任的理念。为了帮助开发者,Vertex AI Agent Builder 具有内置的安全过滤条件,可帮助客户在其使用场景中阻止潜在的有害输出。如需了解详情,请参阅 Vertex AI Search 的安全设置

将 Vertex AI Agent Builder 集成到客户独特的应用场景和语境中时,可能需要考虑其他 Responsible AI 注意事项和模型限制。我们鼓励客户利用公平性、可解释性、隐私权和安全推荐做法

Vertex AI Search 提供安全搜索过滤器,用于过滤露骨网站 搜索结果。含有露骨内容的搜索结果可能包括色情、暴力、 和血腥内容。安全搜索过滤功能不适用于私人内容。

摘要功能(适用于网站搜索和私密内容)会滤除诋毁性、露骨色情、恶意或暴力信息等回答。此外,摘要响应还包含安全属性,包括“有害类别”和可能被视为敏感的主题。

网站搜索

安全搜索可应用于 Vertex AI Search 编入索引的公开内容,例如网站。开启安全搜索功能后 Vertex AI Search 可帮助过滤掉 涵盖图片、视频和内容的所有查询的 Vertex AI Search 结果 。虽然这些过滤器无法做到 100% 准确,但我们会对 和更新过滤功能

在某些情境和用例中,客户可能需要访问各种信息(即使其中包含露骨内容),才能从 Vertex AI Search 中获取全面的数据洞见和结果。客户可以通过将 safe_search 设置为“true”或“false”来使用 API 启用和停用安全过滤条件。

如需为 Vertex AI Search 启用安全搜索,请使用以下 API 致电:

curl -X POST\
 -H "Authorization: Bearer $(gcloud auth application-default print-access-token)"
 -H "Content-Type: application/json"\
"https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATA_STORE_ID/servingConfigs/default_config:search"
     -d '{
      "query": { "input": "FREE_TEXT"},
  "serving_config": "SERVING_CONFIG_ID",
  "safe_search": "true",
}'

如需在 Vertex AI Search 中为“搜索并跟进”启用安全搜索功能,请使用以下 API 调用:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1beta/projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATA_STORE_ID/conversations/CONVERSATION_ID:converse" \
-d '{
  "query": { "input": "FREE_TEXT"},
  "serving_config": "SERVING_CONFIG_ID",
  "safe_search": "true",
}'

safe_search 设置可应用于搜索结果以及 Vertex AI Search 输出,例如摘要(基于搜索 结果)。

系统会根据安全属性列表对 Vertex AI Search 输出(例如摘要)进行评估,即使 safe_search 处于关闭状态,系统也会过滤潜在有害内容。

针对私人内容和网站搜索的摘要

Vertex AI Search 输出(例如摘要)会根据安全属性列表进行评估,该列表会滤除可能有害的内容,例如诋毁性、露骨色情、恶意或暴力信息,即使网站搜索的 safe_search 处于关闭状态也是如此。此外,您还可以在 Vertex AI Search API 响应中使用 safetyAttributes 滤除包含“有害类别”和可能被视为敏感的主题的回答。

后备响应

如果摘要模型对请求的回复是空字符串或通用回答,则表示输入或输出会触发安全过滤条件。在 Vertex AI Search API 响应中,如果检测到潜在的违规情况,SummarySkippedReason 会设为 BLOCKED_DUE_TO_POTENTIAL_POLICY_VIOLATION

如果您认为安全过滤器被错误地触发,请通过 Google Cloud 控制台报告此问题

Vertex AI Agent 的安全设置

Chat 对用户查询和代理使用各种安全过滤机制 回答。过滤内容包括诋毁性、露骨色情、恶意或暴力信息等类别。这可确保聊天对不安全的询问做出适当回复,并且回复通常是安全的。您还可以针对您认为不良的内容指定其他过滤条件,并在 Dialogflow 控制台中定义在应用过滤条件时使用的回退回答。如果您认为安全过滤功能被错误地触发,请通过 Google Cloud 控制台报告此问题。

Responsible AI 最佳实践

在利用 Vertex AI Agents 时,我们建议采用以下 Responsible AI 最佳实践:

  • 确保告知最终用户他们正在与聊天机器人互动

  • 如果适用,请向用户说明是否以及何时记录他们的回答

  • 为用户提供标记有害回答的方法

限制

Vertex AI Agents 以多种方式纳入责任,包括在 用于过滤各种类别的内容,如诋毁性、露骨色情、恶意或 暴力信息。然而,如上所述,这些安全过滤器 100% 准确。随着我们不断评估和更新过滤功能, 我们鼓励客户提供有关模型的反馈,探索 有助于造福社会,避免在安全关键型领域使用 Vertex AI Agent 上下文。

Vertex AI Agents 是为主题提供有用信息的几种工具之一 并且不适合在没有相关规定的情况下用于决策情境 人工监督。当纳入非结构化隐私数据时,在确保安全的前提下 未启用过滤器,我们建议在模型评估和 进行人工验证。

其他资源