Model Armor 会过滤 LLM 应用的提示和回答。监控信息中心会提供此筛查流程生成的数据、指标和可视化图表。您可以利用这些数据洞见了解 Model Armor 如何保护您的 AI 应用,以及如何识别提示注入尝试和其他恶意活动。
准备工作
所需权限
如需获得访问监控信息中心所需的权限,请让您的管理员为您授予项目的 IAM 角色。 如需详细了解如何授予角色,请参阅管理对项目、文件夹和组织的访问权限。
此预定义角色包含访问监控信息中心所需的权限。如需查看所需的确切权限,请展开所需权限部分:
所需权限
如需访问监控信息中心,您需要具备以下权限:
-
monitoring.monitoredResourceDescriptors.list
-
monitoring.metricDescriptors.list
访问监控信息中心
在 Google Cloud 控制台中,前往 Model Armor 页面。
确认您正在查看的是已启用 Model Armor 的项目。
转到监控标签页。
您可以在此页面执行以下操作:
- 查看所选日期和时间内的互动。
- 根据关联的模板或楼层设置、位置、集成点和输入类型过滤互动。
- 将数据下载到 PNG 或 CSV 文件中。
- 使用趋势图跟踪违规情况随时间的变化。
- 查看整个项目中使用的模板。
检查相关日志,查看所选日期和时间段内的日志。为此,请依次点击 > 检查相关日志。
更多图表选项如需检查相关日志,您必须在模板和楼层设置中启用日志记录,并且必须拥有查看日志的 IAM 权限。
关键指标
监控信息中心内的关键指标包括:
- 扫描的互动总次数:Model Armor 分析的提示和回答总数。
- 标记的互动:违反了 Model Armor 模板或下限设置中至少一项已配置政策的互动次数。
- 被阻止的互动次数:被阻止的互动次数(如果您已在检查和阻止模式下配置 Model Armor)。
- 按类别划分的违规行为:
- 所有检测器:所有检测器均检测到内容违规。
- 敏感数据违规:存在个人身份信息 (PII)、财务数据或您定义的自定义数据类型。
- Responsible AI:违反安全过滤条件的内容,例如仇恨言论、危险内容、骚扰内容或露骨色情内容。
后续步骤
- 了解 Model Armor。
- 了解 Model Armor 模板。
- 了解 Model Armor 下限设置。
- 了解 Model Armor 端点。
- 对提示和响应进行清理。
- 了解 Model Armor 审核日志记录。
- 为 Model Armor 配置日志记录
- 排查 Model Armor 问题。