查看監控資訊主頁

Model Armor 會篩選 LLM 應用程式的提示詞和回覆,監控資訊主頁會提供篩選程序產生的資料、指標和視覺化效果。您可以運用這些深入分析結果,瞭解 Model Armor 如何保護 AI 應用程式,以及識別嘗試注入提示詞和其他惡意活動。

事前準備

啟用 Model Armor

所需權限

如要取得存取監控資訊主頁所需的權限,請要求管理員授予您專案的 IAM 角色。如要進一步瞭解如何授予角色,請參閱「管理專案、資料夾和機構的存取權」。

這個預先定義的角色具備存取監控資訊主頁所需的權限。如要查看確切的必要權限,請展開「必要權限」部分:

所需權限

如要存取監控資訊主頁,必須具備下列權限:

  • monitoring.monitoredResourceDescriptors.list
  • monitoring.metricDescriptors.list

您或許還可透過自訂角色或其他預先定義的角色取得這些權限。

存取監控資訊主頁

  1. 前往 Google Cloud 控制台的「Model Armor」頁面。

    前往 Model Armor

  2. 確認您正在查看已啟用 Model Armor 的專案。

  3. 前往「監控」分頁。

您可以在這個頁面執行下列操作:

  • 查看所選日期和時間的互動。
  • 根據相關聯的範本或樓層設定、位置、整合點和輸入類型篩選互動。
  • 將資料下載為 PNG 或 CSV 檔案。
  • 使用趨勢圖表追蹤一段時間內的違規情形。
  • 查看專案中使用的範本。
  • 檢查相關記錄,查看所選日期和時間的記錄。如要這麼做,請依序點選「更多圖表選項」>「檢查相關記錄」

    如要檢查相關記錄,您必須在範本樓層設定中啟用記錄功能,並具備查看記錄的 IAM 權限

重要指標

監控資訊主頁的主要指標包括:

  • 掃描的互動總數:Model Armor 分析的提示詞和回覆總數。
  • 已標記的互動:違反 Model Armor 範本或底限設定中至少一項已設定政策的互動次數。
  • 已封鎖的互動:遭封鎖的互動次數 (如果您已在檢查和封鎖模式中設定 Model Armor)。
  • 依類別分類的違規事項:
    • 所有偵測工具:所有偵測工具都認為內容違規。
    • 違反私密資料規定:含有個人識別資訊 (PII)、財務資料或您定義的自訂資料類型。
    • 負責任的 AI 技術:違反安全篩選器的內容,例如仇恨言論、危險內容、騷擾或煽情露骨內容。

後續步驟