Model Armor 會篩選 LLM 應用程式的提示詞和回覆,監控資訊主頁會提供篩選程序產生的資料、指標和視覺化效果。您可以運用這些深入分析結果,瞭解 Model Armor 如何保護 AI 應用程式,以及識別嘗試注入提示詞和其他惡意活動。
事前準備
所需權限
如要取得存取監控資訊主頁所需的權限,請要求管理員授予您專案的 IAM 角色。如要進一步瞭解如何授予角色,請參閱「管理專案、資料夾和機構的存取權」。
這個預先定義的角色具備存取監控資訊主頁所需的權限。如要查看確切的必要權限,請展開「必要權限」部分:
所需權限
如要存取監控資訊主頁,必須具備下列權限:
-
monitoring.monitoredResourceDescriptors.list
-
monitoring.metricDescriptors.list
存取監控資訊主頁
前往 Google Cloud 控制台的「Model Armor」頁面。
確認您正在查看已啟用 Model Armor 的專案。
前往「監控」分頁。
您可以在這個頁面執行下列操作:
- 查看所選日期和時間的互動。
- 根據相關聯的範本或樓層設定、位置、整合點和輸入類型篩選互動。
- 將資料下載為 PNG 或 CSV 檔案。
- 使用趨勢圖表追蹤一段時間內的違規情形。
- 查看專案中使用的範本。
檢查相關記錄,查看所選日期和時間的記錄。如要這麼做,請依序點選「更多圖表選項」>「檢查相關記錄」。
如要檢查相關記錄,您必須在範本和樓層設定中啟用記錄功能,並具備查看記錄的 IAM 權限。
重要指標
監控資訊主頁的主要指標包括:
- 掃描的互動總數:Model Armor 分析的提示詞和回覆總數。
- 已標記的互動:違反 Model Armor 範本或底限設定中至少一項已設定政策的互動次數。
- 已封鎖的互動:遭封鎖的互動次數 (如果您已在檢查和封鎖模式中設定 Model Armor)。
- 依類別分類的違規事項:
- 所有偵測工具:所有偵測工具都認為內容違規。
- 違反私密資料規定:含有個人識別資訊 (PII)、財務資料或您定義的自訂資料類型。
- 負責任的 AI 技術:違反安全篩選器的內容,例如仇恨言論、危險內容、騷擾或煽情露骨內容。
後續步驟
- 瞭解 Model Armor。
- 瞭解 Model Armor 範本。
- 瞭解 Model Armor 底限設定。
- 瞭解 Model Armor 端點。
- 清理提示詞和回覆。
- 瞭解 Model Armor 稽核記錄。
- 設定 Model Armor 的記錄功能
- 排解 Model Armor 問題。