Model Armor 是一項全代管 Google Cloud 服務,可提升 AI 應用程式的安全性和安全性。Model Armor 會篩選 LLM 提示和回覆,防範各種安全風險。Model Armor 具有下列功能:
- 與模型和雲端無關:Model Armor 的設計宗旨是支援任何雲端平台上的任何模型。包括多雲端和多模型情境,可根據特定需求選擇最合適的 AI 解決方案。
- 集中管理及強制執行:Model Armor 可集中管理及強制執行安全防護和安全政策。
- 公開 REST API:Model Armor 提供公開 REST API,可直接整合提示和回應篩選功能至應用程式。這種做法是以 API 為基礎,因此支援各種部署情境。
- 角色型存取權控管 (RBAC):Model Armor 採用 RBAC 管理服務中的存取權和權限,確保不同使用者角色擁有適當的控制和檢視層級。
- 端點:Model Armor API 提供區域端點 (低延遲) 和多區域端點 (高可用性)。詳情請參閱「Model Armor 端點」。
- 整合 Security Command Center:Model Armor 已整合 Security Command Center,因此您可以在 Security Command Center 資訊主頁中查看偵測結果,並找出來源的違規情形並加以修正。
- 安全防護功能:
- 安全和負責任的 AI 篩選器: Model Armor 提供內容安全篩選器,可處理煽情露骨或危險的內容,或是含有騷擾或仇恨言論的內容。
- 提示詞注入和越獄偵測: Model Armor 內建偵測和防範提示詞注入和越獄攻擊的功能。
- 使用 Sensitive Data Protection 進行資料外洩防護 (DLP): Model Armor 包含 Google Cloud Sensitive Data Protection 服務的完整功能,可提供資料外洩防護功能。Model Armor 可探索、分類及保護機密資料,防止未經授權的 LLM 互動洩漏機密資料。
- 惡意網址偵測: Model Armor 可識別提示和回覆中的惡意網址,提升 AI 應用程式的安全防護機制。
- 文件審查支援:Model Armor 支援審查下列文件類型中的文字,找出惡意內容。
- PDF 檔案
- DOCX、DOCM、DOTX、DOTM 文件
- PPTX、PPTM、POTX、POT 簡報
- XLSX、XLSM、XLTX、XLTM 試算表
優點
Model Armor 可為機構帶來多項好處,包括:
- 提升 AI 安全性:Model Armor 可協助機構降低使用 LLM 的相關安全風險。Model Armor 可解決提示注入和越獄活動、生成有害內容、惡意網址和私密/機密資料遺失等問題,確保大型語言模型能安全可靠地整合至產品和服務。
- 集中管理及控管:Model Armor 可集中管理所有 LLM 應用程式,讓資訊長和安全架構師監控及控管安全防護政策。
- 彈性的部署選項:Model Armor 支援多雲端、多模型和多 LLM 情境,且可部署在 LLM 應用程式架構的不同位置,讓機構能彈性地將 Model Armor 整合至現有基礎架構和工作流程。
- 自訂和整合:Model Armor 可自訂政策,以符合特定應用程式用途,並整合至現有的作業工作流程。
架構
這張架構圖顯示應用程式如何使用 Model Armor 保護 LLM 和使用者。以下步驟說明資料流程。
- 使用者向應用程式提供提示。
- Model Armor 會檢查傳入的提示,確認是否含有潛在的私密/機密內容。
- 提示 (或經過清理的提示) 會傳送至 LLM。
- 大型語言模型會生成回覆。
- Model Armor 會檢查生成的內容,確認是否含有潛在私密/機密內容。
- 系統會將回應 (或經過處理的回應) 傳送給使用者。 Model Armor 會在回覆中詳細說明已觸發和未觸發的篩選器。
簡而言之,Model Armor 就像是篩選器,會檢查輸入內容 (提示) 和輸出內容 (回應),確保 LLM 不會接觸或提供任何惡意或敏感的輸入/輸出內容。
用途
Model Armor 適用於多個產業的各種用途:
安全性
- 企業可降低機密智慧財產 (IP) 和個人識別資訊 (PII) 遭洩漏的風險,避免這些資訊出現在 LLM 提示或回覆中。
- 機構可以防範提示注入和越獄攻擊,避免惡意行為人操縱 AI 系統執行非預期動作。
- 機構可以掃描 PDF 中的文字,確認是否含有敏感或惡意內容。
安全且負責任的 AI 技術
- 機構可以禁止聊天機器人推薦競爭對手的解決方案,維護品牌完整性和顧客忠誠度。
- 機構可以篩選 AI 生成的社群媒體貼文,找出含有危險或仇恨等有害訊息的內容。
語言支援
Model Armor 篩選器支援以多種語言清除提示和回覆。
- Sensitive Data Protection 篩選器支援英文和其他語言,具體取決於您選取的 infoTypes。
- 負責任的 AI 和提示注入和越獄偵測篩選器已通過英文、西班牙文、法文、義大利文、葡萄牙文、德文、中文 (普通話)、日文和韓文測試。這些篩選器可用於其他語言,但結果品質可能有所不同。
啟用多語言偵測功能的方法有兩種:
針對每個要求啟用:如要精細控管,請在清除使用者提示和模型回覆時,針對每個要求啟用多語言偵測功能。詳情請參閱「啟用多語言偵測功能,清除使用者提示」和「啟用多語言偵測功能,清除模型回覆」。
一次性啟用範本:如果偏好較簡單的設定,可以使用 REST API,在 Model Armor 範本層級一次性設定啟用多語言偵測功能。詳情請參閱「建立 Model Armor 範本」。
定價
您可以購買 Model Armor,並將其整合至 Security Command Center,也可以單獨購買這項服務。如要查看定價資訊,請參閱 Security Command Center 定價。
權杖
生成式 AI 模型會將文字和其他資料拆解成較小的單元,稱為「詞元」。 Model Armor 會根據 AI 提示和回覆中的權杖總數計價。Model Armor 會限制每個提示和回覆中處理的權杖數量。Model Armor 的詞元限制會因特定篩選器而異。 如果提示或回覆超過篩選器的權杖限制,偵測準確度會降低,但不會傳回錯誤。
篩選器 | 詞元數量上限 |
---|---|
提示詞注入和越獄偵測 | 最多 2,000 個 |
使用 Sensitive Data Protection 進行資料遺失防護 (DLP) | 最多 130,000 個 |
負責任的 AI 技術 | 10,000 |
兒少性虐待內容 | 10,000 |
注意事項
使用 Model Armor 時,請注意下列事項:
- 樓層設定無法強制執行 Sensitive Data Protection。
- 如果 RTF 檔案大小為 50 位元組以下,Model Armor 會拒絕掃描要求,因為這類檔案很可能無效。
後續步驟
- 瞭解 Model Armor 的重要概念。
- 開始使用 Model Armor。
- 瞭解 Model Armor 範本。
- 瞭解 Model Armor 底限設定。
- 清除提示和回覆中的敏感資訊。
- 瞭解 Model Armor 稽核記錄。
- 排解 Model Armor 問題。