Model Armor 總覽

Model Armor 是一項全代管 Google Cloud 服務,可提升 AI 應用程式的安全性和安全性。Model Armor 會篩選 LLM 提示和回覆,防範各種安全風險。Model Armor 具有下列功能:

  • 與模型和雲端無關:Model Armor 的設計宗旨是支援任何雲端平台上的任何模型。包括多雲端和多模型情境,可根據特定需求選擇最合適的 AI 解決方案。
  • 集中管理及強制執行:Model Armor 可集中管理及強制執行安全防護和安全政策。
  • 公開 REST API:Model Armor 提供公開 REST API,可直接整合提示和回應篩選功能至應用程式。這種做法是以 API 為基礎,因此支援各種部署情境。
  • 角色型存取權控管 (RBAC):Model Armor 採用 RBAC 管理服務中的存取權和權限,確保不同使用者角色擁有適當的控制和檢視層級。
  • 端點:Model Armor API 提供區域端點 (低延遲) 和多區域端點 (高可用性)。詳情請參閱「Model Armor 端點」。
  • 整合 Security Command Center:Model Armor 已整合 Security Command Center,因此您可以在 Security Command Center 資訊主頁中查看偵測結果,並找出來源的違規情形並加以修正。
  • 安全防護功能
  • 文件審查支援:Model Armor 支援審查下列文件類型中的文字,找出惡意內容。
    • PDF 檔案
    • DOCX、DOCM、DOTX、DOTM 文件
    • PPTX、PPTM、POTX、POT 簡報
    • XLSX、XLSM、XLTX、XLTM 試算表

優點

Model Armor 可為機構帶來多項好處,包括:

  • 提升 AI 安全性:Model Armor 可協助機構降低使用 LLM 的相關安全風險。Model Armor 可解決提示注入和越獄活動、生成有害內容、惡意網址和私密/機密資料遺失等問題,確保大型語言模型能安全可靠地整合至產品和服務。
  • 集中管理及控管:Model Armor 可集中管理所有 LLM 應用程式,讓資訊長和安全架構師監控及控管安全防護政策。
  • 彈性的部署選項:Model Armor 支援多雲端、多模型和多 LLM 情境,且可部署在 LLM 應用程式架構的不同位置,讓機構能彈性地將 Model Armor 整合至現有基礎架構和工作流程。
  • 自訂和整合:Model Armor 可自訂政策,以符合特定應用程式用途,並整合至現有的作業工作流程。

架構

Model Armor 架構

這張架構圖顯示應用程式如何使用 Model Armor 保護 LLM 和使用者。以下步驟說明資料流程。

  1. 使用者向應用程式提供提示。
  2. Model Armor 會檢查傳入的提示,確認是否含有潛在的私密/機密內容。
  3. 提示 (或經過清理的提示) 會傳送至 LLM。
  4. 大型語言模型會生成回覆。
  5. Model Armor 會檢查生成的內容,確認是否含有潛在私密/機密內容。
  6. 系統會將回應 (或經過處理的回應) 傳送給使用者。 Model Armor 會在回覆中詳細說明已觸發和未觸發的篩選器。

簡而言之,Model Armor 就像是篩選器,會檢查輸入內容 (提示) 和輸出內容 (回應),確保 LLM 不會接觸或提供任何惡意或敏感的輸入/輸出內容。

用途

Model Armor 適用於多個產業的各種用途:

  • 安全性

    • 企業可降低機密智慧財產 (IP) 和個人識別資訊 (PII) 遭洩漏的風險,避免這些資訊出現在 LLM 提示或回覆中。
    • 機構可以防範提示注入和越獄攻擊,避免惡意行為人操縱 AI 系統執行非預期動作。
    • 機構可以掃描 PDF 中的文字,確認是否含有敏感或惡意內容。
  • 安全且負責任的 AI 技術

    • 機構可以禁止聊天機器人推薦競爭對手的解決方案,維護品牌完整性和顧客忠誠度。
    • 機構可以篩選 AI 生成的社群媒體貼文,找出含有危險或仇恨等有害訊息的內容。

語言支援

Model Armor 篩選器支援以多種語言清除提示和回覆。

啟用多語言偵測功能的方法有兩種:

定價

您可以購買 Model Armor,並將其整合至 Security Command Center,也可以單獨購買這項服務。如要查看定價資訊,請參閱 Security Command Center 定價

權杖

生成式 AI 模型會將文字和其他資料拆解成較小的單元,稱為「詞元」。 Model Armor 會根據 AI 提示和回覆中的權杖總數計價。Model Armor 會限制每個提示和回覆中處理的權杖數量。Model Armor 的詞元限制會因特定篩選器而異。 如果提示或回覆超過篩選器的權杖限制,偵測準確度會降低,但不會傳回錯誤。

篩選器 詞元數量上限
提示詞注入和越獄偵測 最多 2,000 個
使用 Sensitive Data Protection 進行資料遺失防護 (DLP) 最多 130,000 個
負責任的 AI 技術 10,000
兒少性虐待內容 10,000

注意事項

使用 Model Armor 時,請注意下列事項:

  • 樓層設定無法強制執行 Sensitive Data Protection。
  • 如果 RTF 檔案大小為 50 位元組以下,Model Armor 會拒絕掃描要求,因為這類檔案很可能無效。

後續步驟