Model Armor ist ein vollständig verwalteter Google Cloud Dienst, der die Sicherheit von KI-Anwendungen durch Prüfung von LLM-Prompts und ‑Antworten auf verschiedene Sicherheitsrisiken erhöht. Model Armor bietet eine Reihe von Funktionen, darunter:
- Modell- und cloudunabhängig: Model Armor unterstützt jedes Modell auf jeder Cloud-Plattform. Dazu gehören Multi-Cloud- und Multi-Modell-Szenarien, mit denen Sie die besten KI-Lösungen für Ihre spezifischen Anforderungen auswählen können.
- Zentrale Verwaltung und Durchsetzung: Model Armor ermöglicht die zentrale Verwaltung und Durchsetzung von Sicherheits- und Sicherheitsrichtlinien.
- Öffentliche REST APIs: Model Armor bietet eine öffentliche REST API, mit der Sie das Prompt- und Antwort-Screening direkt in Ihre Anwendungen einbinden können. Dieser API-basierte Ansatz unterstützt verschiedene Bereitstellungsszenarien.
- Rollenbasierte Zugriffssteuerung (RBAC): Model Armor verwendet die rollenbasierte Zugriffssteuerung (RBAC), um den Zugriff und die Berechtigungen innerhalb des Dienstes zu verwalten, sodass verschiedene Nutzerrollen über angemessene Kontroll- und Sichtbarkeitsebenen verfügen.
- Regionale Endpunkte: Die API von Model Armor wird über regionale Endpunkte bereitgestellt, was für eine geringe Latenz sorgt.
- Mehrere Regionen: Model Armor ist in verschiedenen Regionen in den USA und Europa verfügbar.
- Einbindung in Security Command Center: Model Armor ist in Security Command Center eingebunden. Sie können die Ergebnisse im Security Command Center-Dashboard aufrufen, Verstöße erkennen und sie an der Quelle beheben.
- Sicherheitsfunktionen:
- Sicherheits- und Responsible-AI-Filter: Mit Model Armor können Sie Filter für die Sicherheit von Inhalten verwenden, um Probleme wie sexuell explizite, gefährliche, belästigende und hasserfüllte Inhalte zu vermeiden.
- Erkennung von Prompt Injection und Jailbreaking: Model Armor bietet Funktionen zum Erkennen und Verhindern von Prompt Injection- und Jailbreaking-Angriffen.
- Schutz vor Datenverlust (DLP) mit Sensitive Data Protection: Model Armor umfasst alle Funktionen des Sensitive Data Protection-Dienstes von Google Cloud, um Schutz vor Datenverlust zu bieten. Sie kann vertrauliche Daten (z.B. geistiges Eigentum wie Quellcode oder personenidentifizierbare Informationen wie Kreditkartennummern) erkennen, klassifizieren und schützen, um eine unbefugte Offenlegung bei LLM-Interaktionen zu verhindern.
- Erkennung schädlicher URLs: Mit Model Armor können schädliche URLs sowohl in Prompts als auch in Antworten erkannt werden, wodurch die Sicherheit von KI-Anwendungen verbessert wird.
- Unterstützung für das Prüfen von PDFs: Model Armor unterstützt das Prüfen von Text in PDFs auf schädliche Inhalte.
Vorteile
Model Armor bietet Organisationen mehrere Vorteile, darunter:
- Erhöhte KI-Sicherheit: Model Armor hilft Unternehmen, die Sicherheitsrisiken zu minimieren, die mit der Verwendung von LLMs verbunden sind. Sie befasst sich mit Problemen wie Prompt Injection und Jailbreaking-Versuchen, der Generierung schädlicher Inhalte, schädlichen URLs und dem Verlust sensibler Daten. So können LLMs sicher und zuverlässig in Produkte und Dienste eingebunden werden.
- Zentrale Sichtbarkeit und Kontrolle: Model Armor bietet eine zentrale Verwaltung für alle LLM-Anwendungen, sodass CISOs und Sicherheitsarchitekten Sicherheitsrichtlinien überwachen und steuern können.
- Flexible Bereitstellungsoptionen: Model Armor unterstützt Multi-Cloud-, Multi-Modell- und Multi-LLM-Szenarien und kann an verschiedenen Stellen in der LLM-Anwendungsarchitektur bereitgestellt werden. So können Organisationen es flexibel in ihre bestehende Infrastruktur und Workflows einbinden.
- Anpassung und Integration: Mit Model Armor können Richtlinien an spezifische Anwendungsfälle angepasst und in bestehende betriebliche Workflows eingebunden werden. So werden sowohl die Anforderungen von CTOs/Entwicklern als auch von CISOs/Sicherheitsarchitekten erfüllt.
Architektur
Dieses Architekturdiagramm zeigt eine Anwendung, die Model Armor zum Schutz eines LLM und eines Nutzers verwendet. In den folgenden Schritten wird der Datenfluss erläutert.
- Ein Nutzer gibt der Anwendung einen Prompt.
- Model Armor prüft den eingehenden Prompt auf potenziell sensible Inhalte.
- Der Prompt (oder der gefilterte Prompt) wird an das LLM gesendet.
- Das LLM generiert eine Antwort.
- Model Armor prüft die generierte Antwort auf potenziell sensible Inhalte.
- Die Antwort (oder die gefilterte Antwort) wird an den Nutzer gesendet. Model Armor sendet in der Antwort eine detaillierte Beschreibung der ausgelösten und nicht ausgelösten Filter.
Kurz gesagt: Model Armor fungiert als Filter, der sowohl die Eingabe (Prompt) als auch die Ausgabe (Antwort) prüft, um sicherzustellen, dass das LLM nicht manipuliert wird und keine schädlichen oder sensiblen Eingaben oder Ausgaben liefert.
Anwendungsfälle
Hier einige Beispiele für Anwendungsfälle von Model Armor in verschiedenen Branchen:
Sicherheit
- Organisationen können das Risiko verringern, dass vertrauliches geistiges Eigentum und personenidentifizierbare Informationen in LLM-Prompts oder ‑Antworten enthalten sind.
- Unternehmen können sich vor Prompt Injection- und Jailbreaking-Angriffen schützen und so verhindern, dass böswillige Akteure KI-Systeme manipulieren, um unbeabsichtigte Aktionen auszuführen.
- Organisationen können Text in PDFs auf sensible oder schädliche Inhalte prüfen.
Sicherheit und verantwortungsbewusste KI
- Unternehmen können verhindern, dass ihr Chatbot Lösungen von Mitbewerbern empfiehlt, und so die Markenintegrität und Kundenbindung aufrechterhalten.
- Organisationen können Beiträge in sozialen Medien filtern, die von ihrer KI generiert wurden und schädliche Botschaften wie gefährliche oder hasserfüllte Inhalte enthalten.
Regionale Endpunkte
Model Armor ist ein regionales Produkt und die API wird über regionale Endpunkte bereitgestellt. Die folgenden regionalen Endpunkte werden unterstützt:
USA
Iowa (
us-central1
-Region):modelarmor.us-central1.rep.googleapis.com
Northern Virginia (
us-east4
-Region):modelarmor.us-east4.rep.googleapis.com
Oregon (
us-west1
-Region):modelarmor.us-west1.rep.googleapis.com
Europa
- Niederlande (
europe-west4
-Region):modelarmor.europe-west4.rep.googleapis.com
- Niederlande (
Preise
Model Armor kann als Teil von Security Command Center oder als eigenständiger Dienst erworben werden. Unter Security Command Center-Preise finden Sie die Preise für das Security Command Center und die eigenständigen Optionen.
Hinweise
Beachten Sie bei der Verwendung von Model Armor Folgendes:
- Der Filter für die Erkennung von Prompt Injection und Jailbreaking unterstützt bis zu 512 Token. Die übrigen Filter unterstützen bis zu 2.000 Token.
- Mit den Einstellungen für Stockwerke kann der Schutz sensibler Daten nicht erzwungen werden.
- Model Armor unterstützt Text- und PDF-Formate. In PDFs wird nur der Textinhalt gescannt.
Nächste Schritte
- Weitere Informationen zu den wichtigsten Konzepten von Model Armor
- Erste Schritte mit Model Armor
- Weitere Informationen zu Model Armor-Vorlagen
- Weitere Informationen zu den Einstellungen für Model Armor-Etagen
- Prompts und Antworten bereinigen
- Weitere Informationen zum Audit-Logging für Model Armor
- Probleme mit Model Armor beheben