Model Armor kann entweder über Mindesteinstellungen oder über Vorlagen direkt in Vertex AI integriert werden. Durch die Integration von Model Armor in Vertex AI können Sie Anfragen, die an Gemini-Modelle gesendet werden, und Antworten von Gemini-Modellen prüfen und Anfragen oder Antworten untersuchen oder blockieren, wenn sie die Schwellenwerte der Mindesteinstellungen verletzen. Model Armor bietet Schutz für Prompts und Antworten in der Gemini API in Vertex AI für die Methode generateContent
.
Sie müssen Cloud Logging aktivieren, um die Ergebnisse der Bereinigung von Prompts und Antworten zu sehen. Die unterstützten Standorte für diese Integration sind us-central1
, us-east4
, us-west1
und europe-west4
. In der Vorabversion fallen für die Verwendung dieser Integration keine Kosten an. Preisinformationen finden Sie unter Model Armor – Preise.
Hinweise
Gewähren Sie dem Model Armor-Nutzer die Berechtigung für das Vertex AI-Dienstkonto.
gcloud projects add-iam-policy-binding PROJECT_ID --member='serviceAccount:service-PROJECT_NUMBER@gcp-sa-aiplatform.iam.gserviceaccount.com' --role='roles/modelarmor.user'
Ersetzen Sie Folgendes:
PROJECT_ID
: Ihre Google Cloud -Projekt-IDPROJECT_NUMBER
: Ihre Google Cloud -Projektnummer.
Mindesteinstellungen konfigurieren
Mit Mindesteinstellungen konfigurieren Sie die Mindestschwellenwerte für die Erkennung für Model Armor-Vorlagen. Mit diesen Einstellungen wird überprüft, ob alle neuen und geänderten Vorlagen den Richtlinienanforderungen für Mindestpreise entsprechen.
Beachten Sie vor dem Konfigurieren der Etagen-Einstellungen Folgendes:
- Die Untergrenze kann auf Organisations-, Ordner- und Projektebene festgelegt werden. Die Benutzeroberfläche ist nur für die Etagenkonfiguration auf Projektebene verfügbar. Wenn Sie die Mindesteinstellungen auf Organisations- oder Ordnerebene festlegen möchten, müssen Sie die API verwenden.
- Die Benutzeroberfläche ist nur auf Projektebene verfügbar und ermöglicht es Ihnen, die Einstellungen auf Organisations- oder Ordner-Ebene zu übernehmen.
Informationen zum Konfigurieren von Mindesteinstellungen finden Sie hier.
Führen Sie den folgenden Befehl aus, um die Mindestumsatz-Einstellungen mit der Vertex AI-Integration zu konfigurieren:
curl -X PATCH \ -H "Content-Type: application/json" \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -d '{"filterConfig" : {}, "integratedServices": "AI_PLATFORM", "aiPlatformFloorSetting":{"inspect_only":true, "enableCloudLogging":true}}' \ "https://modelarmor.googleapis.com/v1/projects/PROJECT_ID/locations/global/floorSetting"
Ersetzen Sie PROJECT_ID
durch die ID des Projekts für die Etagenkonfiguration.
Nachdem Sie die Mindesteinstellungen konfiguriert haben, um die Bereinigung von Vertex AI zu aktivieren, bereinigt Model Armor alle generateContent
API-Aufrufe an die Gemini-Endpunkte des Projekts mit den angegebenen Filtereinstellungen.
Das folgende Codebeispiel zeigt, wie die Methode generateContent
verwendet wird.
curl -X POST -H "Content-Type: application/json" -H "Authorization: Bearer $(gcloud auth print-access-token)" "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/gemini-2.0-flash-001:generateContent" -d '{ "contents": [ { "role": "user", "parts": [ { "text": "" } ] } ] , "generationConfig": { "responseModalities": ["TEXT"] ,"temperature": 0.2 ,"maxOutputTokens": 1024 ,"topP": 0.8 } }'
Ersetzen Sie Folgendes:
PROJECT_ID
: Ihre Google Cloud -Projekt-IDLOCATION
: Der Google Cloud Standort des Gemini-Endpunkts. Informationen zu unterstützten Standorten finden Sie unter Standorte für die Model Armor API.
Das folgende Codebeispiel zeigt die Antwort der Methode generateContent
.
{ "promptFeedback": { "blockReason": "MODEL_ARMOR", "blockReasonMessage": "Blocked by Floor Setting. The prompt violated Responsible AI Safety settings (Harassment, Dangerous), Prompt Injection and Jailbreak filters." }, "usageMetadata": { "trafficType": "ON_DEMAND" }, "modelVersion": "gemini-2.0-flash-001", "createTime": "2025-03-26T13:14:36.961184Z", "responseId": "vP3jZ6DVOqLKnvgPqZL-8Ao" }
Model Armor-Vorlagen konfigurieren
Model Armor kann auch über Model Armor-Vorlagen in Vertex AI eingebunden werden. Mit Vorlagen können Sie konfigurieren, wie Model Armor Prompts und Antworten prüft, und Sicherheitsfilterkonfigurationen definieren.
Sie müssen zuerst Vorlagen erstellen und diese dann mit der generateContent
-Methode von Gemini verwenden. Weitere Informationen zu Vorlagen finden Sie unter Model Armor-Vorlagen erstellen und verwalten.
Nachdem Sie die Model Armor-Vorlage konfiguriert haben, übergeben Sie die Vorlagen-ID als Parameter, wenn Sie die Gemini API mit der Methode generateContent
aufrufen. Vertex AI leitet die Anfrage zur Verarbeitung an Model Armor weiter.
Das folgende Codebeispiel zeigt die Anfrage an die Methode generateContent
.
curl -X POST -H "Content-Type: application/json" -H "Authorization: Bearer $(gcloud auth print-access-token)" "https://{LOCATION}-aiplatform.googleapis.com/v1/projects/{PROJECT_ID}/locations/{LOCATION}/publishers/google/models/gemini-2.0-flash-001:generateContent" -d '{ "contents": [ { "role": "user", "parts": [ { "text": "" } ] } ] , "generationConfig": { "responseModalities": ["TEXT"] ,"temperature": 0.2 ,"maxOutputTokens": 1024 ,"topP": 0.8 }, "model_armor_config": { "prompt_template_name": "projects/PROJECT_ID/locations/LOCATION/templates/TEMPLATE_ID", "response_template_name": "projects/PROJECT_ID/locations/LOCATION/templates/TEMPLATE_ID" } }'
Ersetzen Sie Folgendes:
PROJECT_ID
: die Google Cloud Projekt-ID.LOCATION
: der Google Cloud Standort des Gemini-Endpunkts. Die unterstützten Standorte sindus-central1
,us-east4
,us-west1
undeurope-west4
.TEMPLATE_ID
: Vorlagen-ID für Model Armor.
Das folgende Codebeispiel zeigt die Antwort der Methode generateContent
.
{ "promptFeedback": { "blockReason": "MODEL_ARMOR", "blockReasonMessage": "Blocked by Floor Setting. The prompt violated Responsible AI Safety settings (Harassment, Dangerous), Prompt Injection and Jailbreak filters." }, "usageMetadata": { "trafficType": "ON_DEMAND" }, "modelVersion": "gemini-2.0-flash-001", "createTime": "2025-03-26T13:14:36.961184Z", "responseId": "vP3jZ6DVOqLKnvgPqZL-8Ao" }