Responsible AI

Mit Vertex AI Agent Builder können Entwickler die Vorteile der Foundation Models, der Suchexpertise und der Technologien für konversationelle KI von Google nutzen, um mit Vertex AI-Agenten und Vertex AI Search generative KI-Anwendungen für Unternehmen zu erstellen. Die Technologie ist noch in einem frühen Stadium, Funktionen und Anwendung werden ständig weiterentwickelt – deshalb besteht das Risiko, dass sie falsch eingesetzt oder missbraucht wird und unbeabsichtigte oder unvorhergesehene Folgen hat. Beispielsweise kann Vertex AI Agent Builder zu unerwarteten Ausgaben führen, z. B. zu anstößigen, unempfindlichen oder sachlich falschen Texten.

Angesichts dieser Risiken und Komplexität wurde Vertex AI Agent Builder unter Berücksichtigung der KI-Grundsätze von Google entwickelt. Es ist jedoch wichtig, dass Entwickler ihre Modelle verstehen und testen, um sie sicher und verantwortungsvoll bereitstellen zu können. Zur Unterstützung von Entwicklern verfügt Vertex AI Agent Builder über integrierte Sicherheitsfilter, mit denen Kunden potenziell schädliche Ausgaben innerhalb ihres Anwendungsfalls blockieren können. Weitere Informationen finden Sie unter Sicherheitseinstellungen für Vertex AI Search.

Wenn Vertex AI Agent Builder in den individuellen Anwendungsfall und Kontext eines Kunden eingebunden wird, müssen zusätzliche Überlegungen im Hinblick auf die verantwortungsbewusste Anwendung von KI und Modelleinschränkungen berücksichtigt werden. Wir empfehlen unseren Kunden, empfohlene Vorgehensweisen in Sachen Fairness, Interpretierbarkeit, Datenschutz und Sicherheit zu nutzen.

Vertex AI Search bietet SafeSearch-Filter, mit denen anstößige Suchergebnisse für Websites herausgefiltert werden können. Dazu zählen sexuell explizite Inhalte wie Pornografie, aber auch Gewaltdarstellungen. Der SafeSearch-Filter ist für private Inhalte nicht verfügbar.

Bei der Zusammenfassung (sowohl bei der Websitesuche als auch bei privaten Inhalten) werden Antworten wie abwertende, sexuell explizite, schädliche oder gewaltverherrlichende Informationen herausgefiltert. Außerdem enthält die Antwort zur Zusammenfassung Sicherheitsattribute, darunter „schädliche Kategorien“ und Themen, die als sensibel eingestuft werden können.

Websitesuche

SafeSearch kann auf öffentliche Inhalte angewendet werden, die von Vertex AI Search indexiert werden, z. B. Websites. Wenn SafeSearch aktiviert ist, werden bei allen Suchanfragen nach Bildern, Videos und Websites anstößige Inhalte aus den Vertex AI Search-Ergebnissen eines Kunden herausgefiltert. Diese Filter sind zwar nicht zu 100% treffsicher, wir prüfen und aktualisieren sie aber laufend.

In bestimmten Kontexten und Anwendungsfällen benötigen Kunden möglicherweise Zugriff auf eine breite Palette von Informationen, auch wenn diese anstößige Inhalte enthalten, um umfassende Statistiken und Ergebnisse aus Vertex AI Search zu erhalten. Kunden können Sicherheitsfilter über die API aktivieren und deaktivieren, indem sie safe_search auf „wahr“ oder „falsch“ setzen.

Verwenden Sie den folgenden API-Aufruf, um SafeSearch für die Vertex AI Search zu aktivieren:

curl -X POST\
 -H "Authorization: Bearer $(gcloud auth application-default print-access-token)"
 -H "Content-Type: application/json"\
"https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATA_STORE_ID/servingConfigs/default_config:search"
     -d '{
      "query": { "input": "FREE_TEXT"},
  "serving_config": "SERVING_CONFIG_ID",
  "safe_search": "true",
}'

Verwenden Sie den folgenden API-Aufruf, um SafeSearch für die Suche mit Nachfragen in der Vertex AI Search zu aktivieren:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1beta/projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATA_STORE_ID/conversations/CONVERSATION_ID:converse" \
-d '{
  "query": { "input": "FREE_TEXT"},
  "serving_config": "SERVING_CONFIG_ID",
  "safe_search": "true",
}'

Die Einstellung safe_search gilt für Suchergebnisse und auch für Vertex AI Search-Ausgaben wie Zusammenfassungen, die auf den Suchergebnissen basieren.

Vertex AI Search-Ausgaben wie Zusammenfassungen werden anhand einer Liste von Sicherheitsattributen bewertet, mit denen potenziell schädliche Inhalte auch dann herausgefiltert werden, wenn safe_search deaktiviert ist.

Zusammenfassungen für private Inhalte und Websitesuche

Vertex AI Search-Ausgaben wie Zusammenfassungen werden anhand einer Liste von Sicherheitsattributen bewertet, mit denen potenziell schädliche Inhalte wie abwertende, sexuell explizite, schädliche oder gewaltverherrlichende Informationen herausgefiltert werden, auch wenn safe_search für die Websitesuche deaktiviert ist. Außerdem können Sie mit safetyAttributes in der Vertex AI Search API-Antwort Antworten herausfiltern, die „schädliche Kategorien“ und Themen enthalten, die als sensibel eingestuft werden können.

Fallback-Antworten

Wenn das Summarisierungsmodell auf eine Anfrage mit einem leeren String oder einer generischen Antwort reagiert, löst entweder die Eingabe oder die Ausgabe einen Sicherheitsfilter aus. In der Vertex AI Search API-Antwort wird SummarySkippedReason auf BLOCKED_DUE_TO_POTENTIAL_POLICY_VIOLATION gesetzt, wenn ein potenzieller Richtlinienverstoß erkannt wird.

Wenn Sie der Meinung sind, dass ein Sicherheitsfilter ohne Not ausgelöst wurde, melden Sie das Problem über die Google Cloud Console.

Sicherheitseinstellungen für Vertex AI-Agenten

Beim Chat werden verschiedene Sicherheitsfiltermechanismen sowohl für Nutzeranfragen als auch für Antworten von Kundenservicemitarbeitern verwendet. Der Filter umfasst Kategorien wie abwertende, sexuell anstößige, schädliche oder gewaltverherrlichende Informationen. So wird sichergestellt, dass im Chat auf unsichere Suchanfragen angemessen reagiert wird und dass die Antworten im Allgemeinen sicher sind. Sie können auch zusätzliche Filter für Inhalte angeben, die Sie für unerwünscht halten, und in der Dialogflow Console Fallback-Antworten für den Fall definieren, dass diese Filterung angewendet wird. Wenn Sie der Meinung sind, dass die Auslösung eines Sicherheitsfilters unangemessen war, melden Sie das Problem über die Google Cloud Console.

Best Practices für eine verantwortungsbewusste Anwendung von KI

Für die Nutzung von Vertex AI-Agenten empfehlen wir die folgenden Best Practices für die verantwortungsbewusste Nutzung von KI:

  • Endnutzer müssen darüber informiert werden, dass sie mit einem Bot interagieren

  • Informieren Sie die Nutzer gegebenenfalls darüber, ob und wann ihre Antworten aufgezeichnet werden.

  • Nutzern die Möglichkeit geben, schädliche Antworten zu melden

Beschränkungen

Vertex AI-Agents sind auf verschiedene Weise verantwortungsbewusst, einschließlich Sicherheitsfiltern für Kategorien wie abwertende, sexuell explizite, toxische oder gewaltverherrlichende Informationen. Wie oben erläutert, sind diese Sicherheitsfilter jedoch nicht zu 100% genau. Wir prüfen und aktualisieren unsere Filterfunktionen kontinuierlich. Wir möchten Kunden bitten, Feedback zu den Modellen zu geben, Anwendungsfälle zu untersuchen, die zu einem gesellschaftlichen Nutzen führen, und die Verwendung von Vertex AI-Agenten in sicherheitskritischen Kontexten zu vermeiden.

Vertex AI-Agents ist eines von mehreren Tools, mit denen Fachleute Informationen erhalten können. Es ist nicht für die Entscheidungsfindung ohne menschliche Aufsicht vorgesehen. Wenn Sie unstrukturierte personenbezogene Daten einbinden, für die keine Sicherheitsfilter aktiviert sind, empfehlen wir vor der Verwendung eine stärkere Modellbewertung und manuelle Validierung.

Weitere Informationen