Generative AI und Data Governance

Google war der ersten Anbieter in der Branche, der eine KI-/ML-Datenschutzverpflichtung veröffentlicht hat. Diese legt fest, dass Kunden die höchste Sicherheit und Kontrolle über ihre Daten haben sollten, die in der Cloud gespeichert werden. Diese Zusicherung gilt für Generative AI-Produkte von Google Cloud. Google stellt sicher, dass seine Teams diese Verpflichtungen durch robuste Data Governance-Praktiken einhalten. Dazu gehören auch Prüfungen der Daten, die Google Cloud bei der Entwicklung seiner Produkte verwendet. Weitere Informationen dazu, wie Google Daten verarbeitet, finden Sie auch im Zusatz zur Verarbeitung von Cloud-Daten von Google (CDPA).

Definitionen

Begriff Beschreibung
Foundation Models Umfangreiche Modelle für maschinelles Lernen (ML) werden mit einer großen Datenmenge trainiert und können für eine Vielzahl von Aufgaben verwendet werden.
Adaptermodelle Auch als Adapterebenen oder Adaptergewichtungen bezeichnet. Sie sind ML-Modelle, die in Verbindung mit einem Foundation Model die Leistung spezieller Aufgaben verbessern.
Kundendaten Eine Definition finden Sie in den Nutzungsbedingungen der Google Cloud Platform.
Training Verwendung von Daten zum Trainieren eines ML-Modells
Vorhersage Auch als Inferenz bezeichnet. Bei dieser Methode werden Eingaben mit ML-Modellen verarbeitet, um Ausgaben zu generieren.
Sicherheitsklassifikatoren Dient zur Identifizierung bestimmter Inhaltstypen, z. B. potenziell gewalttätiges Material während der Vorhersage.

Foundation Model-Training

Standardmäßig verwendet Google Cloud keine Kundendaten zum Trainieren seiner Foundation Models. Kunden können die Foundation Models von Google Cloud verwenden, denn sie wissen, dass ihre Prompts, Antworten und die Trainingsdaten des Adaptermodells nicht für das Training von Foundation Models verwendet werden.

Adaptermodell trainieren

Vertex AI bietet einen Dienst, mit dem Kunden Adaptermodelle trainieren können. Trainingsdaten des Adaptermodells sind Kundendaten und werden nicht gespeichert. Außerdem werden Kundendaten nicht zur Verbesserung der Foundation Models von Google Cloud verwendet. Das Adaptermodell ist nur für den Kunden verfügbar, der das Adaptermodell trainiert hat. Google beansprucht keine Eigentumsrechte an den Adaptermodellen, es sei denn, die Adaptermodelle nutzen bereits vorhandenes geistiges Eigentum von Google. Kundendaten werden standardmäßig verschlüsselt gespeichert und bei der Übertragung verschlüsselt. Der Kunde kann auch die Verschlüsselung seiner Adaptermodelle mithilfe von vom Kunden verwalteten Verschlüsselungsschlüsseln (Customer-Managed Encryption Keys, CMEK) steuern und die Adaptermodelle jederzeit löschen.

Vorhersage

Ein- und Ausgaben, die von Foundation Models, Adaptermodellen und Sicherheitsklassifikatoren während der Vorhersage verarbeitet werden, sind Kundendaten. Kundendaten werden von Google niemals ohne ausdrückliche Genehmigung des Kunden protokolliert, indem er ihm erlaubt, Ein- und Ausgaben im Cache zu speichern.

Während der Vorhersage protokollieren wir keine Kundendaten, um die Ausgabe- oder Trainings-Foundation Models eines Kunden zu generieren. Standardmäßig speichert Google die Ein- und Ausgaben eines Kunden für Gemini-Modelle im Cache, um Antworten auf nachfolgende Prompts des Kunden zu beschleunigen. Im Cache gespeicherte Inhalte werden bis zu 24 Stunden gespeichert. Für im Cache gespeicherte Daten wird der Datenschutz auf Projektebene erzwungen. Informationen dazu, wie Sie die API verwenden, um den Caching-Status abzurufen, das Caching zu deaktivieren oder das Caching für ein Google Cloud-Projekt wieder zu aktivieren, finden Sie unter Wie aktiviere oder deaktiviere ich das Caching? Wenn Sie das Caching deaktivieren, kann es zu einer höheren Latenz kommen.

Vom Trusted Tester-Programm abmelden

Wenn Sie Google ausdrücklich erlaubt haben, Ihre Daten im Rahmen der Nutzungsbedingungen des Trusted Tester-Programms zur Verbesserung Ihrer KI-/ML-Dienste zu verwenden, können Sie das Formular Trusted Tester-Programm – Deaktivierungsanfrage zum Deaktivieren verwenden.

Wie geht es weiter?