Auf dieser Seite wird beschrieben, wie Sie die Zugriffssteuerung für Datenquellen (auch als ACLs bezeichnet) für Suchanwendungen erzwingen, die Sie mit Cloud Storage oder BigQuery erstellen.
Übersicht
Die Zugriffssteuerung für Ihre Datenquellen in Gemini Enterprise schränkt die Daten ein, die Nutzer in den Ergebnissen Ihrer Such-App sehen können. Google verwendet Ihren Identitätsanbieter, um den Endnutzer zu identifizieren, der eine Suche durchführt, und um festzustellen, ob dieser Zugriff auf die Dokumente hat, die als Ergebnisse zurückgegeben werden.
Angenommen, Mitarbeiter in Ihrem Unternehmen suchen mit Ihrer Such-App in BigQuery-Dokumenten. Sie müssen jedoch dafür sorgen, dass sie über die App keine Inhalte aufrufen können, auf die sie keinen Zugriff haben. Wenn Sie in Google Cloud einen Personalpool für den Identitätsanbieter Ihrer Organisation eingerichtet haben, können Sie diesen Personalpool auch in Gemini Enterprise angeben. Wenn ein Mitarbeiter Ihre App verwendet, erhält er jetzt nur Suchergebnisse für Dokumente, auf die sein Konto in BigQuery bereits Zugriff hat.
Das Aktivieren der Zugriffssteuerung ist ein einmaliger Vorgang. Wenn Sie die Zugriffssteuerung auf eine BigQuery- oder Cloud Storage-Datenquelle anwenden möchten, führen Sie je nach Datentyp (z. B. strukturierte oder unstrukturierte Daten) die folgenden Schritte aus.
- Unstrukturierte Daten aus Cloud Storage
- Strukturierte Daten aus Cloud Storage
- Unstrukturierte Daten aus BigQuery
- Strukturierte Daten aus BigQuery
Unstrukturierte Daten aus Cloud Storage
Wenn Sie einen Datenspeicher für unstrukturierte Daten aus Cloud Storage einrichten, müssen Sie auch ACL-Metadaten hochladen und den Datenspeicher als zugriffsgesteuert festlegen:
Wenn Sie Ihre Daten vorbereiten, fügen Sie mithilfe des Felds
acl_info
ACL-Informationen in Ihre Metadaten ein. Beispiel:{ "id": "<your-id>", "jsonData": "<JSON string>", "content": { "mimeType": "<application/pdf or text/html>", "uri": "gs://<your-gcs-bucket>/directory/filename.pdf" }, "acl_info": { "readers": [ { "principals": [ { "group_id": "group_1" }, { "user_id": "user_1" } ] } ] } }
Weitere Informationen zu unstrukturierten Daten mit Metadaten finden Sie im Abschnitt „Unstrukturierte Daten“ unter Daten für die Aufnahme vorbereiten.
Wenn Sie der Anleitung zum Erstellen eines Datenspeichers unter Datenspeicher für eigene Daten erstellen folgen, können Sie die Zugriffssteuerung aktivieren, indem Sie in der Console oder mit der API Folgendes tun:
- Console: Wählen Sie beim Erstellen eines Datenspeichers die Option Dieser Datenspeicher enthält Informationen zur Zugriffssteuerung aus.
- API: Fügen Sie beim Erstellen des Datenspeichers das Feld
"aclEnabled": "true"
in die JSON-Nutzlast ein.
Wenn Sie die Schritte zum Datenimport unter Datenspeicher für eigene Daten erstellen ausführen, achten Sie darauf, dass Sie Folgendes tun:
- Metadaten mit ACL-Informationen aus demselben Bucket wie Ihre unstrukturierten Daten hochladen
- Wenn Sie die API verwenden, legen Sie
GcsSource.dataSchema
aufdocument
fest.
Strukturierte Daten aus Cloud Storage
Wenn Sie einen Datenspeicher für strukturierte Daten aus Cloud Storage einrichten, müssen Sie auch ACL-Metadaten hochladen und den Datenspeicher als zugriffsgesteuert festlegen:
Wenn Sie Ihre Daten vorbereiten, fügen Sie mithilfe des Felds
acl_info
ACL-Informationen in Ihre Metadaten ein. Beispiel:{ "id": "<your-id>", "jsonData": "<JSON string>", "acl_info": { "readers": [ { "principals": [ { "group_id": "group_1" }, { "user_id": "user_1" } ] } ] } }
Wenn Sie der Anleitung zum Erstellen eines Datenspeichers unter Datenspeicher für eigene Daten erstellen folgen, können Sie die Zugriffssteuerung aktivieren, indem Sie in der Console oder mit der API Folgendes tun:
- Console: Wählen Sie beim Erstellen eines Datenspeichers die Option Dieser Datenspeicher enthält Informationen zur Zugriffssteuerung aus.
- API: Fügen Sie beim Erstellen des Datenspeichers das Feld
"aclEnabled": "true"
in die JSON-Nutzlast ein.
Wenn Sie die Schritte zum Datenimport unter Datenspeicher für selbst erhobene Daten erstellen ausführen, achten Sie auf Folgendes:
- Metadaten mit ACL-Informationen aus demselben Bucket wie Ihre strukturierten Daten hochladen
- Wenn Sie die API verwenden, legen Sie
GcsSource.dataSchema
aufdocument
fest.
Unstrukturierte Daten aus BigQuery
Wenn Sie einen Datenspeicher für unstrukturierte Daten aus BigQuery einrichten, müssen Sie den Datenspeicher als zugriffsgesteuert festlegen und ACL-Metadaten mit einem vordefinierten Schema für Gemini Enterprise bereitstellen:
Geben Sie beim Vorbereiten Ihrer Daten das folgende Schema an. Verwenden Sie kein benutzerdefiniertes Schema.
[ { "name": "id", "mode": "REQUIRED", "type": "STRING", "fields": [] }, { "name": "jsonData", "mode": "NULLABLE", "type": "STRING", "fields": [] }, { "name": "content", "type": "RECORD", "mode": "NULLABLE", "fields": [ { "name": "mimeType", "type": "STRING", "mode": "NULLABLE" }, { "name": "uri", "type": "STRING", "mode": "NULLABLE" } ] }, { "name": "acl_info", "type": "RECORD", "mode": "NULLABLE", "fields": [ { "name": "readers", "type": "RECORD", "mode": "REPEATED", "fields": [ { "name": "principals", "type": "RECORD", "mode": "REPEATED", "fields": [ { "name": "user_id", "type": "STRING", "mode": "NULLABLE" }, { "name": "group_id", "type": "STRING", "mode": "NULLABLE" } ] } ] } ] } ]
Fügen Sie die ACL-Metadaten als Spalte in Ihre BigQuery-Tabelle ein.
Wenn Sie die Schritte unter Erstanbieter-Datenspeicher erstellen ausführen, aktivieren Sie die Zugriffssteuerung entweder in der Console oder über die API:
- Console: Wählen Sie beim Erstellen eines Datenspeichers die Option Dieser Datenspeicher enthält Informationen zur Zugriffssteuerung aus.
- API: Fügen Sie beim Erstellen des Datenspeichers das Feld
"aclEnabled": "true"
in die JSON-Nutzlast ein.
Wenn Sie die Schritte zum Datenimport unter Einen Datenspeicher für eigene Daten erstellen ausführen und die API verwenden, legen Sie
BigQuerySource.dataSchema
aufdocument
fest.
Strukturierte Daten aus BigQuery
Wenn Sie einen Datenspeicher für strukturierte Daten aus BigQuery einrichten, müssen Sie den Datenspeicher als zugriffsgesteuert festlegen und ACL-Metadaten mit einem vordefinierten Schema für Gemini Enterprise angeben:
Geben Sie beim Vorbereiten Ihrer Daten das folgende Schema an. Verwenden Sie kein benutzerdefiniertes Schema.
[ { "name": "id", "mode": "REQUIRED", "type": "STRING", "fields": [] }, { "name": "jsonData", "mode": "NULLABLE", "type": "STRING", "fields": [] }, { "name": "acl_info", "type": "RECORD", "mode": "NULLABLE", "fields": [ { "name": "readers", "type": "RECORD", "mode": "REPEATED", "fields": [ { "name": "principals", "type": "RECORD", "mode": "REPEATED", "fields": [ { "name": "user_id", "type": "STRING", "mode": "NULLABLE" }, { "name": "group_id", "type": "STRING", "mode": "NULLABLE" } ] } ] } ] } ]
Fügen Sie die ACL-Metadaten als Spalte in Ihre BigQuery-Tabelle ein.
Wenn Sie die Schritte unter Erstanbieter-Datenspeicher erstellen ausführen, aktivieren Sie die Zugriffssteuerung entweder in der Console oder über die API:
- Console: Wählen Sie beim Erstellen eines Datenspeichers die Option Dieser Datenspeicher enthält Informationen zur Zugriffssteuerung aus.
- API: Fügen Sie beim Erstellen des Datenspeichers das Feld
"aclEnabled": "true"
in die JSON-Nutzlast ein.
Wenn Sie die Schritte zum Datenimport unter Datenspeicher für eigene Daten erstellen ausführen, achten Sie darauf, dass Sie Folgendes tun:
- Wenn Sie die Console verwenden, wählen Sie beim Angeben der Art der Daten, die Sie hochladen, JSONL für strukturierte Daten mit Metadaten aus.
- Wenn Sie die API verwenden, legen Sie
BigQuerySource.dataSchema
aufdocument
fest.