Wenn Sie Daten aus Spanner erfassen möchten, gehen Sie so vor, um einen Datenspeicher zu erstellen und Daten mit der Google Cloud Console oder der API zu erfassen.
Spanner-Zugriff über ein anderes Projekt einrichten
Wenn sich Ihre Spanner-Daten im selben Projekt wie Gemini Enterprise befinden, fahren Sie mit Daten aus Spanner importieren fort.
So gewähren Sie Gemini Enterprise Zugriff auf Spanner-Daten in einem anderen Projekt:
Ersetzen Sie die folgende Variable
PROJECT_NUMBER
durch die Projektnummer Ihres Gemini Enterprise-Projekts und kopieren Sie dann den Inhalt dieses Codeblocks. Dies ist die Kennung Ihres Gemini Enterprise-Dienstkontos:service-PROJECT_NUMBER@gcp-sa-discoveryengine.
Rufen Sie die Seite IAM und Verwaltung auf.
Wechseln Sie auf der Seite IAM und Verwaltung zu Ihrem Spanner-Projekt und klicken Sie auf Zugriff erlauben.
Geben Sie unter Neue Hauptkonten die ID für das Dienstkonto ein und wählen Sie eine der folgenden Optionen aus:
- Wenn Sie den Daten-Boost während des Imports nicht verwenden möchten, wählen Sie die Rolle Cloud Spanner > Cloud Spanner Database Reader aus.
- Wenn Sie Data Boost während des Imports verwenden möchten, wählen Sie die Rolle Cloud Spanner > Cloud Spanner Database Admin oder eine benutzerdefinierte Rolle mit den Berechtigungen von Cloud Spanner Database Reader und spanner.databases.useDataBoost aus. Weitere Informationen zu Data Boost finden Sie in der Data Boost-Übersicht in der Spanner-Dokumentation.
Klicken Sie auf Speichern.
Fahren Sie dann mit Daten aus Spanner importieren fort.
Daten aus Spanner importieren
Console
So verwenden Sie die Console zum Erfassen von Daten aus Spanner:
Rufen Sie in der Google Cloud Console die Seite Gemini Enterprise auf.
Rufen Sie die Seite Datenspeicher auf.
Klicken Sie auf Datenspeicher erstellen.
Wählen Sie auf der Seite Datenquelle auswählen die Option Cloud Spanner aus.
Geben Sie die Projekt‑ID, die Instanz‑ID, die Datenbank‑ID und die Tabellen‑ID der Daten an, die Sie importieren möchten.
Wählen Sie aus, ob Data Boost aktiviert werden soll. Weitere Informationen zu Data Boost finden Sie in der Data Boost-Übersicht in der Spanner-Dokumentation.
Klicken Sie auf Weiter.
Wählen Sie eine Region für Ihren Datenspeicher aus.
Geben Sie einen Namen für den Datenspeicher ein.
Klicken Sie auf Erstellen.
Wenn Sie den Status der Aufnahme prüfen möchten, rufen Sie die Seite Datenspeicher auf und klicken Sie auf den Namen des Datenspeichers, um Details dazu auf der Seite Daten anzeigen zu lassen. Wenn sich die Statusspalte auf dem Tab Aktivität von Wird ausgeführt in Import abgeschlossen ändert, ist die Aufnahme abgeschlossen.
Je nach Größe der Daten kann die Datenaufnahme einige Minuten oder mehrere Stunden dauern.
REST
So erstellen Sie einen Datenspeicher und nehmen Daten aus Spanner über die Befehlszeile auf:
Datenspeicher erstellen.
curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -H "X-Goog-User-Project: PROJECT_ID" \ "https://discoveryengine.googleapis.com/v1alpha/projects/PROJECT_ID/locations/global/collections/default_collection/dataStores?dataStoreId=DATA_STORE_ID" \ -d '{ "displayName": "DISPLAY_NAME", "industryVertical": "GENERIC", "solutionTypes": ["SOLUTION_TYPE_SEARCH"], "contentConfig": "CONTENT_REQUIRED", }'
Ersetzen Sie Folgendes:
PROJECT_ID
: die ID Ihres Gemini Enterprise-Projekts.DATA_STORE_ID
: die ID des Datenspeichers. Die ID darf nur Kleinbuchstaben, Ziffern, Unterstriche und Bindestriche enthalten.DISPLAY_NAME
: Der Anzeigename des Datenspeichers. Dies wird möglicherweise in der Google Cloud Console angezeigt.
Daten aus Spanner importieren
curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATA_STORE_ID/branches/0/documents:import" \ -d '{ "cloudSpannerSource": { "projectId": "SPANNER_PROJECT_ID", "instanceId": "INSTANCE_ID", "databaseId": "DATABASE_ID", "tableId": "TABLE_ID", "enableDataBoost": "DATA_BOOST_BOOLEAN" }, "reconciliationMode": "RECONCILIATION_MODE", "autoGenerateIds": "AUTO_GENERATE_IDS", "idField": "ID_FIELD", }'
Ersetzen Sie Folgendes:
PROJECT_ID
: die ID Ihres Gemini Enterprise-Projekts.DATA_STORE_ID
: die ID des Datenspeichers.SPANNER_PROJECT_ID
: die ID Ihres Spanner-Projekts.INSTANCE_ID
: Die ID Ihrer Spanner-Instanz.DATABASE_ID
: Die ID Ihrer Spanner-Datenbank.TABLE_ID
: die ID Ihrer Spanner-Tabelle.DATA_BOOST_BOOLEAN
: Optional. Ob Data Boost aktiviert werden soll. Informationen zu Data Boost finden Sie in der Spanner-Dokumentation unter Data Boost-Übersicht.RECONCILIATION_MODE
: Optional. Mögliche Werte sindFULL
undINCREMENTAL
. Der Standardwert istINCREMENTAL
. Wenn SieINCREMENTAL
angeben, werden die Daten aus Spanner in Ihrem Datenspeicher inkrementell aktualisiert. Dabei wird ein Upsert-Vorgang ausgeführt, bei dem neue Dokumente hinzugefügt und vorhandene Dokumente durch aktualisierte Dokumente mit derselben ID ersetzt werden. Wenn SieFULL
angeben, werden die Dokumente in Ihrem Datenspeicher vollständig neu indexiert. Mit anderen Worten: Neue und aktualisierte Dokumente werden Ihrem Datenspeicher hinzugefügt und Dokumente, die nicht in Spanner enthalten sind, werden aus Ihrem Datenspeicher entfernt. Der ModusFULL
ist hilfreich, wenn Sie Dokumente, die Sie nicht mehr benötigen, automatisch löschen möchten.AUTO_GENERATE_IDS
: Optional. Gibt an, ob Dokument-IDs automatisch generiert werden sollen. Wenn dieser Wert auftrue
gesetzt ist, werden Dokument-IDs auf Grundlage eines Hash der Nutzlast generiert. Beachten Sie, dass generierte Dokument-IDs bei mehreren Importvorgängen möglicherweise nicht konsistent bleiben. Wenn Sie IDs bei mehreren Importvorgängen automatisch generieren, empfiehlt Google dringend,reconciliationMode
aufFULL
zu setzen, um einheitliche Dokument-IDs beizubehalten.ID_FIELD
: Optional. Gibt an, welche Felder die Dokument-IDs sind.
Nächste Schritte
Wenn Sie Ihren Datenspeicher an eine App anhängen möchten, erstellen Sie eine App und wählen Sie Ihren Datenspeicher aus. Folgen Sie dazu der Anleitung unter Suchanwendung erstellen.
Hier finden Sie eine Vorschau der Suchergebnisse nach der Erstellung der App und des Datenspeichers.