In diesem Dokument wird beschrieben, wie Sie ein BigQuery-Abo erstellen. Sie können die Google Cloud Console, die Google Cloud CLI, die Clientbibliothek oder die Pub/Sub API verwenden, um ein BigQuery-Abo zu erstellen.
Hinweise
Bevor Sie dieses Dokument lesen, sollten Sie sich mit folgenden Themen vertraut machen:
Der Workflow für BigQuery-Abos.
Informationen zum Konfigurieren eines Themas für unzustellbare Nachrichten, um Nachrichtenfehler zu verarbeiten.
Neben Ihrer Erfahrung mit Pub/Sub und BigQuery sollten Sie vor dem Erstellen eines BigQuery-Abos die folgenden Voraussetzungen erfüllen:
Eine BigQuery-Tabelle ist vorhanden. Alternativ können Sie eines erstellen, wenn Sie das BigQuery-Abo erstellen, wie in den späteren Abschnitten dieses Dokuments beschrieben.
Kompatibilität zwischen dem Schema des Pub/Sub-Themas und der BigQuery-Tabelle. Wenn Sie eine nicht kompatible BigQuery-Tabelle hinzufügen, erhalten Sie eine kompatibilitätsbezogene Fehlermeldung. Weitere Informationen finden Sie unter Schemakompatibilität.
Erforderliche Rollen und Berechtigungen
Im Folgenden finden Sie eine Liste mit Richtlinien in Bezug auf Rollen und Berechtigungen:
Zum Erstellen eines Abos müssen Sie die Zugriffssteuerung auf Projektebene konfigurieren.
Sie benötigen auch Berechtigungen auf Ressourcenebene, wenn sich Ihre Abos und Themen in verschiedenen Projekten befinden. Dies wird weiter unten in diesem Abschnitt erläutert.
Zum Erstellen eines BigQuery-Abos muss das Pub/Sub-Dienstkonto die Berechtigung zum Schreiben in die jeweilige BigQuery-Tabelle haben. Weitere Informationen zum Erteilen dieser Berechtigungen finden Sie im nächsten Abschnitt dieses Dokuments.
Sie können ein BigQuery-Abo in einem Projekt so konfigurieren, dass in eine BigQuery-Tabelle in einem anderen Projekt geschrieben wird.
Bitten Sie Ihren Administrator, Ihnen die IAM-Rolle Pub/Sub Editor (roles/pubsub.editor
) für das Projekt zu gewähren, damit Sie die Berechtigungen erhalten, die Sie zum Erstellen von BigQuery-Abos benötigen.
Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff verwalten.
Diese vordefinierte Rolle enthält die Berechtigungen, die zum Erstellen von BigQuery-Abos erforderlich sind. Erweitern Sie den Abschnitt Erforderliche Berechtigungen, um die erforderlichen Berechtigungen anzuzeigen:
Erforderliche Berechtigungen
Die folgenden Berechtigungen sind zum Erstellen von BigQuery-Abos erforderlich:
-
Aus einem Abo abrufen:
pubsub.subscriptions.consume
-
Abo erstellen:
pubsub.subscriptions.create
-
Abo löschen:
pubsub.subscriptions.delete
-
Abo abschließen:
pubsub.subscriptions.get
-
Abo auflisten:
pubsub.subscriptions.list
-
Abo aktualisieren:
pubsub.subscriptions.update
-
Fügen Sie einem Thema ein Abo hinzu:
pubsub.topics.attachSubscription
-
Rufen Sie die IAM-Richtlinie für ein Abo ab:
pubsub.subscriptions.getIamPolicy
-
Konfigurieren Sie die IAM-Richtlinie für ein Abo:
pubsub.subscriptions.setIamPolicy
Möglicherweise können Sie diese Berechtigungen auch mit benutzerdefinierten Rollen oder anderen vordefinierten Rollen erhalten.
Wenn Sie BigQuery-Abos in einem Projekt erstellen müssen, die mit einem Thema in einem anderen Projekt verknüpft sind, bitten Sie Ihren Themenadministrator, Ihnen auch die IAM-Rolle „Pub/Sub-Bearbeiter“ (roles/pubsub.editor)
für das Thema zu gewähren.
Pub/Sub-Dienstkonto BigQuery-Rollen zuweisen
Einige Google Cloud-Dienste haben von Google Cloud verwaltete Dienstkonten, mit denen die Dienste auf Ihre Ressourcen zugreifen können. Diese Dienstkonten werden als Dienst-Agents bezeichnet. Pub/Sub erstellt und verwaltet für jedes Projekt ein Dienstkonto im Format service-project-number@gcp-sa-pubsub.iam.gserviceaccount.com
.
Zum Erstellen eines BigQuery-Abos muss das Pub/Sub-Dienstkonto die Berechtigung zum Schreiben in die jeweilige BigQuery-Tabelle und zum Lesen der Tabellenmetadaten haben.
Weisen Sie dem Pub/Sub-Dienstkonto die Rolle „BigQuery-Datenbearbeiter“ (roles/bigquery.dataEditor
) zu.
Öffnen Sie in der Google Cloud Console die Seite IAM.
Klicken Sie auf Zugriff erlauben.
Geben Sie im Abschnitt Hauptkonten hinzufügen den Namen Ihres Pub/Sub-Dienstkontos ein. Das Format des Dienstkontos ist
service-project-number@gcp-sa-pubsub.iam.gserviceaccount.com
. Bei einem Projekt mitproject-number=112233445566
hat das Dienstkonto beispielsweise das Formatservice-112233445566@gcp-sa-pubsub.iam.gserviceaccount.com
.Klicken Sie im Abschnitt Rollen zuweisen auf Weitere Rolle hinzufügen.
Geben Sie im Drop-down-Menü Rolle auswählen den Wert
BigQuery
ein und wählen Sie die Rolle BigQuery-Datenbearbeiter aus.Klicken Sie auf Speichern.
Weitere Informationen zu BigQuery IAM finden Sie unter BigQuery-Rollen und -Berechtigungen.
BigQuery-Aboattribute
Wenn Sie ein BigQuery-Abo konfigurieren, können Sie die folgenden Attribute angeben.
Allgemeine Eigenschaften
Weitere Informationen zu allgemeinen Abo-Properties, die du für alle Abos festlegen kannst
Schema des Themas verwenden
Mit dieser Option kann Pub/Sub das Schema des Pub/Sub-Themas verwenden, mit dem das Abo verknüpft ist. Außerdem schreibt Pub/Sub die Felder in Nachrichten in die entsprechenden Spalten der BigQuery-Tabelle.
Beachten Sie bei Verwendung dieser Option die folgenden zusätzlichen Anforderungen:
Die Felder im Schema des Themas und im BigQuery-Schema müssen dieselben Namen haben und ihre Typen müssen miteinander kompatibel sein.
Jedes optionale Feld im Schema des Themas muss auch im BigQuery-Schema optional sein.
Pflichtfelder im Schema des Themas müssen im BigQuery-Schema nicht erforderlich sein.
Wenn BigQuery-Felder vorhanden sind, die im Schema des Themas nicht vorhanden sind, müssen diese BigQuery-Felder im Modus
NULLABLE
sein.Wenn das Themenschema zusätzliche Felder enthält, die im BigQuery-Schema nicht vorhanden sind, und diese Felder entfernt werden können, wählen Sie die Option Unbekannte Felder löschen aus.
Sie können nur eine der Aboattribute auswählen: Schema des Themas verwenden oder Tabellenschema verwenden.
Wenn Sie die Option Schema des Themas verwenden oder Tabellenschema verwenden nicht auswählen, muss die BigQuery-Tabelle eine Spalte namens data
vom Typ BYTES
, STRING
oder JSON
enthalten. Pub/Sub schreibt die Nachricht in diese BigQuery-Spalte.
Änderungen am Pub/Sub-Themenschema oder BigQuery-Tabellenschema werden möglicherweise nicht sofort wirksam, wenn Nachrichten in die BigQuery-Tabelle geschrieben werden. Wenn beispielsweise die Option Unbekannte Felder löschen aktiviert ist und ein Feld im Pub/Sub-Schema, aber nicht im BigQuery-Schema vorhanden ist, enthalten Nachrichten, die in die BigQuery-Tabelle geschrieben werden, das Feld möglicherweise trotzdem nicht, nachdem es dem BigQuery-Schema hinzugefügt wurde. Schließlich werden die Schemas synchronisiert und nachfolgende Nachrichten enthalten das Feld.
Wenn Sie die Option Schema des Themas verwenden für Ihr BigQuery-Abo verwenden, können Sie auch die Change Data Capture (CDC) von BigQuery nutzen. CDC aktualisiert Ihre BigQuery-Tabellen, indem es Änderungen verarbeitet und auf vorhandene Zeilen anwendet.
Weitere Informationen zu dieser Funktion finden Sie unter Tabellenaktualisierungen mit Change Data Capture streamen.
Informationen zur Verwendung dieses Features mit BigQuery-Abos finden Sie unter Änderungsdatenerfassung in BigQuery.
Schema der Tabelle verwenden
Mit dieser Option kann Pub/Sub das Schema der BigQuery-Tabelle verwenden, um die Felder einer JSON-Nachricht in die entsprechenden Spalten zu schreiben. Beachten Sie bei Verwendung dieser Option die folgenden zusätzlichen Anforderungen:
Veröffentlichte Nachrichten müssen im JSON-Format vorliegen.
Wenn dem Thema des Abos ein Schema zugeordnet ist, muss das Attribut für die Nachrichtencodierung auf
JSON
festgelegt werden.Wenn BigQuery-Felder in den Nachrichten nicht vorhanden sind, müssen diese BigQuery-Felder im Modus
NULLABLE
sein.Wenn die Nachrichten zusätzliche Felder enthalten, die im BigQuery-Schema nicht vorhanden sind, und diese Felder gelöscht werden können, wählen Sie die Option Unbekannte Felder löschen aus.
In der JSON-Nachricht müssen die Werte für
DATE
,DATETIME
,TIME
undTIMESTAMP
Ganzzahlen sein, die den unterstützten Darstellungen entsprechen.In der JSON-Nachricht müssen
NUMERIC
- undBIGNUMERIC
-Werte mit BigDecimalByteStringEncoder in Byte codiert sein.Sie können nur eine der Aboattribute auswählen: Schema des Themas verwenden oder Tabellenschema verwenden.
Wenn Sie die Option Schema des Themas verwenden oder Tabellenschema verwenden nicht auswählen, muss die BigQuery-Tabelle eine Spalte namens data
vom Typ BYTES
, STRING
oder JSON
enthalten. Pub/Sub schreibt die Nachricht in diese BigQuery-Spalte.
Änderungen am BigQuery-Tabellenschema werden möglicherweise nicht sofort wirksam, wenn Nachrichten in die BigQuery-Tabelle geschrieben werden. Wenn beispielsweise die Option Unbekannte Felder löschen aktiviert ist und ein Feld in den Nachrichten, aber nicht im BigQuery-Schema vorhanden ist, enthalten Nachrichten, die in die BigQuery-Tabelle geschrieben werden, das Feld möglicherweise trotzdem nicht, nachdem es dem BigQuery-Schema hinzugefügt wurde. Schließlich wird das Schema synchronisiert und nachfolgende Nachrichten enthalten das Feld.
Wenn Sie die Option Tabellenschema verwenden für Ihr BigQuery-Abo verwenden, können Sie auch die Change Data Capture (CDC) von BigQuery nutzen. CDC aktualisiert Ihre BigQuery-Tabellen, indem es Änderungen verarbeitet und auf vorhandene Zeilen anwendet.
Weitere Informationen zu dieser Funktion finden Sie unter Tabellenaktualisierungen mit Change Data Capture streamen.
Informationen zur Verwendung dieser Funktion mit BigQuery-Abos finden Sie unter Änderungsdatenerfassung in BigQuery.
Unbekannte Felder löschen
Diese Option wird mit der Option Schema des Themas verwenden oder Tabellenschema verwenden verwendet. Mit dieser Option kann Pub/Sub jedes Feld löschen, das im Schema oder in der Nachricht des Themas, aber nicht im BigQuery-Schema vorhanden ist. Wenn Unbekannte Felder löschen festgelegt ist, werden Nachrichten mit zusätzlichen Feldern nicht in BigQuery geschrieben und verbleiben im Rückstand des Abos. Das Abo hat dann einen Fehlerstatus.
Metadaten schreiben
Mit dieser Option kann Pub/Sub die Metadaten jeder Nachricht in zusätzliche Spalten der BigQuery-Tabelle schreiben. Andernfalls werden die Metadaten nicht in die BigQuery-Tabelle geschrieben.
Wenn Sie die Option Metadaten schreiben auswählen, muss die BigQuery-Tabelle die in der folgenden Tabelle beschriebenen Felder enthalten.
Wenn Sie die Option Metadaten schreiben nicht auswählen, benötigt die BigQuery-Tabelle nur das Feld data
, sofern nicht use_topic_schema
auf „true“ gesetzt ist. Wenn Sie sowohl die Option Metadaten schreiben als auch die Option Schema des Themas verwenden auswählen, darf das Schema des Themas keine Felder mit Namen enthalten, die mit den Namen der Metadatenparameter übereinstimmen.
Diese Einschränkung gilt auch für Camelcase-Versionen dieser Snake-Case-Parameter.
Parameter | |
---|---|
subscription_name |
STRING Name eines Abos. |
message_id |
STRING ID einer Nachricht |
publish_time |
TIMESTAMP Der Zeitpunkt der Veröffentlichung einer Nachricht. |
data |
BYTES, STRING oder JSON Der Nachrichtentext. Das Feld |
attributes |
STRING oder JSON Ein JSON-Objekt, das alle Nachrichtenattribute enthält. Außerdem enthält er zusätzliche Felder, die Teil der Pub/Sub-Nachricht sind, einschließlich des Reihenfolgeschlüssels, falls vorhanden. |
BigQuery-Abo erstellen
Die folgenden Beispiele zeigen, wie Sie ein Abo mit BigQuery-Bereitstellung erstellen.
Console
- Rufen Sie in der Google Cloud Console die Seite Abos auf.
- Klicken Sie auf Abo erstellen.
- Geben Sie im Feld Abo-ID einen Namen ein.
Informationen zum Benennen eines Abos finden Sie unter Richtlinien für die Benennung eines Themas oder Abos.
- Wählen Sie im Drop-down-Menü ein Thema aus oder erstellen Sie ein Thema. Das Abo empfängt Nachrichten von dem Thema.
- Wählen Sie als Zustellungstyp die Option In BigQuery schreiben aus.
- Wählen Sie das Projekt für die BigQuery-Tabelle aus.
- Wählen Sie ein vorhandenes Dataset aus oder erstellen Sie ein neues.
Informationen zum Erstellen eines Datasets finden Sie unter Datasets erstellen.
- Wählen Sie eine vorhandene Tabelle aus oder erstellen Sie eine neue.
Weitere Informationen zum Erstellen einer Tabelle finden Sie unter Tabellen erstellen.
- Es wird dringend empfohlen, unzustellbare Nachrichten zu aktivieren, um Nachrichtenfehler zu beheben.
Weitere Informationen finden Sie unter Thema für unzustellbare Nachrichten.
- Klicken Sie auf Erstellen.
Sie können ein Abo auch über die Seite Themen erstellen. Diese Verknüpfung ist nützlich, um Themen mit Abos zu verknüpfen.
- Rufen Sie in der Google Cloud Console die Seite Themen auf.
- Klicken Sie neben dem Thema, für das Sie ein Abo erstellen möchten, auf more_vert.
- Wählen Sie im Kontextmenü Abo erstellen aus.
- Wählen Sie als Zustellungstyp die Option In BigQuery schreiben aus.
- Wählen Sie das Projekt für die BigQuery-Tabelle aus.
- Wählen Sie ein vorhandenes Dataset aus oder erstellen Sie ein neues.
Informationen zum Erstellen eines Datasets finden Sie unter Datasets erstellen.
- Wählen Sie eine vorhandene Tabelle aus oder erstellen Sie eine neue.
Informationen zum Erstellen eines Datasets finden Sie unter Tabellen erstellen.
- Es wird dringend empfohlen, unzustellbare Nachrichten zu aktivieren, um Nachrichtenfehler zu beheben.
Weitere Informationen finden Sie unter Thema für unzustellbare Nachrichten.
- Klicken Sie auf Erstellen.
gcloud
-
Aktivieren Sie Cloud Shell in der Google Cloud Console.
Unten in der Google Cloud Console wird eine Cloud Shell-Sitzung gestartet und eine Eingabeaufforderung angezeigt. Cloud Shell ist eine Shell-Umgebung, in der das Google Cloud CLI bereits installiert ist und Werte für Ihr aktuelles Projekt bereits festgelegt sind. Das Initialisieren der Sitzung kann einige Sekunden dauern.
-
Verwenden Sie den Befehl
gcloud pubsub subscriptions create
, um ein Pub/Sub-Abo zu erstellen:gcloud pubsub subscriptions create SUBSCRIPTION_ID \ --topic=TOPIC_ID \ --bigquery-table=PROJECT_ID:DATASET_ID.TABLE_ID
Ersetzen Sie Folgendes:
- SUBSCRIPTION_ID: Gibt die ID des Abos an.
- TOPIC_ID: Gibt die ID des Themas an. Für das Thema ist ein Schema erforderlich.
- PROJECT_ID: Gibt die ID des Projekts an.
- DATASET_ID: Gibt die ID eines vorhandenen Datasets an. Informationen zum Erstellen eines Datasets finden Sie unter Datasets erstellen.
- TABLE_ID: Gibt die ID einer vorhandenen Tabelle an. Die Tabelle erfordert ein data-Feld, wenn Ihr Thema kein Schema hat. Informationen zum Erstellen einer Tabelle finden Sie unter Leere Tabelle mit einer Schemadefinition erstellen.
C++
Folgen Sie der Einrichtungsanleitung für C++ in der Pub/Sub-Kurzanleitung zur Verwendung von Clientbibliotheken, bevor Sie dieses Beispiel ausprobieren. Weitere Informationen finden Sie in der Referenzdokumentation zur Pub/Sub C++ API.
Richten Sie Standardanmeldedaten für Anwendungen ein, um sich bei Pub/Sub zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für Clientbibliotheken einrichten.
C#
Folgen Sie der Einrichtungsanleitung für C# in der Pub/Sub-Kurzanleitung zur Verwendung von Clientbibliotheken, bevor Sie dieses Beispiel ausprobieren. Weitere Informationen finden Sie in der Referenzdokumentation zur Pub/Sub C# API.
Richten Sie Standardanmeldedaten für Anwendungen ein, um sich bei Pub/Sub zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für Clientbibliotheken einrichten.
Go
Folgen Sie der Einrichtungsanleitung für Go in der Pub/Sub-Kurzanleitung zur Verwendung von Clientbibliotheken, bevor Sie dieses Beispiel ausprobieren. Weitere Informationen finden Sie in der Referenzdokumentation zur Pub/Sub Go API.
Richten Sie Standardanmeldedaten für Anwendungen ein, um sich bei Pub/Sub zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für Clientbibliotheken einrichten.
Java
Folgen Sie der Einrichtungsanleitung für Java in der Pub/Sub-Kurzanleitung zur Verwendung von Clientbibliotheken, bevor Sie dieses Beispiel ausprobieren. Weitere Informationen finden Sie in der Referenzdokumentation zur Pub/Sub Java API.
Richten Sie Standardanmeldedaten für Anwendungen ein, um sich bei Pub/Sub zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für Clientbibliotheken einrichten.
Node.js
Node.js
PHP
Folgen Sie der Einrichtungsanleitung für PHP in der Pub/Sub-Kurzanleitung zur Verwendung von Clientbibliotheken, bevor Sie dieses Beispiel ausprobieren. Weitere Informationen finden Sie in der Referenzdokumentation zur Pub/Sub PHP API.
Richten Sie Standardanmeldedaten für Anwendungen ein, um sich bei Pub/Sub zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für Clientbibliotheken einrichten.
Python
Folgen Sie der Einrichtungsanleitung für Python in der Pub/Sub-Kurzanleitung zur Verwendung von Clientbibliotheken, bevor Sie dieses Beispiel ausprobieren. Weitere Informationen finden Sie in der Referenzdokumentation zur Pub/Sub Python API.
Richten Sie Standardanmeldedaten für Anwendungen ein, um sich bei Pub/Sub zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für Clientbibliotheken einrichten.
Ruby
Folgen Sie der Einrichtungsanleitung für Ruby in der Pub/Sub-Kurzanleitung zur Verwendung von Clientbibliotheken, bevor Sie dieses Beispiel ausprobieren. Weitere Informationen finden Sie in der Referenzdokumentation zur Pub/Sub Ruby API.
Richten Sie Standardanmeldedaten für Anwendungen ein, um sich bei Pub/Sub zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für Clientbibliotheken einrichten.
Nächste Schritte
- Erstellen oder ändern Sie ein Abo mit
gcloud
-Befehlen. - Abo mit REST APIs erstellen oder ändern
- Probleme mit einem BigQuery-Abo beheben