Diese Seite wurde von der Cloud Translation API übersetzt.

Föderierte Cloud SQL-Abfragen

Als Datenanalyst können Sie Daten in Cloud SQL mithilfe von föderierten Abfragen über BigQuery abfragen.

Mit der Föderation von BigQuery und Cloud SQL kann BigQuery Daten in Cloud SQL in Echtzeit abfragen, ohne Daten kopieren oder verschieben zu müssen. Föderierte Abfragen unterstützen sowohl MySQL- (2. Generation) als auch PostgreSQL-Instanzen in Cloud SQL.

Zum Replizieren von Daten nach BigQuery können Sie auch Cloud Data Fusion oder Datastream verwenden. Weitere Informationen zur Verwendung von Cloud Data Fusion finden Sie unter Daten von MySQL in BigQuery replizieren.

Hinweis

Achten Sie darauf, dass Ihr BigQuery-Administrator eine Cloud SQL-Verbindung erstellt und für Sie freigegeben hat.
Bitten Sie Ihren Administrator, Ihnen die IAM-Rolle BigQuery-Verbindungsnutzer (roles/bigquery.connectionUser) für Ihr Projekt zuzuweisen, um die Berechtigungen zu erhalten, die Sie zum Abfragen einer Cloud SQL-Instanz benötigen. Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.

Sie können die erforderlichen Berechtigungen auch über benutzerdefinierte Rollen oder andere vordefinierte Rollen erhalten.

Daten abfragen

Verwenden Sie die Funktion EXTERNAL_QUERY, um eine föderierte Abfrage aus einer GoogleSQL-Abfrage an Cloud SQL zu senden.

Angenommen Sie speichern eine Kundentabelle in BigQuery und eine Verkaufstabelle in Cloud SQL und möchten die beiden Tabellen in einer einzigen Abfrage verknüpfen. Im folgenden Beispiel wird eine föderierte Abfrage an eine Cloud SQL-Tabelle namens orders gesendet und die Ergebnisse werden mit einer BigQuery-Tabelle namens mydataset.customers verknüpft.

SELECT c.customer_id, c.name, rq.first_order_date
FROM mydataset.customers AS c
LEFT OUTER JOIN EXTERNAL_QUERY(
  'us.connection_id',
  '''SELECT customer_id, MIN(order_date) AS first_order_date
  FROM orders
  GROUP BY customer_id''') AS rq ON rq.customer_id = c.customer_id
GROUP BY c.customer_id, c.name, rq.first_order_date;

Die Beispielabfrage besteht aus 3 Teilen:

Die externe Abfrage SELECT customer_id, MIN(order_date) AS first_order_date FROM orders GROUP BY customer_id wird in der operativen PostgreSQL-Datenbank ausgeführt, um das erste Bestelldatum für jeden Kunden über die Funktion EXTERNAL_QUERY() abzurufen.
Verknüpfen Sie die Ergebnistabelle der externen Abfrage mit der Kundentabelle in BigQuery anhand von customer_id.
Die Kundendaten und das Datum der ersten Bestellung werden ausgewählt.

Cloud SQL-Tabellenschema ansehen

Mit der Funktion EXTERNAL_QUERY() können Sie information_schema-Tabellen abfragen, um auf Datenbankmetadaten zuzugreifen, z. B. um eine Liste aller Tabellen in der Datenbank oder das Tabellenschema abzurufen. Die folgenden information_schema-Beispielabfragen funktionieren sowohl in MySQL als auch in PostgreSQL. Weitere Informationen finden Sie in den Artikeln zu information_schema-Tabellen in MySQL bzw. information_schema-Tabellen in PostgreSQL.

-- List all tables in a database.
SELECT * FROM EXTERNAL_QUERY("connection_id",
"select * from information_schema.tables;");

-- List all columns in a table.
SELECT * FROM EXTERNAL_QUERY("connection_id",
"select * from information_schema.columns where table_name='x';");

Verbindungsdetails

Die folgende Tabelle zeigt die Cloud SQL-Verbindungsattribute:

Eigenschaft	Wert	Beschreibung
`name`	String	Name der Verbindungsressource im Format project_id.location_id.connection_id.
`location`	String	Standort der Verbindung, der entweder mit dem Standort der Cloud SQL-Instanz übereinstimmen oder eine Multiregion der entsprechenden Gerichtsbarkeit sein muss. Eine Cloud SQL-Instanz in `us-east4` kann beispielsweise `US` verwenden, während eine Cloud SQL-Instanz in `europe-north1` `EU` verwenden kann. Nur BigQuery-Abfragen, die an diesem Standort ausgeführt werden, können diese Verbindung verwenden.
`friendlyName`	String	Ein nutzerfreundlicher Anzeigename für die Verbindung.
`description`	String	Beschreibung der Verbindung.
`cloudSql.type`	String	Kann „POSTGRES“ oder „MYSQL“ sein.
`cloudSql.instanceId`	String	Name der Cloud SQL-Instanz, in der Regel im folgenden Format: `Project-id:location-id:instance-id` Sie finden die Instanz-ID auf der Detailseite der Cloud SQL-Instanz.
`cloudSql.database`	String	Die Cloud SQL-Datenbank, zu der Sie eine Verbindung herstellen möchten.
`cloudSql.serviceAccountId`	String	Das Dienstkonto, das für den Zugriff auf die Cloud SQL-Datenbank konfiguriert ist.

In der folgenden Tabelle sind die Attribute der Anmeldedaten der Cloud SQL-Instanz aufgeführt:

Eigenschaft	Wert	Beschreibung
`username`	String	Nutzername der Datenbank.
`password`	String	Passwort für Datenbank

Föderierte BigQuery-Abfragen verfolgen

Wenn Sie eine föderierte Abfrage für Cloud SQL ausführen, fügt BigQuery der Abfrage einen Kommentar hinzu, der in etwa so aussieht:

/* Federated query from BigQuery. Project ID: PROJECT_ID, BigQuery Job ID: JOB_ID. */

Wenn Sie Logs zur Abfragenutzung in einer MySQL- oder PostgreSQL-Datenbank überwachen, kann Ihnen die folgende Anmerkung helfen, Abfragen zu identifizieren, die von BigQuery stammen.

Rufen Sie die Seite Log-Explorer auf.

Zu „Log-Explorer“

Geben Sie auf dem Tab Query die folgende Abfrage ein:

resource.type="cloudsql_database"
textPayload=~"Federated query from BigQuery"

Klicken Sie auf Abfrage ausführen.

Wenn Datensätze für föderierte BigQuery-Abfragen verfügbar sind, wird in Abfrageergebnisse eine Liste mit Datensätzen angezeigt, die der folgenden ähnelt:

YYYY-MM-DD hh:mm:ss.millis UTC [3210064]: [4-1]
db=DATABASE, user=USER_ACCOUNT
STATEMENT: SELECT 1 FROM (SELECT FROM company_name_table) t;
/* Federated query from BigQuery.
Project ID: PROJECT_ID, BigQuery Job ID: JOB_ID
*/

YYYY-MM-DD hh:mm:ss.millis UTC [3210532]: [2-1]
db=DATABASE, user=USER_ACCOUNT
STATEMENT: SELECT "company_id", "company type_id" FROM
(SELECT FROM company_name_table) t;
/* Federated query from BigQuery.
Project ID: PROJECT_ID, BigQuery Job ID: JOB_ID
*/

Fehlerbehebung

Dieser Abschnitt hilft Ihnen beim Beheben von Problemen, die beim Senden einer föderierten Abfrage an Cloud SQL auftreten können.

Problem: Verbindung zum Datenbankserver konnte nicht hergestellt werden. Wenn Sie eine MySQL-Datenbank abfragen, kann der folgende Fehler auftreten:

Invalid table-valued function EXTERNAL_QUERY Failed to connect to MySQL database. Error: MysqlErrorCode(2013): Lost connection to MySQL server during query.

Wenn Sie eine PostgreSQL-Datenbank abfragen, kann alternativ der folgende Fehler auftreten:

Invalid table-valued function EXTERNAL_QUERY Connect to PostgreSQL server failed: server closed the connection unexpectedly This probably means the server terminated abnormally before or while processing the request.: Lösung: Prüfen Sie, ob gültige Anmeldedaten verwendet wurden und alle Voraussetzungen erfüllt sind, um die Verbindung für Cloud SQL zu erstellen. Prüfen Sie, ob das automatisch erstellte Dienstkonto beim Erstellen einer Verbindung zu Cloud SQL die Rolle „Cloud SQL-Client“ (roles/cloudsql.client) hat. Dieses Dienstkonto hat das folgende Format: service-PROJECT_NUMBER@gcp-sa-bigqueryconnection.iam.gserviceaccount.com. Eine ausführliche Anleitung finden Sie unter Zugriff auf das Dienstkonto gewähren.