SQL-Abfragen mit der Translation API übersetzen
In diesem Dokument wird beschrieben, wie Sie mit der Translation API in BigQuery Skripts, die in anderen SQL-Dialekten geschrieben sind, in GoogleSQL-Abfragen übersetzen. Die Translation API kann die Migration von Arbeitslasten zu BigQuery vereinfachen.
Hinweise
Führen Sie die folgenden Schritte aus, bevor Sie einen Übersetzungsjob senden:
- Prüfen, ob Sie die erforderlichen Berechtigungen haben
- Aktivieren Sie die BigQuery Migration API.
- Erfassen Sie die Quelldateien mit den SQL-Skripts und Abfragen, die übersetzt werden sollen.
- Quelldateien in Cloud Storage hochladen
Erforderliche Berechtigungen
Bitten Sie Ihren Administrator, Ihnen die IAM-Rolle MigrationWorkflow-Bearbeiter (roles/bigquerymigration.editor
) für die Ressource parent
zu gewähren, um die Berechtigungen zu erhalten, die Sie zum Erstellen von Übersetzungsjobs mit der konsolidierten Übersetzungs-API benötigen.
Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff verwalten.
Diese vordefinierte Rolle enthält die Berechtigungen, die zum Erstellen von Übersetzungsjobs mithilfe der konsolidierten Übersetzungs-API erforderlich sind. Erweitern Sie den Abschnitt Erforderliche Berechtigungen, um die erforderlichen Berechtigungen anzuzeigen:
Erforderliche Berechtigungen
Die folgenden Berechtigungen sind erforderlich, um Übersetzungsjobs mit der konsolidierten Übersetzungs-API zu erstellen:
-
bigquerymigration.workflows.create
-
bigquerymigration.workflows.get
Sie können diese Berechtigungen auch mit benutzerdefinierten Rollen oder anderen vordefinierten Rollen erhalten.
BigQuery Migration API aktivieren
Wenn Ihr Google Cloud-Befehlszeilenprojekt vor dem 15. Februar 2022 erstellt wurde, aktivieren Sie die BigQuery Migration API so:
Rufen Sie in der Google Cloud Console die Seite BigQuery Migration API auf.
Klicken Sie auf Aktivieren.
Eingabedateien nach Cloud Storage hochladen
Wenn Sie die Cloud Console oder die BigQuery Migration API verwenden möchten, um einen Übersetzungsjob auszuführen, müssen Sie die Quelldateien mit den Abfragen und Skripts hochladen, die in Cloud Storage übersetzt werden sollen. Sie können auch beliebige Metadatendateien oder YAML-Konfigurationsdateien in denselben Cloud Storage-Bucket hochladen, der die Quelldateien enthält. Weitere Informationen zum Erstellen von Buckets und zum Hochladen von Dateien in Cloud Storage erhalten Sie unter Buckets erstellen und Objekte aus einem Dateisystem hochladen.
Unterstützte Aufgabentypen
Die Translation API kann die folgenden SQL-Dialekte in GoogleSQL übersetzen:
- Amazon Redshift SQL -
Redshift2BigQuery_Translation
- Apache HiveQL und Beeline-Befehlszeile -
HiveQL2BigQuery_Translation
- Apache Spark SQL -
SparkSQL2BigQuery_Translation
- Azure Synapse T-SQL -
AzureSynapse2BigQuery_Translation
- Greenplum SQL -
Greenplum2BigQuery_Translation
- IBM Db2 SQL -
Db22BigQuery_Translation
- IBM Netezza SQL und NZPLSQL -
Netezza2BigQuery_Translation
- MySQL SQL -
MySQL2BigQuery_Translation
- Oracle SQL, PL/SQL, Exadata -
Oracle2BigQuery_Translation
- PostgreSQL SQL -
Postgresql2BigQuery_Translation
- Presto oder Trino SQL –
Presto2BigQuery_Translation
- Snowflake SQL -
Snowflake2BigQuery_Translation
- SQLite -
SQLite2BigQuery_Translation
- SQL Server T-SQL -
SQLServer2BigQuery_Translation
- Teradata und Teradata Vantage -
Teradata2BigQuery_Translation
- Vertica SQL -
Vertica2BigQuery_Translation
Standorte
Die Translation API ist an den folgenden Verarbeitungsstandorten verfügbar:
Beschreibung der Region | Name der Region | Details | |
---|---|---|---|
Asiatisch-pazifischer Raum | |||
Tokio | asia-northeast1 |
||
Mumbai | asia-south1 |
||
Singapur | asia-southeast1 |
||
Sydney | australia-southeast1 |
||
Europa | |||
EU (mehrere Regionen) | eu |
||
Warschau | europe-central2 |
||
Finnland | europe-north1 |
Niedriger CO2-Wert | |
Madrid | europe-southwest1 |
Niedriger CO2-Wert | |
Belgien | europe-west1 |
Niedriger CO2-Wert | |
London | europe-west2 |
Niedriger CO2-Wert | |
Frankfurt | europe-west3 |
Niedriger CO2-Wert | |
Niederlande | europe-west4 |
Niedriger CO2-Wert | |
Zürich | europe-west6 |
Niedriger CO2-Wert | |
Paris | europe-west9 |
Niedriger CO2-Wert | |
Turin | europe-west12 |
||
Amerika | |||
São Paulo | southamerica-east1 |
Niedriger CO2-Wert | |
USA (mehrere Regionen) | us |
||
Iowa | us-central1 |
Niedriger CO2-Wert | |
South Carolina | us-east1 |
||
Northern Virginia | us-east4 |
||
Columbus, Ohio | us-east5 |
||
Dallas | us-south1 |
Niedriger CO2-Wert | |
Oregon | us-west1 |
Niedriger CO2-Wert | |
Los Angeles | us-west2 |
||
Salt Lake City | us-west3 |
Übersetzungsjob senden
Verwenden Sie zum Senden eines Übersetzungsjobs mit der Translation API die Methode projects.locations.workflows.create
und geben Sie eine Instanz der Ressource MigrationWorkflow
mit einer unterstützten Aufgabentyp.
Beispiel: Batchübersetzung erstellen
Mit dem folgenden curl
-Befehl wird ein Batchübersetzungsjob erstellt, in dem die Ein- und Ausgabedateien in Cloud Storage gespeichert werden. Das Feld source_target_mapping
enthält eine Liste, die die literal
-Quelleinträge einem optionalen relativen Pfad für die Zielausgabe zuordnet.
curl -d "{ \"tasks\": { string: { \"type\": \"TYPE\", \"translation_details\": { \"target_base_uri\": \"TARGET_BASE\", \"source_target_mapping\": { \"source_spec\": { \"base_uri\": \"BASE\" } }, } } } }" \ -H "Content-Type:application/json" \ -H "Authorization: Bearer TOKEN" -X POST https://bigquerymigration.googleapis.com/v2alpha/projects/PROJECT_ID/locations/LOCATION/workflows
Ersetzen Sie Folgendes:
TYPE
: Der Aufgabentyp der Übersetzung, der den Quell- und Zieldialekt bestimmt.TARGET_BASE
: Der Basis-URI für alle Übersetzungsausgaben.BASE
ist der Basis-URI für alle Dateien, die als Quellen für die Übersetzung gelesen werden.TOKEN
: das Token zur Authentifizierung. Verwenden Sie zum Generieren eines Tokens den Befehlgcloud auth print-access-token
oder den OAuth 2.0 Playground (verwenden Sie den Bereichhttps://www.googleapis.com/auth/cloud-platform
).PROJECT_ID
: das Projekt, in dem die Übersetzung verarbeitet werden soll.LOCATION
: der Standort, an dem der Job verarbeitet wird.
Der vorherige Befehl gibt eine Antwort zurück, die eine Workflow-ID im Format projects/PROJECT_ID/locations/LOCATION/workflows/WORKFLOW_ID
enthält.
Beispiel: Interaktiven Übersetzungsjob mit Stringliteraleingaben und -ausgaben erstellen
Mit dem folgenden curl
-Befehl wird ein Übersetzungsjob mit Ein- und Ausgaben von Stringliteralen erstellt. Das Feld source_target_mapping
enthält eine Liste, die die Quellverzeichnisse einem optionalen relativen Pfad für die Zielausgabe zuordnet.
curl -d "{ \"tasks\": { string: { \"type\": \"TYPE\", \"translation_details\": { \"source_target_mapping\": { \"source_spec\": { \"literal\": { \"relative_path\": \"PATH\", \"literal_string\": \"STRING\" } } }, \"target_return_literals\": \"TARGETS\", } } } }" \ -H "Content-Type:application/json" \ -H "Authorization: Bearer TOKEN" -X POST https://bigquerymigration.googleapis.com/v2alpha/projects/PROJECT_ID/locations/LOCATION/workflows
Ersetzen Sie Folgendes:
TYPE
: Der Aufgabentyp der Übersetzung, der den Quell- und Zieldialekt bestimmt.PATH
: die Kennung des Literaleintrags, ähnlich einem Dateinamen oder Pfad.STRING
: String der Literaleingabedaten (z. B. SQL), die übersetzt werden sollen.TARGETS
: die erwarteten Ziele, die der Nutzer direkt in der Antwort im Formatliteral
zurückgeben möchte. Diese sollten im Ziel-URI-Format vorliegen (z. B. GENERATED_DIR +target_spec.relative_path
+source_spec.literal.relative_path
). Alles, was nicht in dieser Liste enthalten ist, wird in der Antwort nicht zurückgegeben. Das generierte Verzeichnis GENERATED_DIR für allgemeine SQL-Übersetzungen istsql/
.TOKEN
: das Token zur Authentifizierung. Verwenden Sie zum Generieren eines Tokens den Befehlgcloud auth print-access-token
oder den OAuth 2.0 Playground (verwenden Sie den Bereichhttps://www.googleapis.com/auth/cloud-platform
).PROJECT_ID
: das Projekt, in dem die Übersetzung verarbeitet werden soll.LOCATION
: der Standort, an dem der Job verarbeitet wird.
Der vorherige Befehl gibt eine Antwort zurück, die eine Workflow-ID im Format projects/PROJECT_ID/locations/LOCATION/workflows/WORKFLOW_ID
enthält.
Übersetzungsausgabe ansehen
Rufen Sie nach dem Ausführen des Übersetzungsjobs die Ergebnisse ab. Geben Sie dazu die Workflow-ID des Übersetzungsjobs mit dem folgenden Befehl an:
curl \ -H "Content-Type:application/json" \ -H "Authorization:Bearer TOKEN" -X GET https://bigquerymigration.googleapis.com/v2alpha/projects/PROJECT_ID/locations/LOCATION/workflows/WORKFLOW_ID
Ersetzen Sie Folgendes:
TOKEN
: das Token zur Authentifizierung. Verwenden Sie zum Generieren eines Tokens den Befehlgcloud auth print-access-token
oder den OAuth 2.0 Playground (verwenden Sie den Bereichhttps://www.googleapis.com/auth/cloud-platform
).PROJECT_ID
: das Projekt, in dem die Übersetzung verarbeitet werden soll.LOCATION
: der Standort, an dem der Job verarbeitet wird.WORKFLOW_ID
: die ID, die beim Erstellen eines Übersetzungsworkflows generiert wird.