連結簡介
BigQuery 可讓您建立外部連線,查詢儲存在 BigQuery 以外的資料,例如 Cloud Storage 或 Spanner 等 Google Cloud 服務,或是 Amazon Web Services (AWS) 或 Microsoft Azure 等第三方來源。這些外部連結會使用 BigQuery Connection API。
舉例來說,假設您在 Cloud SQL 中儲存客戶訂單的詳細資料,並在 BigQuery 中儲存銷售資料,而且希望透過單次查詢彙整這兩個資料表。您可以使用 BigQuery Connection API 建立 Cloud SQL 連線,連至外部資料庫。透過連結,您絕不會以明文傳送資料庫憑證。
連線會經過加密,並安全地儲存在 BigQuery 連線服務中。您可以授予使用者 BigQuery 連線身分與存取權管理 (IAM) 角色,讓使用者存取連線。
連線類型
BigQuery 為下列外部資料來源提供不同類型的連線:
- Amazon Simple Storage Service (Amazon S3)
- Apache Spark
- Azure Blob 儲存體
- Google Cloud 資源,例如 Vertex AI 遠端模型、遠端函式和 BigLake
- Spanner
- Cloud SQL
- AlloyDB for PostgreSQL
- SAP Datasphere
Amazon S3 連線
如要使用 BigQuery Omni 建立 Amazon S3 連線,請參閱「連結至 Amazon S3」。
建立現有的 Amazon S3 連線後,即可執行下列操作:
Spark 連線
Spark 適用的預存程序可讓您使用 BigQuery 執行以 Python 編寫的預存程序。Spark 連線可讓您連線至 Dataproc Serverless,並執行 Spark 的預存程序。
如要建立這項連線,請參閱「建立連線」。
Blob 儲存空間連線
如要使用 BigQuery Omni 建立 Blob 儲存體連線,請參閱「連結至 Blob 儲存體」。
建立現有的 Blob 儲存體連線後,即可執行下列操作:
Google Cloud 資源連線
Google Cloud 資源連線可授權存取其他 Google Cloud資源,例如 Vertex AI 遠端模型、遠端函式和 BigLake。如要瞭解如何設定 Google Cloud 資源連線,請參閱「建立及設定 Cloud 資源連線」。
建立現有的 Google Cloud 資源連線後,您可以使用該連線建立下列 BigQuery 物件:
- 遠端模型。詳情請參閱透過 LLM 建立遠端模型的 CREATE MODEL 陳述式、透過 Cloud AI 服務建立遠端模型的 CREATE MODEL 陳述式,以及透過 Vertex AI 代管模型建立遠端模型的 CREATE MODEL 陳述式。
- 遠端函式。BigQuery 遠端函式可讓您使用 Cloud Run 函式或 Cloud Run 中支援的任何語言實作函式。遠端函式連線可讓您連線至 Cloud Run 函式或 Cloud Run,並執行這些函式。如要建立 BigQuery 遠端函式連線,請參閱「建立連線」。
- BigLake 資料表。BigLake 連線可將 BigLake 資料表連結至外部資料來源,同時保留精細的 BigQuery 存取權控管和安全性,適用於 Cloud Storage 中的結構化和非結構化資料。
- 物件資料表:詳情請參閱物件資料表簡介。
Spanner 連線
如要建立 Spanner 連線,請參閱「連線至 Spanner」。
建立現有的 Spanner 連線後,即可執行聯合查詢。
Cloud SQL 連線
如要建立 Cloud SQL 連線,請參閱「連線至 Cloud SQL」。
建立現有的 Cloud SQL 連線後,即可執行聯合式查詢。
AlloyDB 連線
如要建立 AlloyDB 連線,請參閱「連線至 PostgreSQL 適用的 AlloyDB」。
建立現有的 AlloyDB 連線後,即可執行聯合查詢。
SAP Datasphere 連線
如要建立 SAP Datasphere 連線,請參閱「連線至 SAP Datasphere」。
建立 SAP Datasphere 連線後,即可執行聯合查詢。
稽核記錄
BigQuery 會記錄連線的使用情形和管理要求。詳情請參閱「BigQuery 稽核記錄總覽」。
後續步驟
- 瞭解如何管理連線。
- 進一步瞭解專案的預設連線。
- 瞭解如何使用遠端函式分析物件資料表。
- 瞭解如何查詢儲存的資料:
- 瞭解外部資料表。