使用 Bigtable 變更串流至 BigQuery 範本
在本快速入門導覽課程中,您將瞭解如何設定啟用變更串流的 Bigtable 資料表、執行變更串流管道、變更資料表,然後查看串流的變更。
事前準備
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the Dataflow, Cloud Bigtable API, Cloud Bigtable Admin API, and BigQuery APIs.
-
In the Google Cloud console, activate Cloud Shell.
建立 BigQuery 資料集
透過 Google Cloud 控制台建立資料集來儲存資料。
前往 Google Cloud 控制台的「BigQuery」頁面。
在「Explorer」窗格中,按一下專案名稱。
展開「動作」
選項,然後按一下「建立資料集」。在「建立資料集」頁面中,執行下列操作:
- 在「Dataset ID」(資料集 ID) 中輸入
bigtable_bigquery_quickstart
。 - 其餘設定請保留預設狀態,然後按一下「建立資料集」。
- 在「Dataset ID」(資料集 ID) 中輸入
建立啟用變更串流的資料表
前往 Google Cloud 控制台的 Bigtable「Instances」(執行個體) 頁面。
按一下您要在本快速入門導覽課程使用的執行個體 ID。
如果沒有可用的執行個體,請在您附近的區域建立執行個體,並使用預設設定。
按一下左側導覽窗格中的「表格」。
按一下「建立資料表」。
將資料表命名為
bigquery-changestream-quickstart
。新增名為
cf
的資料欄系列。選取「啟用變更串流」。
點選「建立」。
在 Bigtable「Tables」(資料表) 頁面中,找出所需資料表
bigquery-changestream-quickstart
。在「變更串流」欄中,按一下「連線」。
在對話方塊中選取「BigQuery」BigQuery。
按一下「建立 Dataflow 工作」。
在提供的參數欄位中輸入參數值。您不需要提供任何選用參數。
- 將 Bigtable 應用程式設定檔 ID 設為
default
。 - 將 BigQuery 資料集設為
bigtable_bigquery_quickstart
。
- 將 Bigtable 應用程式設定檔 ID 設為
按一下「Run Job」(執行工作)。
請先等待工作狀態顯示為「Starting」(啟動中) 或「Running」(執行中),再繼續進行下一步。 工作排入佇列後,大約需要 5 分鐘。
請在分頁中開啟工作,以便在清除資源時停止工作。
將一些資料寫入 Bigtable
在 Cloud Shell 中,將幾列資料寫入 Bigtable,這樣變更記錄就能將一些資料寫入 BigQuery。只要在工作建立後寫入資料,就會顯示變更。不必等待工作狀態變成
running
。cbt -instance=BIGTABLE_INSTANCE_ID -project=PROJECT_ID \ set bigquery-changestream-quickstart user123 cf:col1=abc cbt -instance=BIGTABLE_INSTANCE_ID -project=PROJECT_ID \ set bigquery-changestream-quickstart user546 cf:col1=def cbt -instance=BIGTABLE_INSTANCE_ID -project=PROJECT_ID \ set bigquery-changestream-quickstart user789 cf:col1=ghi
更改下列內容:
- PROJECT_ID:您使用的專案 ID
- BIGTABLE_INSTANCE_ID:包含
bigquery-changestream-quickstart
資料表的執行個體 ID
在 BigQuery 中查看變更記錄
前往 Google Cloud 控制台的「BigQuery」頁面。
在「Explorer」窗格中,展開專案和資料集
bigtable_bigquery_quickstart
。按一下
bigquery-changestream-quickstart_changelog
資料表。如要查看變更記錄,請按一下「預覽」。
清除所用資源
如要避免系統向您的 Google Cloud 帳戶收取本頁所用資源的費用,請按照下列步驟操作。
停用資料表的變更串流:
gcloud bigtable instances tables update bigquery-changestream-quickstart \ --project=PROJECT_ID --instance=BIGTABLE_INSTANCE_ID \ --clear-change-stream-retention-period
刪除資料表
bigquery-changestream-quickstart
:cbt --instance=BIGTABLE_INSTANCE_ID --project=PROJECT_ID deletetable bigquery-changestream-quickstart
停止變更串流管道:
前往 Google Cloud 控制台的 Dataflow「Jobs」(工作) 頁面。
從工作清單中選取串流工作。
按一下導覽區中的「停止」。
在「停止工作」對話方塊中,選取「取消」,然後按一下「停止工作」。
刪除 BigQuery 資料集:
前往 Google Cloud 控制台的「BigQuery」頁面。
在「Explorer」面板中找出並點選資料集
bigtable_bigquery_quickstart
。依序點選「Delete」(刪除)、輸入
delete
,然後點選「Delete」(刪除) 確認操作。
選用:如果您為本快速入門導覽課程建立了新的執行個體,請刪除該執行個體:
cbt deleteinstance BIGTABLE_INSTANCE_ID
後續步驟