您可以在 BigQuery 中使用 Colab Enterprise 筆記本,探索 BigQuery 查詢結果。
在本教學課程中,您將查詢 BigQuery 公開資料集中的資料,並在筆記本中探索查詢結果。
目標
- 在 BigQuery 中建立及執行查詢。
- 在筆記本中探索查詢結果。
費用
本教學課程使用Google Cloud 公開資料集計畫提供的資料集。這些資料集的儲存空間費用由 Google 支付,Google 也將這些資料集提供給大眾存取。您需要支付資料查詢費用 詳情請參閱 BigQuery 定價。
事前準備
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the BigQuery API.
新專案會自動啟用 BigQuery。
設定程式碼資產的預設區域
如果您是第一次建立程式碼資產,請設定程式碼資產的預設區域。程式碼資產建立後,就無法變更區域。
BigQuery Studio 中的所有程式碼資產都使用相同的預設區域。如要設定程式碼資產的預設區域,請按照下列步驟操作:
前往「BigQuery」頁面
在「Explorer」窗格中,找出已啟用程式碼資產的專案。
按一下專案旁的
「查看動作」,然後按一下「變更預設程式碼區域」。「區域」請選取要用於程式碼資產的區域。
按一下 [選取]。
如需可用區域清單,請參閱 BigQuery Studio 位置。
所需權限
如要建立及執行 Notebook,您需要下列 Identity and Access Management (IAM) 角色:
- BigQuery 使用者 (
roles/bigquery.user
) - 筆記本執行階段使用者 (
roles/aiplatform.notebookRuntimeUser
) - 程式碼建立工具 (
roles/dataform.codeCreator
)
在筆記本中開啟查詢結果
您可以執行 SQL 查詢,然後使用筆記本探索資料。如果您想先修改 BigQuery 中的資料再進行處理,或是只需要表格中的部分欄位,這個方法就非常實用。
前往 Google Cloud 控制台的「BigQuery」頁面。
在「Type to search」(輸入要搜尋的字詞) 欄位中輸入
bigquery-public-data
。如果未顯示該專案,請在搜尋欄位中輸入
bigquery
,然後按一下「Search to all projects」(將搜尋範圍擴及所有專案),將搜尋字串與現有專案進行比對。依序選取「bigquery-public-data」>「ml_datasets」>「penguins」。
針對 penguins 表格,依序按一下
「View actions」(查看動作) 和「Query」(查詢)。在產生的查詢中加入星號 (
*
) 以選取欄位,如下列範例所示:SELECT * FROM `bigquery-public-data.ml_datasets.penguins` LIMIT 1000;
按一下「執行」
。在「查詢結果」部分,依序點選「探索資料」和「使用 Python 筆記本探索」。
準備使用筆記本
連線至執行階段並設定應用程式預設值,準備使用筆記本。
- 在筆記本標頭中,按一下「連線」,連線至預設執行階段。
- 在「設定」程式碼區塊中,按一下 「執行儲存格」。
探索資料
- 如要將 penguins 資料載入 BigQuery DataFrame 並顯示結果,請按一下「Result set loaded from BigQuery job as a DataFrame」(從 BigQuery 工作載入的結果集做為 DataFrame) 區塊中程式碼區塊的「Run cell」(執行儲存格) 。
- 如要取得資料的描述性指標,請在「Show descriptive statistics using describe()」(使用 describe() 顯示描述性統計資料) 部分的程式碼區塊中,點選「Run cell」(執行儲存格) 。
- 選用:使用其他 Python 函式或套件探索及分析資料。
下列程式碼範例顯示如何使用 bigframes.pandas
分析資料,以及如何使用 bigframes.ml
從 BigQuery DataFrame 中的 penguins 資料建立線性迴歸模型:
清除所用資源
如要避免系統向您的 Google Cloud 帳戶收取本教學課程中所用資源的相關費用,請刪除含有該項資源的專案,或者保留專案但刪除個別資源。
如要避免付費,最簡單的方法就是刪除您為了本教學課程所建立的 Google Cloud 專案。
- In the Google Cloud console, go to the Manage resources page.
- In the project list, select the project that you want to delete, and then click Delete.
- In the dialog, type the project ID, and then click Shut down to delete the project.
後續步驟
- 進一步瞭解如何在 BigQuery 中建立筆記本。
- 進一步瞭解如何使用 BigQuery DataFrames 探索資料。