使用數據分析視覺化 BigQuery 資料

BigQuery 是用於 PB 規模的分析資料倉儲,針對大量資料,也能以近乎即時的速度,執行 SQL 查詢。

資料視覺化工具可協助您理解 BigQuery 資料,以及利用互動方式分析資料。您可以使用視覺化工具來協助識別趨勢、加以回應,然後使用資料進行預測。在這個教學課程中,您要使用 Google 數據分析,以視覺化方式呈現 BigQuery natality 範例資料表中的資料。

目標

在這個教學課程中,您將執行下列作業:

  • 連線至 BigQuery 資料來源
  • 建立視覺化 BigQuery 資料的報表與圖表

費用

Google 數據分析的 BigQuery 連接器可讓您在 Google 數據分析中從 BigQuery 表格存取資料。BigQuery 是一種付費產品,當您透過 Google 數據分析存取 BigQuery 時,就會產生 BigQuery 使用費。BigQuery 查詢價格提供每個月前 1 TB 的用量免費。詳情請參閱 BigQuery 定價頁面。

事前準備

開始這個教學課程之前,請使用 Google Cloud Platform 主控台來建立或選取專案並啟用計費功能。

  1. 登入您的 Google 帳戶。

    如果您沒有帳戶,請申請新帳戶

  2. 選取或建立 Google Cloud Platform 專案。

    前往「Manage resources」(管理資源) 頁面

  3. 請確認您已啟用 Google Cloud Platform 專案的計費功能。

    瞭解如何啟用計費功能

  4. 新專案會自動啟用 BigQuery。 如要在現有專案中啟動 BigQuery,請執行下列指令: 啟用BigQuery API。

    啟用 API

使用 Google 數據分析與 BigQuery 連接器建立報表與圖表

在這一節的教學課程中,您將透過 BigQuery 連接器,使用 Google 數據分析來視覺化 BigQuery 中的資料。您會建立資料來源、報表與圖表,在 natality 範例資料表中視覺化資料。

建立資料來源

如要在 Google 數據分析中建立報表,第一步就是為報表建立資料來源。報表可包含一或多個資料來源。當您建立 BigQuery 資料來源時,Google 數據分析會使用 BigQuery 連接器。

您必須具備適當的權限,才能在 Google 數據分析報表內加入 BigQuery 資料來源。此外,套用到 BigQuery 資料集的權限也會適用於您在 Google 數據分析中建立的報表、圖表與資訊主頁。共用 Google 數據分析報表時,只有具備適當權限的使用者能夠看到報表元件。

如要建立資料來源:

  1. 開啟 Google 數據分析

  2. 在「Reports」(報表) 頁面的「Start a new report」(建立新報表) 部分中,按一下 [Blank] (空白) 範本。這樣做會建立新的未命名報表。

    空白範本

  3. 如果出現系統提示,請完成「Marketing Preferences」(行銷偏好設定) 與「Account and Privacy」(帳戶和隱私權) 設定,然後按一下 [Save] (儲存)。儲存設定之後,您可能需要再按一下 [Blank] (空白) 範本。

  4. 在「Add a data source」(加入資料來源) 視窗中,按一下 [Create new data source] (建立新資料來源)

    新增資料來源

  5. 在「Google Connectors」部分,將游標懸停在「BigQuery」,然後按一下 [Select] (選擇)

  6. 在「Authorization」(授權) 中,按一下 [Authorize] (授權),即可讓 Google 數據分析存取您的 GCP 專案。

  7. 在「Request for permission」(權限要求) 對話方塊中點選 [Allow] (允許),讓 Google 數據分析能夠在 BigQuery 中查看資料。如果您之前使用過 Google 數據分析,則可能不會收到這個提示。

  8. 針對「My Projects」(我的專案),按一下 [Public Datasets] (公開資料集)

  9. 針對「Billing Project」(帳單專案),按一下您之前建立的 GCP 專案名稱。

  10. 針對「Public Dataset」(公開資料集),按一下 [samples] (範例)

  11. 針對「Table」(資料表),按一下 natality[natality]。

    natality 表格

  12. 按一下視窗右上角的 [Connect] (連線)。當 Google 數據分析連線到 BigQuery 資料來源後,就會顯示資料表的欄位。您可以使用這個頁面調整欄位屬性,或是建立新的計算欄位。

  13. natality 資料表中,yearsource_year 欄位都儲存為整數。如要在 Google 數據分析中將這些資料欄做為字串使用,您可以將這些資料欄的類型變更為文字。在 yearsource_year 欄位右側的「Type」(類型) 資料欄中,按一下 [Number] (數字),然後從下拉式清單中選擇 [Text] (文字)

    「Field」(欄位) 對話方塊

  14. 按一下 [Add to Report] (加入報表)

    加入報表

  15. 收到系統提示時,按一下 [Add to report] (加入報表)

  16. 在「Request for permission」(權限要求) 對話方塊中點選 [Allow] (允許),讓 Google 數據分析能夠在 Google 雲端硬碟中查看及管理資料。如果您之前使用過 Google 數據分析,則可能不會收到這個提示。

使用計算欄位建立長條圖

當您將 natality 資料來源新增到報表之後,下一步就是建立視覺化效果。請從建立長條圖開始。長條圖顯示了每年的出生總人數。如要顯示每年出生人數,請建立計算欄位。

建立顯示每年出生總人數的長條圖:

  1. (選用) 在頁面頂端,按一下 [Untitled Report] (未命名報表) 變更報表名稱。例如,輸入 BigQuery tutorial

  2. 載入報表編輯器之後,請按一下 [Insert] (插入) > [Bar chart] (長條圖)

  3. 使用控點,將圖表放到報表上。

  4. 在「Data」(資料) 分頁上,注意「Data Source」(資料來源) natality 的值與「Dimension」(維度) 和「Metric」(指標) 的預設值。

  5. 由於您以年為單位製作出生人數圖表,因此維度必須設為 source_year。如果 source_year 不是預設維度,請按一下「Available Fields」(可用欄位) 中的 [source_year] ,並將其拖曳到預設維度中,即可取代預設維度。

  6. 在「Metric」(指標) 區段中,按一下 [Add metric] (新增指標)

  7. 在指標選擇器中,按一下 [Create field] (建立欄位)

  8. 如要顯示每年出生嬰兒數 (按性別區分),請建立計算欄位。針對這個教學課程,您會計算 is_male 欄位中的項目。如果嬰兒是男孩,is_male 中的值為 true;如果嬰兒是女孩,就是 false。在新指標視窗的「Name」(名稱) 中輸入 birth_count

  9. 「Formula」(公式) 部分請輸入以下內容:COUNT(is_male)

  10. 按一下 [Apply] (套用)

  11. 按一下報表頁面,關閉指標選擇器。

  12. 新增指標之後,將游標懸停到預設指標上,然後按一下右側的刪除圖示。「Dimension」(維度) 現在應設定為 source_year,「Metric」(指標) 應設為 birth_count

  13. 請注意,圖表預設會按「遞減」順序排序。會先顯示出生人數最多的年份。

    出生總人數圖表

  14. 如要增強圖表,請變更長條標籤。在「Bar chart properties」(長條圖屬性) 視窗中,按一下 [Style] (樣式) 分頁標籤。

  15. 在「Bar chart」(長條圖) 區段中,勾選 [Show data labels] (顯示資料標籤)

    顯示標籤

    出生總人數會顯示在圖表中的每一個長條之上。

  16. 請按 source_year 而非 birth_count 排序資料。在「Bar chart Properties」(長條圖屬性) 視窗的「Data」(資料) 分頁的「Sort」(排序) 區段中:

    • 按一下 [New field] (新欄位)
    • 在排序挑選器中,捲動至「Chart Fields」(圖表欄位),並選取 source_year
    • 在對話方塊以外的位置按一下,以關閉排序挑選器。
    • 按一下 [Descending] (遞減),然後選取 [Ascending] (遞增)。 顯示會變更為按遞增順序顯示每年出生人數。

    按遞增順序排序出生人數

篩選圖表

目前,長條圖顯示了每年出生的男孩與女孩總人數。請新增篩選條件,只顯示每年出生的女孩。

  1. 在「Bar chart properties」(長條圖屬性) 視窗中,按一下 [Data] (資料) 分頁標籤。

  2. 在「Filter」(篩選器) 區段中,按一下 [Add a filter] (新增篩選器)

  3. 在「Create filter」(建立篩選器) 視窗中:

    • 在「Name」(名稱) 部分輸入 Female birth count
    • 按一下 [Include] (包含) 並將它變更為 [Exclude] (排除)
    • 按一下 [Select a field] (選取欄位) 並選擇 is_male
    • 點選 [Select a condition] (選取條件) 並選擇 [True] (是)
    • 按一下 [Save] (儲存)

    「Create filter」(建立篩選器) 視窗

請注意,圖表會更新為只顯示每年出生的女孩。另請注意,圖例不會變更。圖例名稱仍會反映出指標 birth_count 的名稱。

篩選的圖表

使用自訂查詢建立圖表

只要使用「Custom Query」(自訂查詢) 選項建立圖表,您就可以利用 BigQuery 的完整查詢功能,例如彙整、聯集和分析函式等。

或者,您可以選擇透過建立檢視畫面來利用 BigQuery 的完整查詢功能。視圖是 SQL 查詢定義的虛擬表格。您可以新增包含視圖的資料集做為資料來源,在視圖中查詢資料。如要深入瞭解視圖,請參閱使用視圖

當您將 SQL 查詢指定為 BigQuery 資料來源時,查詢的結果會以資料表格式顯示,而這會成為資料來源的欄位定義 (結構定義)。當您使用自訂查詢做為資料來源時,對於每個產生的 BigQuery 查詢,Google 數據分析會使用您的 SQL 做為內部的選取陳述式。如要進一步瞭解 Google 數據分析中的自訂查詢,請參閱線上說明

使用自訂查詢新增長條圖

將長條圖新增至使用自訂查詢資料來源的報表:

  1. 從選單選項中,選擇 [Page] (頁面) > [New page] (新增頁面)

  2. 按一下 [Insert] (插入) > [Bar chart] (長條圖)

  3. 使用控點,將圖表放到報表上。

  4. 在「Bar chart Properties」(長條圖屬性) 視窗的「Data」(資料) 分頁上,確認「Data Source」(資料來源) 已設為 natality。按一下 natality 可開啟「Select Data Source」(選取資料來源) 視窗。

  5. 按一下 [Create new data source] (建立新資料來源)

  6. 在「Google Connectors」部分,將游標懸停在「BigQuery」,然後按一下 [Select] (選取)

  7. 針對「My Projects」(我的專案),點選 [Custom query] (自訂查詢)

  8. 針對「Project」(專案),選取您的 GCP 專案。

  9. 在「Enter custom query」(輸入自訂查詢) 視窗中輸入下列標準 SQL 查詢:

    SELECT
     source_year,
     sum(case when is_male then 1 else 0 end) as male_births,
     sum(case when is_male then 0 else 1 end) as female_births
    FROM
     `bigquery-public-data.samples.natality`
    GROUP BY
     source_year
    ORDER BY
     source_year
    DESC
    

    這個查詢會使用 CASE 陳述式評估 is_male 布林欄位,藉此確認在特定年份中,有多少新生兒是女孩,有多少是男孩。

  10. 在「Query Options」(查詢選項) 下方,確認已取消選取 [Use Legacy SQL] (使用舊版 SQL)。這可讓您使用 BigQuery 標準 SQL 語法。

    自訂查詢

  11. 在視窗頂端,按一下 [Untitled data source] (未命名的資料來源),然後將資料來源名稱變更為 Male female case query

  12. 按一下視窗右上角的 [Connect] (連線)。當 Google 數據分析連線到 BigQuery 資料來源後,就會使用查詢結果來確認資料表結構定義。

  13. 顯示結構定義時,請注意每個欄位的類型與匯總。 根據預設,source_year 會格式化為 [Number] (數字),「Aggregation」(匯總) 會設定為 [None] (無)。在 source_year 欄位右側的「Type」(類型) 資料欄中,按一下 [Number] (數字),並選取 [Text] (文字)。請確認「Aggregation」(匯總) 是否已設定為 [None] (無)。

    篩選的圖表

  14. 按一下 [Add to Report] (加入報表)

  15. 收到系統提示時,按一下 [Add to report] (加入報表)

  16. 按一下返回箭頭,以關閉「Select Data Source」(選取資料來源) 視窗。

  17. Google 數據分析可能無法正確判定適當的圖表指標。由於您是按每年的出生男孩與女孩人數製作圖表,因此指標的值應分別為 female_birthsmale_births。在「Bar chart Properties」(長條圖屬性) 視窗中「Data」(資料) 分頁的「Metric」(指標) 區段,按一下 [Record Count] (記錄數)

  18. 在指標選擇器中,選取 [female_births]

  19. 在「Metric」(指標) 區段中,按一下 [Add metric] (新增指標)

  20. 在指標選擇器中,選取 [male_births]。您的圖表現在會使用獨立的長條顯示每年出生的男孩與女孩人數。

    篩選的圖表

  21. 圖表應按 female_births 以遞減順序排序。請像在之前的圖表中一樣將此項變更為 source_year。在「Sort」(排序) 區段中,按一下 female_births

  22. 在排序挑選器中,選擇 source_year。圖表現在會以遞減順序顯示每年的女孩與男孩出生數。

  23. 為了更易於閱讀,請變更圖表樣式。在「Bar chart properties」(長條圖屬性) 中,按一下 [Style] (樣式) 分頁標籤。

  24. 請注意,根據新增至圖表的指標順序,每個長條都有預設顏色。按一下調色盤中的第二個方塊,將它從紅色變更為藍色。

    篩選的圖表

  25. 按一下調色盤中的第一個方塊,將它從藍色變更為紅色。

    圖表看起來應該會像這樣:

    彩色長條圖

查看查詢記錄

您可以在 BigQuery 網頁介面中檢查查詢記錄,以查看透過 BigQuery 連接器提交的查詢。您也能使用查詢記錄來估算查詢費用,並儲存查詢供其他情況使用。

檢查查詢記錄:

主控台

  1. 在 GCP 主控台中開啟 BigQuery 網頁版 UI。
    前往 BigQuery 網頁版 UI

  2. 按一下左側導覽中的 [Query History] (查詢記錄)

  3. 查詢清單會先顯示最近的查詢。按一下查詢以查看查詢的詳細資料,例如「Job ID」(工作 ID) 與「Bytes Processed」(已處理的位元組數)。

傳統版 UI

  1. 前往 BigQuery 網頁版 UI。

    前往 BigQuery 網頁版 UI

  2. 按一下 [Query History] (查詢記錄)

  3. 查詢清單會先顯示最近的查詢。按一下 [Open Query] (開啟查詢) 可查看查詢的詳細資料,例如「Job ID」(工作 ID) 與「Bytes Processed」(已處理的位元組數)。

    彩色長條圖

清除所用資源

如何避免系統向您的 Google Cloud Platform 帳戶收取您在本教學課程中使用資源的相關費用:

  1. 前往 GCP 主控台的「Projects」(專案) 頁面。

    前往「Projects」(專案) 頁面

  2. 在專案清單中,找到您要刪除的專案並按一下「刪除」圖示 delete
  3. 在對話方塊中輸入專案 ID,按一下 [Shut down] (關閉) 即可刪除專案。

由於資料來源與您的專案相關聯,因此刪除專案可避免 Google 數據分析查詢資料。如果您不想刪除 Cloud Platform 專案,可以改為刪除 Google 數據分析報表與資料來源。

如要刪除 Google 數據分析資源:

  1. 開啟 Google 數據分析

  2. 在「Reports」(報表) 頁面的「BigQuery tutorial」(BigQuery 教學課程) 報表右側,按一下「更多」按鈕圖示 「更多」按鈕,並選擇 [Remove] (移除)

  3. 按一下 [Data Sources] (資料來源)。

  4. 在「natality」資料來源的右側,點選「更多」按鈕並選擇 [Remove] (移除)

  5. 在「Male female case query」資料來源的右側,按一下「更多」按鈕並選擇 [Remove] (移除)

後續步驟

  • 進一步瞭解如何撰寫 BigQuery 查詢:有關如何執行查詢、建立使用者定義的函式 (UDF) 等更多資訊,請參閱 BigQuery 說明文件的查詢資料

  • 探索 BigQuery 語法:在 BigQuery 中,SQL 查詢的慣用方言是標準 SQL,詳情請參閱 SQL 參考資料。如需 BigQuery 的舊版 SQL 語法說明,請參閱查詢參考資料 (舊版 SQL)

本頁內容對您是否有任何幫助?請提供意見:

傳送您對下列選項的寶貴意見...

這個網頁
需要協助嗎?請前往我們的支援網頁