載入及查詢資料

如要開始使用 BigQuery,請建立資料集、將資料載入資料表,並查詢資料表。


如要直接在 Google Cloud 控制台按照逐步指南操作,請按一下「Guide me」(逐步引導)

逐步引導


事前準備

您必須先登入Google Cloud 控制台並建立專案,才能探索 BigQuery。如果未在專案中啟用帳單功能,您上傳的所有資料都會進入 BigQuery 沙箱模式。沙箱機制可讓您免費使用部分 BigQuery 功能,藉此熟悉 BigQuery 的操作方式。詳情請參閱「啟用 BigQuery 沙箱」一文。

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  4. 選用:如果您選取現有專案,請務必啟用 BigQuery API。新專案會自動啟用 BigQuery API。
  5. 建立 BigQuery 資料集

    透過 Google Cloud 控制台在美國多區域位置建立資料集來儲存資料。如要瞭解 BigQuery 單一地區與多地區,請參閱位置的相關說明。

    1. 在 Google Cloud 控制台開啟 BigQuery 頁面。
    2. 前往 BigQuery
    3. 「Explorer」窗格,點按專案名稱。
    4. 按一下 。 按一下「查看動作」
    5. 選取「Create dataset」(建立資料集)
    6. 在「建立資料集」頁面中,執行下列操作:
      1. 在「Dataset ID」(資料集 ID) 中輸入 babynames
      2. 針對「位置類型」選取「多區域」,然後選擇「美國 (多個美國地區)」。公開資料集儲存在 us 多地區位置。為簡單起見,請將資料集儲存在相同位置。
      3. 其餘設定請保留預設狀態,然後按一下「Create dataset」(建立資料集)

    下載含有來源資料的檔案

    您下載的檔案包含約 7 MB 的熱門新生兒命名資料,這項資料是由美國社會安全局提供。

    如要進一步瞭解資料,請參閱美國社會安全局的熱門名字的背景資訊

    1. 在新的瀏覽器分頁中開啟下列網址,下載美國社會安全局的資料:

      https://www.ssa.gov/OACT/babynames/names.zip
      
    2. 將檔案解壓縮。

      如要進一步瞭解資料集結構定義,請參閱 ZIP 檔案中的 NationalReadMe.pdf 檔案。

    3. 如要查看資料樣貌,請開啟 yob2024.txt 檔案。這個逗號分隔值檔案內含名字、出生時判定的性別,以及同名的新生兒人數,這個檔案沒有標題列。

    4. 請記下 yob2024.txt 檔的位置,以便稍後尋找。

    將資料載入資料表

    接著,將資料載入新資料表。

    1. 「Explorer」窗格,展開專案名稱。
    2. babynames 資料集旁邊,依序點選 「查看動作」和「開啟」
    3. 按一下「建立資料表」

      除非另有指示,否則請保留所有設定的預設值。

    4. 在「建立資料表」頁面中,執行下列操作:
      1. 在「Source」(來源) 專區中,從「Create table from」(建立資料表來源) 的清單中選擇「Upload」(上傳)
      2. 在「Select file」(選取檔案) 欄位,點按「Browse」(瀏覽)
      3. 找到並開啟本機中的 yob2024.txt 檔案,然後點按「Open」(開啟)
      4. 「File format」(檔案格式) 清單選擇「CSV」
      5. 在「Destination」(目的地) 專區的「Table」(資料表) 欄位,輸入 names_2024
      6. 在「Schema」(結構定義) 專區,點按「Edit as text」(以文字形式編輯) 切換按鈕,然後將下列結構定義貼入文字欄位:
      7. name:string,assigned_sex_at_birth:string,count:integer
      8. 點按「Create table」(建立資料表)

        等待 BigQuery 建立資料表及載入資料。

    預覽資料表資料

    如要預覽資料表資料,請按照下列步驟操作:

    1. 「Explorer」窗格,展開專案和 babynames 資料集,然後選取 names_2024 資料表。
    2. 點按「Preview」(預覽) 分頁標籤,BigQuery 會顯示資料表的前幾個資料列。
    3. 資料表預覽分頁。
    「預覽」分頁標籤不適用於所有表格類型。舉例來說,外部資料表或檢視表不會顯示「預覽」分頁。

    查詢資料表資料

    接著是查詢資料表。

    1. 在「names_2024」分頁旁,按一下「SQL query」(SQL 查詢) 選項 。系統會開啟新的編輯器分頁。
    2. 將下列查詢貼入查詢編輯器,這項查詢會擷取 2024 年在美國出生,且當判定為男性的前五名熱門男嬰名字。
      
        SELECT
          name,
          count
        FROM
          `babynames.names_2024`
        WHERE
          assigned_sex_at_birth = 'M'
        ORDER BY
          count DESC
        LIMIT
          5;
        
    3. 按一下「Run」(執行)。 查詢結果會顯示在「Query results」(查詢結果) 部分中。
      查詢結果面板

    您已成功使用 Google Cloud 控制台查詢公開資料集內的資料表,並將範例資料載入 BigQuery。

    清除所用資源

    如要避免系統向您的 Google Cloud 帳戶收取本頁所用資源的費用,請按照下列步驟操作。

    1. 在 Google Cloud 控制台開啟「BigQuery」頁面。
    2. 前往 BigQuery
    3. 在「Explorer」窗格中,按一下您建立的 babynames 資料集。
    4. 展開「查看動作」選項,然後按一下「刪除」
    5. 在「Delete dataset」(刪除資料集) 對話方塊中,確認刪除指令:輸入字詞 delete,然後按一下「Delete」(刪除)

    後續步驟