使用 Google Cloud 控制台在 BigQuery ML 中建立機器學習模型

本文說明如何使用 Google Cloud 控制台建立 BigQuery ML 模型。

必要的角色

  • 如要建立模型及執行推論,您必須具備下列角色:

    • BigQuery 資料編輯者 (roles/bigquery.dataEditor)
    • BigQuery 使用者 (roles/bigquery.user)

事前準備

  1. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  2. Verify that billing is enabled for your Google Cloud project.

  3. Enable the BigQuery and BigQuery Connection APIs.

    Enable the APIs

特定機型的必要條件

建立模型前,請務必先滿足所建模型類型的所有必要條件:

建立資料集

建立 BigQuery 資料集來存放資源:

控制台

  1. 前往 Google Cloud 控制台的「BigQuery」頁面。

    前往 BigQuery 頁面

  2. 在「Explorer」窗格中,按一下專案名稱。

  3. 依序點按 「View actions」(查看動作) >「Create dataset」(建立資料集)

  4. 在「建立資料集」頁面中,執行下列操作:

    • 在「Dataset ID」(資料集 ID) 部分,輸入資料集的名稱。

    • 在「位置類型」部分,選取資料集的位置。

    • 點選「建立資料集」

bq

  1. 如要建立新的資料集,請使用 bq mk 指令搭配 --location 旗標:

    bq --location=LOCATION mk -d DATASET_ID

    更改下列內容:

    • LOCATION:資料集的位置
    • DATASET_ID 是您要建立的資料集 ID。
  2. 確認資料集已建立完成:

    bq ls

建立內部或外部訓練的模型

您可以使用這個程序建立下列類型的模型:

這些模型會根據類型提供不同的選項組合。雖然 BigQuery ML 自動調整功能在大多數情況下都能正常運作,但您也可以選擇在程序中手動調整模型。如要這麼做,請參閱特定模型類型的說明文件,進一步瞭解模型選項。

如何建立模型:

  1. 前往「BigQuery」頁面

    前往 BigQuery

  2. 在「Explorer」窗格中,按一下您建立的資料集。

  3. 按一下資料集旁的 「View actions」(查看動作),然後點選「Create BQML Model」(建立 BQML 模型)

    「建立新模型」窗格隨即開啟。

  4. 在「Model name」(模型名稱) 中,輸入模型的名稱。

  5. 如要建立包含模型 CREATE MODEL 陳述式的已儲存查詢,請選取「儲存查詢」

    1. 在「查詢名稱」中,輸入儲存查詢的名稱。
    2. 在「區域」中,選擇儲存查詢的區域。
  6. 按一下「繼續」

  7. 在「建立方法」部分,選取「在 BigQuery 中訓練模型」

  8. 在「模型目標」部分,選取模型的模型目標。

  9. 按一下「繼續」

  10. 在「模型選項」頁面中,選取模型類型。可選取的模型類型會因您選擇的模擬目標而異。

  11. 在「訓練資料」部分,執行下列任一操作:

    • 選取「資料表/檢視畫面」,從資料表或檢視畫面取得訓練資料,然後選取專案、資料集,以及檢視畫面或資料表名稱。
    • 選取「查詢」,從已儲存的查詢取得訓練資料,然後選取已儲存的查詢。
  12. 在「選取的輸入標籤資料欄」中,從表格、檢視畫面或查詢中選擇要用做模型輸入的資料欄。

  13. 如有「必要選項」部分,請指定要求的資料欄資訊:

    • 如果是分類和迴歸模型,請在「INPUT_LABEL_COLS」INPUT_LABEL_COLS中選取包含標籤資料的資料欄。
    • 如果是矩陣分解模型,請選取下列項目:

      • 在「RATING_COL」RATING_COL部分,選取包含評分資料的資料欄。
      • 在「USER_COL」USER_COL部分,選取包含使用者資料的欄。
      • 在「ITEM_COL」ITEM_COL部分,選取包含項目資料的資料欄。
    • 如果是時間序列預測模型,請選取下列項目:

      • 針對 TIME_SERIES_TIMESTAMP_COL,選取包含時間點的資料欄,用於訓練模型。
      • 在「TIME_SERIES_DATA_COL」TIME_SERIES_DATA_COL部分,選取包含要預測資料的資料欄。
  14. 選用:在「Optional」(選用) 區段中,指定其他模型微調引數的值。可用的引數會因您建立的模型類型而異。

  15. 按一下「建立模式」

  16. 模型建立完成後,按一下「前往模型」即可查看模型詳細資料。

在預先訓練的模型上建立遠端模型

請使用這個程序建立下列類型的遠端模型:

如何建立模型:

  1. 前往「BigQuery」頁面

    前往 BigQuery

  2. 在「Explorer」窗格中,按一下您建立的資料集。

  3. 按一下資料集旁的 「View actions」(查看動作),然後點選「Create BQML Model」(建立 BQML 模型)

    「建立新模型」窗格隨即開啟。

  4. 在「Model name」(模型名稱) 中,輸入模型的名稱。

  5. 如要建立包含模型 CREATE MODEL 陳述式的已儲存查詢,請選取「儲存查詢」

    1. 在「查詢名稱」中,輸入儲存查詢的名稱。
    2. 在「區域」中,選擇儲存查詢的區域。
  6. 按一下「繼續」

  7. 在「建立方法」部分,選取「連線到 Vertex AI LLM 服務和 Cloud AI 服務」

  8. 在「模型選項」頁面中,視用途選取「Google 和合作夥伴模型」或「開放模型」

  9. 在「遠端連線」部分中,執行下列任一操作:

    • 如果您已設定預設連線,或同時具備 BigQuery 管理員和專案 IAM 管理員角色,請選取「預設連線」
    • 如果沒有設定預設連線,或缺少適當的角色,請選取「Cloud resource connection」(Cloud 資源連線)

      1. 在「Project」(專案) 部分,選取要使用的連線所屬專案。
      2. 在「位置」中,選取連線使用的位置。
      3. 在「連線」部分,選取要用於遠端模型的連線,或是選取「建立新連線」來建立新連線。

  10. 在「必要選項」部分,執行下列任一操作:

    • 如要使用 Google 模型和合作夥伴模型以外的遠端模型,請指定要使用的端點。這是模型的名稱,例如 gemini-2.0-flash。如要進一步瞭解支援的模型,請參閱 ENDPOINT
    • 如果是開放模型中的遠端模型,請複製並貼上要使用的端點。這是部署至 Vertex AI 的模型共用公開端點,格式為 https://location-aiplatform.googleapis.com/v1/projects/project/locations/location/endpoints/endpoint_id。詳情請參閱 ENDPOINT 的說明。
  11. 按一下「建立模式」

  12. 模型建立完成後,按一下「前往模型」即可查看模型詳細資料。

在自訂模型上建立遠端模型

請按照這個程序,透過部署至 Vertex AI 的自訂模型建立遠端模型。

如何建立模型:

  1. 前往「BigQuery」頁面

    前往 BigQuery

  2. 在「Explorer」窗格中,按一下您建立的資料集。

  3. 按一下資料集旁的 「View actions」(查看動作),然後點選「Create BQML Model」(建立 BQML 模型)

    「建立新模型」窗格隨即開啟。

  4. 在「Model name」(模型名稱) 中,輸入模型的名稱。

  5. 如要建立包含模型 CREATE MODEL 陳述式的已儲存查詢,請選取「儲存查詢」

    1. 在「查詢名稱」中,輸入儲存查詢的名稱。
    2. 在「區域」中,選擇儲存查詢的區域。
  6. 按一下「繼續」

  7. 在「建立方法」部分,選取「連線到使用者管理的 Vertex AI 端點」

  8. 在「Model options」(模型選項) 頁面的「Remote connection」(遠端連線) 部分,執行下列其中一項操作:

    • 如果您已設定預設連線,或同時具備 BigQuery 管理員和專案 IAM 管理員角色,請選取「預設連線」
    • 如果沒有設定預設連線,或缺少適當的角色,請選取「Cloud resource connection」(Cloud 資源連線)

      1. 在「Project」(專案) 部分,選取要使用的連線所屬專案。
      2. 在「位置」中,選取連線使用的位置。
      3. 在「連線」部分,選取要用於遠端模型的連線,或是選取「建立新連線」來建立新連線。

  9. 在「Required options」(必要選項) 部分,指定要使用的端點。這是部署至 Vertex AI 的模型共用公開端點,格式為 https://location-aiplatform.googleapis.com/v1/projects/project/locations/location/endpoints/endpoint_id。詳情請參閱 ENDPOINT

  10. 按一下「建立模式」

  11. 模型建立完成後,按一下「前往模型」即可查看模型詳細資料。

透過 Cloud AI 服務建立遠端模型

使用這個程序,透過 Cloud AI 服務建立遠端模型。

如何建立模型:

  1. 前往「BigQuery」頁面

    前往 BigQuery

  2. 在「Explorer」窗格中,按一下您建立的資料集。

  3. 按一下資料集旁的 「View actions」(查看動作),然後點選「Create BQML Model」(建立 BQML 模型)

    「建立新模型」窗格隨即開啟。

  4. 在「Model name」(模型名稱) 中,輸入模型的名稱。

  5. 如要建立包含模型 CREATE MODEL 陳述式的已儲存查詢,請選取「儲存查詢」

    1. 在「查詢名稱」中,輸入儲存查詢的名稱。
    2. 在「區域」中,選擇儲存查詢的區域。
  6. 按一下「繼續」

  7. 在「建立方法」部分,選取「連線到 Vertex AI LLM 服務和 Cloud AI 服務」

  8. 在「模型選項」頁面中,選取「Cloud AI 服務」

  9. 在「遠端連線」部分中,執行下列任一操作:

    • 如果您已設定預設連線,或同時具備 BigQuery 管理員和專案 IAM 管理員角色,請選取「預設連線」
    • 如果沒有設定預設連線,或缺少適當的角色,請選取「Cloud resource connection」(Cloud 資源連線)

      1. 在「Project」(專案) 部分,選取要使用的連線所屬專案。
      2. 在「位置」中,選取連線使用的位置。
      3. 在「連線」部分,選取要用於遠端模型的連線,或是選取「建立新連線」來建立新連線。

  10. 在「Required options」(必要選項) 部分,選取要使用的 Cloud AI 服務類型。

  11. 在「選用」部分,指定使用 CLOUD_AI_DOCUMENT_V1 服務時的文件處理器資訊。如果您使用 CLOUD_AI_SPEECH_TO_TEXT_V2 服務,可以選擇指定語音辨識器資訊。

  12. 按一下「建立模式」

  13. 模型建立完成後,按一下「前往模型」即可查看模型詳細資料。

建立匯入的模型

使用這個程序匯入下列類型的模型,藉此建立 BigQuery ML 模型:

如何建立模型:

  1. 前往「BigQuery」頁面

    前往 BigQuery

  2. 在「Explorer」窗格中,按一下您建立的資料集。

  3. 按一下資料集旁的 「View actions」(查看動作),然後點選「Create BQML Model」(建立 BQML 模型)

    「建立新模型」窗格隨即開啟。

  4. 在「Model name」(模型名稱) 中,輸入模型的名稱。

  5. 如要建立包含模型 CREATE MODEL 陳述式的已儲存查詢,請選取「儲存查詢」

    1. 在「查詢名稱」中,輸入儲存查詢的名稱。
    2. 在「區域」中,選擇儲存查詢的區域。
  6. 按一下「繼續」

  7. 在「建立方法」部分,選取「匯入模型」

  8. 在「模型選項」頁面中,選取要匯入的模型類型。

  9. 在「GCS path」(GCS 路徑) 中,瀏覽或貼上包含模型的 Cloud Storage 值區 URI。

  10. 按一下「建立模式」

  11. 模型建立完成後,按一下「前往模型」即可查看模型詳細資料。