使用 Google Cloud 控制台在 BigQuery ML 中建立機器學習模型
本文說明如何使用 Google Cloud 控制台建立 BigQuery ML 模型。
必要的角色
如要建立模型及執行推論,您必須具備下列角色:
- BigQuery 資料編輯者 (
roles/bigquery.dataEditor
) - BigQuery 使用者 (
roles/bigquery.user
)
- BigQuery 資料編輯者 (
事前準備
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the BigQuery and BigQuery Connection APIs.
特定機型的必要條件
建立模型前,請務必先滿足所建模型類型的所有必要條件:
如要使用查詢選取模型的訓練資料,您必須將該查詢儲存為已儲存的查詢。
矩陣分解模型需要預訂。詳情請參閱「定價」。
下列遠端模型需要Cloud 資源連線:
此外,您也必須根據遠端模型的類型,為連線的服務帳戶授予特定角色。
如要匯入模型,必須先將模型上傳至 Cloud Storage 值區。
建立資料集
建立 BigQuery 資料集來存放資源:
控制台
前往 Google Cloud 控制台的「BigQuery」頁面。
在「Explorer」窗格中,按一下專案名稱。
依序點按
「View actions」(查看動作) >「Create dataset」(建立資料集)。在「建立資料集」頁面中,執行下列操作:
在「Dataset ID」(資料集 ID) 部分,輸入資料集的名稱。
在「位置類型」部分,選取資料集的位置。
點選「建立資料集」。
bq
建立內部或外部訓練的模型
您可以使用這個程序建立下列類型的模型:
這些模型會根據類型提供不同的選項組合。雖然 BigQuery ML 自動調整功能在大多數情況下都能正常運作,但您也可以選擇在程序中手動調整模型。如要這麼做,請參閱特定模型類型的說明文件,進一步瞭解模型選項。
如何建立模型:
前往「BigQuery」頁面
在「Explorer」窗格中,按一下您建立的資料集。
按一下資料集旁的
「View actions」(查看動作),然後點選「Create BQML Model」(建立 BQML 模型)。「建立新模型」窗格隨即開啟。
在「Model name」(模型名稱) 中,輸入模型的名稱。
如要建立包含模型
CREATE MODEL
陳述式的已儲存查詢,請選取「儲存查詢」。- 在「查詢名稱」中,輸入儲存查詢的名稱。
- 在「區域」中,選擇儲存查詢的區域。
按一下「繼續」。
在「建立方法」部分,選取「在 BigQuery 中訓練模型」。
在「模型目標」部分,選取模型的模型目標。
按一下「繼續」。
在「模型選項」頁面中,選取模型類型。可選取的模型類型會因您選擇的模擬目標而異。
在「訓練資料」部分,執行下列任一操作:
- 選取「資料表/檢視畫面」,從資料表或檢視畫面取得訓練資料,然後選取專案、資料集,以及檢視畫面或資料表名稱。
- 選取「查詢」,從已儲存的查詢取得訓練資料,然後選取已儲存的查詢。
在「選取的輸入標籤資料欄」中,從表格、檢視畫面或查詢中選擇要用做模型輸入的資料欄。
如有「必要選項」部分,請指定要求的資料欄資訊:
- 如果是分類和迴歸模型,請在「INPUT_LABEL_COLS」INPUT_LABEL_COLS中選取包含標籤資料的資料欄。
如果是矩陣分解模型,請選取下列項目:
- 在「RATING_COL」RATING_COL部分,選取包含評分資料的資料欄。
- 在「USER_COL」USER_COL部分,選取包含使用者資料的欄。
- 在「ITEM_COL」ITEM_COL部分,選取包含項目資料的資料欄。
如果是時間序列預測模型,請選取下列項目:
- 針對 TIME_SERIES_TIMESTAMP_COL,選取包含時間點的資料欄,用於訓練模型。
- 在「TIME_SERIES_DATA_COL」TIME_SERIES_DATA_COL部分,選取包含要預測資料的資料欄。
選用:在「Optional」(選用) 區段中,指定其他模型微調引數的值。可用的引數會因您建立的模型類型而異。
按一下「建立模式」。
模型建立完成後,按一下「前往模型」即可查看模型詳細資料。
在預先訓練的模型上建立遠端模型
請使用這個程序建立下列類型的遠端模型:
如何建立模型:
前往「BigQuery」頁面
在「Explorer」窗格中,按一下您建立的資料集。
按一下資料集旁的
「View actions」(查看動作),然後點選「Create BQML Model」(建立 BQML 模型)。「建立新模型」窗格隨即開啟。
在「Model name」(模型名稱) 中,輸入模型的名稱。
如要建立包含模型
CREATE MODEL
陳述式的已儲存查詢,請選取「儲存查詢」。- 在「查詢名稱」中,輸入儲存查詢的名稱。
- 在「區域」中,選擇儲存查詢的區域。
按一下「繼續」。
在「建立方法」部分,選取「連線到 Vertex AI LLM 服務和 Cloud AI 服務」。
在「模型選項」頁面中,視用途選取「Google 和合作夥伴模型」或「開放模型」。
在「遠端連線」部分中,執行下列任一操作:
- 如果您已設定預設連線,或同時具備 BigQuery 管理員和專案 IAM 管理員角色,請選取「預設連線」。
如果沒有設定預設連線,或缺少適當的角色,請選取「Cloud resource connection」(Cloud 資源連線)。
- 在「Project」(專案) 部分,選取要使用的連線所屬專案。
- 在「位置」中,選取連線使用的位置。
在「連線」部分,選取要用於遠端模型的連線,或是選取「建立新連線」來建立新連線。
在「必要選項」部分,執行下列任一操作:
按一下「建立模式」。
模型建立完成後,按一下「前往模型」即可查看模型詳細資料。
在自訂模型上建立遠端模型
請按照這個程序,透過部署至 Vertex AI 的自訂模型建立遠端模型。
如何建立模型:
前往「BigQuery」頁面
在「Explorer」窗格中,按一下您建立的資料集。
按一下資料集旁的
「View actions」(查看動作),然後點選「Create BQML Model」(建立 BQML 模型)。「建立新模型」窗格隨即開啟。
在「Model name」(模型名稱) 中,輸入模型的名稱。
如要建立包含模型
CREATE MODEL
陳述式的已儲存查詢,請選取「儲存查詢」。- 在「查詢名稱」中,輸入儲存查詢的名稱。
- 在「區域」中,選擇儲存查詢的區域。
按一下「繼續」。
在「建立方法」部分,選取「連線到使用者管理的 Vertex AI 端點」。
在「Model options」(模型選項) 頁面的「Remote connection」(遠端連線) 部分,執行下列其中一項操作:
- 如果您已設定預設連線,或同時具備 BigQuery 管理員和專案 IAM 管理員角色,請選取「預設連線」。
如果沒有設定預設連線,或缺少適當的角色,請選取「Cloud resource connection」(Cloud 資源連線)。
- 在「Project」(專案) 部分,選取要使用的連線所屬專案。
- 在「位置」中,選取連線使用的位置。
在「連線」部分,選取要用於遠端模型的連線,或是選取「建立新連線」來建立新連線。
在「Required options」(必要選項) 部分,指定要使用的端點。這是部署至 Vertex AI 的模型共用公開端點,格式為
https://location-aiplatform.googleapis.com/v1/projects/project/locations/location/endpoints/endpoint_id
。詳情請參閱ENDPOINT
。按一下「建立模式」。
模型建立完成後,按一下「前往模型」即可查看模型詳細資料。
透過 Cloud AI 服務建立遠端模型
使用這個程序,透過 Cloud AI 服務建立遠端模型。
如何建立模型:
前往「BigQuery」頁面
在「Explorer」窗格中,按一下您建立的資料集。
按一下資料集旁的
「View actions」(查看動作),然後點選「Create BQML Model」(建立 BQML 模型)。「建立新模型」窗格隨即開啟。
在「Model name」(模型名稱) 中,輸入模型的名稱。
如要建立包含模型
CREATE MODEL
陳述式的已儲存查詢,請選取「儲存查詢」。- 在「查詢名稱」中,輸入儲存查詢的名稱。
- 在「區域」中,選擇儲存查詢的區域。
按一下「繼續」。
在「建立方法」部分,選取「連線到 Vertex AI LLM 服務和 Cloud AI 服務」。
在「模型選項」頁面中,選取「Cloud AI 服務」。
在「遠端連線」部分中,執行下列任一操作:
- 如果您已設定預設連線,或同時具備 BigQuery 管理員和專案 IAM 管理員角色,請選取「預設連線」。
如果沒有設定預設連線,或缺少適當的角色,請選取「Cloud resource connection」(Cloud 資源連線)。
- 在「Project」(專案) 部分,選取要使用的連線所屬專案。
- 在「位置」中,選取連線使用的位置。
在「連線」部分,選取要用於遠端模型的連線,或是選取「建立新連線」來建立新連線。
在「Required options」(必要選項) 部分,選取要使用的 Cloud AI 服務類型。
在「選用」部分,指定使用
CLOUD_AI_DOCUMENT_V1
服務時的文件處理器資訊。如果您使用CLOUD_AI_SPEECH_TO_TEXT_V2
服務,可以選擇指定語音辨識器資訊。按一下「建立模式」。
模型建立完成後,按一下「前往模型」即可查看模型詳細資料。
建立匯入的模型
使用這個程序匯入下列類型的模型,藉此建立 BigQuery ML 模型:
如何建立模型:
前往「BigQuery」頁面
在「Explorer」窗格中,按一下您建立的資料集。
按一下資料集旁的
「View actions」(查看動作),然後點選「Create BQML Model」(建立 BQML 模型)。「建立新模型」窗格隨即開啟。
在「Model name」(模型名稱) 中,輸入模型的名稱。
如要建立包含模型
CREATE MODEL
陳述式的已儲存查詢,請選取「儲存查詢」。- 在「查詢名稱」中,輸入儲存查詢的名稱。
- 在「區域」中,選擇儲存查詢的區域。
按一下「繼續」。
在「建立方法」部分,選取「匯入模型」。
在「模型選項」頁面中,選取要匯入的模型類型。
在「GCS path」(GCS 路徑) 中,瀏覽或貼上包含模型的 Cloud Storage 值區 URI。
按一下「建立模式」。
模型建立完成後,按一下「前往模型」即可查看模型詳細資料。