代管筆記本簡介
Vertex AI Workbench 代管筆記本執行個體是 Google 代管環境,整合了多項功能,可協助您設定及使用以 Jupyter 筆記本為基礎的端對端正式環境。
受管理筆記本執行個體已預先安裝 JupyterLab,以及一組深度學習套件,包括支援 TensorFlow 和 PyTorch 架構的功能。受管理筆記本執行個體支援 GPU 加速器,且可與 GitHub 存放區同步處理。代管型筆記本執行個體受到 Google Cloud 驗證和授權機制保護。
Google 管理的運算基礎架構
Vertex AI Workbench 代管型筆記本執行個體是以 Jupyter 筆記本為基礎的 Google 代管運算基礎架構。
建立代管 Notebooks 執行個體時,系統會將其部署為租戶專案中的 Google 管理虛擬機器 (VM) 執行個體。
代管型筆記本執行個體包含許多常見的資料科學架構環境,例如 TensorFlow 和 PyTorch。您也可以將自己的自訂容器映像檔新增至受管理筆記本執行個體。這些環境會以核心的形式提供,您可以在其中執行筆記本檔案。
在其中一個核心中執行筆記本時,Vertex AI Workbench 會啟動對應的容器,在容器上建立 Jupyter 工作階段,並使用該工作階段在容器上執行筆記本。
這項由 Google 管理的運算基礎架構整合了多項功能,可協助您從頭到尾實作資料科學和機器學習工作流程。詳情請參閱以下各節。
使用自訂容器
您可以將自訂 Docker 容器映像檔新增至受管理筆記本執行個體,在根據需求自訂的環境中執行筆記本程式碼。
這些自訂容器可直接從 JupyterLab 使用者介面使用,與預先安裝的架構並列。詳情請參閱「將自訂容器新增至代管筆記本執行個體」。
以筆記本為基礎的工作流程
您可以在 JupyterLab 使用者介面中,透過代管筆記本執行個體執行工作流程導向的工作。
透過 JupyterLab 控制硬體和架構
在代管型筆記本執行個體中,您可以在 JupyterLab 使用者介面中,指定程式碼要使用的運算資源。舉例來說,您可以設定所需的 vCPU 或 GPU 數量、RAM 容量,以及要執行程式碼的架構。您可以先編寫程式碼,然後選擇執行方式,不必離開 JupyterLab 或重新啟動執行個體。如要快速測試程式碼,可以縮減硬體規模,然後再擴大,以便針對更多資料執行程式碼。
存取資料
不必離開 JupyterLab 使用者介面,也能存取資料。
在受管理筆記本執行個體的 JupyterLab 導覽選單中,您可以使用 Cloud Storage 整合功能,瀏覽您有權存取的資料和其他檔案。請參閱「從 JupyterLab 存取 Cloud Storage bucket 和檔案」。
您也可以使用 BigQuery 整合功能瀏覽可存取的資料表、編寫查詢、預覽結果,以及將資料載入筆記本。請參閱在 JupyterLab 內查詢 BigQuery 表格中的資料。
執行筆記本執行作業
使用執行器執行筆記本檔案, 可一次性執行或依排程執行。 選擇要執行作業的特定環境和硬體。筆記本的程式碼會在 Vertex AI 自訂訓練中執行,方便您進行分散式訓練、最佳化超參數,或排定持續訓練工作。請參閱使用執行器執行筆記本檔案。
您可以在執行作業時使用參數,針對每次執行進行特定變更。舉例來說,您可以指定要使用的其他資料集、變更模型的學習率,或是變更模型版本。
您也可以設定筆記本,以週期性時間表執行。 即使執行個體已關閉,Vertex AI Workbench 仍會執行筆記本檔案並儲存結果,供您查看及與他人分享。
分享洞察資料
執行過的筆記本會儲存在 Cloud Storage bucket 中,因此您可以授予結果存取權,與他人分享洞察資料。請參閱上節的筆記本執行作業。
保護執行個體
您可以透過預設的 Google 代管網路部署受管理筆記本執行個體,該網路會使用預設的虛擬私有雲網路和子網路。您可以指定要與執行個體搭配使用的虛擬私有雲網路,而非預設網路。詳情請參閱「設定網路」。您可以使用 VPC Service Controls,為受管理筆記本執行個體提供額外的安全防護。
如要在服務範圍內使用代管筆記本,請參閱「在服務範圍內使用代管筆記本執行個體」。
根據預設, Google Cloud 系統會使用 Google 代管的加密金鑰,在資料處於靜態狀態時自動加密。如果您在保護資料的金鑰方面有特定的法規遵循或監管要求,可以搭配受管理筆記本執行個體使用客戶自行管理的加密金鑰 (CMEK)。詳情請參閱「使用客戶管理式加密金鑰」。
自動關閉閒置執行個體
為協助控管成本,代管型筆記本執行個體預設會在閒置一段時間後關閉。你可以變更時間長度或關閉這項功能。詳情請參閱「閒置關機」。
整合 Dataproc
您可以在 Dataproc 叢集中執行筆記本,快速處理資料。設定叢集後,您可以在 JupyterLab 使用者介面中執行筆記本檔案。詳情請參閱「在 Dataproc 叢集中執行代管型筆記本執行個體」。
限制
規劃專案時,請注意下列受管理筆記本的限制:
代管筆記本執行個體由 Google 管理,因此與 Vertex AI Workbench 使用者管理的筆記本執行個體相比,自訂程度較低。使用者自行管理的筆記本執行個體,更適合需要大量控管環境的使用者。詳情請參閱使用者管理筆記本簡介。
系統不支援第三方 JupyterLab 擴充功能。
代管筆記本不支援 Dataproc JupyterLab 外掛程式,但您可以在 Vertex AI Workbench 執行個體中使用該外掛程式。請參閱建立已啟用 Dataproc 的執行個體。
受管理筆記本執行個體不允許使用者擁有
sudo
存取權。使用 Access Context Manager 和 Chrome Enterprise Premium,透過情境感知存取權控管措施保護受管理 Notebook 執行個體時,系統會在使用者每次驗證執行個體時評估存取權。舉例來說,系統會在使用者首次存取 JupyterLab 時評估存取權,如果網頁瀏覽器的 Cookie 已過期,則每次存取時都會評估。
如要在受管理筆記本執行個體中使用加速器,您想要的加速器類型必須可在執行個體所在區域使用。如要瞭解各區域的加速器供應情形,請參閱 GPU 區域和區域供應情形。