创建笔记本
本文档介绍了如何创建 BigQuery 中的 Colab Enterprise 笔记本。笔记本是由 Dataform 提供支持的 BigQuery Studio 代码资源。
须知事项
- 登录您的 Google Cloud 账号。如果您是 Google Cloud 新手,请创建一个账号来评估我们的产品在实际场景中的表现。新客户还可获享 $300 赠金,用于运行、测试和部署工作负载。
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Enable the BigQuery API.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Enable the BigQuery API.
启用 BigQuery Studio
按照启用 BigQuery Studio 进行资产管理中的说明以保存、共享和管理代码资产(例如笔记本)版本。
所需权限
设置适当的权限以创建、修改或查看笔记本。
具有 Dataform Admin (roles/dataform.admin
) 角色的所有用户都可以访问在项目中创建的所有笔记本。
如需详细了解 BigQuery Identity and Access Management (IAM),请参阅使用 IAM 进行访问权限控制。
创建笔记本的权限
如需创建和运行笔记本,您需要以下 IAM 权限:
resourcemanager.projects.get
resourcemanager.projects.list
bigquery.config.get
bigquery.jobs.create
bigquery.readsessions.create
bigquery.readsessions.getData
bigquery.readsessions.update
resourcemanager.projects.get
resourcemanager.projects.list
dataform.locations.get
dataform.locations.list
dataform.repositories.create
dataform.repositories.list
dataform.collections.create
dataform.collections.list
aiplatform.notebookRuntimeTemplates.apply
aiplatform.notebookRuntimeTemplates.get
aiplatform.notebookRuntimeTemplates.list
aiplatform.notebookRuntimeTemplates.getIamPolicy
aiplatform.notebookRuntimes.assign
aiplatform.notebookRuntimes.get
aiplatform.notebookRuntimes.list
aiplatform.operations.list
您可以从以下 IAM 角色获取这些权限:
- BigQuery Read Session User (
roles/bigquery.readSessionUser
) BigQuery Studio User (
roles/bigquery.studioUser
)BigQuery Studio User 角色包含以下 IAM 角色:
修改笔记本的权限
如需编辑和运行笔记本,您需要以下 IAM 角色:
- BigQuery Job User (
roles/bigquery.jobUser
) - BigQuery Read Session User (
roles/bigquery.readSessionUser
) - Notebook Runtime User (
roles/aiplatform.notebookRuntimeUser
) - Code Editor (
roles/dataform.codeEditor
)
查看笔记本的权限
如需查看和运行笔记本,您需要以下 IAM 角色:
- BigQuery Job User (
roles/bigquery.jobUser
) - BigQuery Read Session User (
roles/bigquery.readSessionUser
) - Notebook Runtime User (
roles/aiplatform.notebookRuntimeUser
) - Code Viewer (
roles/dataform.codeViewer
)
创建笔记本
请参阅以下部分,了解如何创建笔记本。
设置代码资源的默认区域
如果这是您第一次创建代码资源,请设置代码资源的默认区域。代码资源创建后,便无法更改该区域。
从 BigQuery 编辑器创建笔记本
如需创建包含给定表的默认查询的笔记本,请按照以下步骤操作:
转到 BigQuery 页面。
在编辑器窗格的标签页栏中,点击 + 号旁边的
下拉箭头,然后点击编写新的 Python 笔记本。系统会打开新的笔记本,其中包含显示针对
bigquery-public-data.ml_datasets.penguins
公共数据集的查询示例的单元格。
从表创建笔记本
如需创建包含特定表的默认查询的笔记本,请按照以下步骤操作:
转到 BigQuery 页面。
在探索器窗格中,展开您的项目并找到要查询的表。
点击表旁边的> Python 笔记本。
查看操作,然后点击查询位置系统会打开新的笔记本,其中包含显示针对所选表的查询示例的单元格。
创建笔记本以探索查询结果集
如需创建笔记本以探索查询结果集,请按照以下步骤操作:
转到 BigQuery 页面。
在编辑器窗格中,运行一个生成查询结果的查询。
在查询结果窗格中,点击探索数据,然后点击使用 Python 笔记本探索。
系统会打开新笔记本,其中的单元格含有用于返回查询 SQL 和查询结果的代码。
通过现有笔记本创建笔记本
如需将现有笔记本的任何版本作为新笔记本打开,请按照以下步骤操作:
在 Google Cloud 控制台中,转到 BigQuery 页面。
在探索器窗格中,展开您的项目和笔记本文件夹,然后根据需要展开共享笔记本文件夹。选择笔记本。
选择活动窗格。
点击笔记本版本旁边的
查看操作,然后点击作为新 Python 笔记本打开。笔记本的副本将作为新笔记本打开。
上传笔记本
您可以上传本地笔记本,以便在 BigQuery Studio 中使用。上传的笔记本随后会显示在 Google Cloud 控制台的 BigQuery 页面中。
如需上传笔记本,请按照以下步骤操作:
在 Google Cloud 控制台中,转到 BigQuery 页面。
在探索器窗格中,展开您的项目,然后执行以下操作之一:
- 在笔记本旁边,点击 > 上传到笔记本。 查看操作
- 在 Google Cloud 项目名称旁边,点击 > 上传到项目 > Python 笔记本。 查看操作
在上传笔记本对话框的笔记本字段中,点击浏览,然后选择您要上传的笔记本。
可选:在笔记本名称字段中,修改笔记本的名称。
在区域字段中,选择要在其中上传笔记本的区域。
点击上传。
您的笔记本会显示在探索器窗格中。
连接到运行时
请参阅以下部分,了解如何将笔记本连接到 Vertex AI 运行时。运行时是运行笔记本中代码的计算资源。
连接到默认运行时
默认运行时是一个需要最低设置的预设运行时。
如需连接到默认运行时,请按照以下步骤操作:
在 Google Cloud 控制台中,转到 BigQuery 页面。
在探索器窗格中,展开您的项目和笔记本文件夹,然后根据需要展开共享笔记本文件夹。点击笔记本的名称将其打开。
在笔记本中,点击连接,或运行笔记本中的任何单元。
如果尚无活跃运行时,则可能需要几分钟时间才能连接到默认运行时。
连接到非默认运行时
如果要使用默认运行时以外的运行时,则必须在 Vertex AI 中创建该额外运行时。
如需连接到非默认运行时,请按照以下步骤操作:
在 Google Cloud 控制台中,转到 BigQuery 页面。
在探索器窗格中,展开您的项目和笔记本文件夹,然后根据需要展开共享笔记本文件夹。点击笔记本的名称将其打开。
在笔记本中,点击连接旁边的
下拉列表,然后点击连接到运行时。点击连接到现有运行时。
在运行时中,选择要使用的运行时。
点击连接。
连接到新的运行时
如需连接到新的运行时,请按照以下步骤操作:
在 Google Cloud 控制台中,转到 BigQuery 页面。
在探索器窗格中,展开您的项目和笔记本文件夹,然后根据需要展开共享笔记本文件夹。点击笔记本的名称将其打开。
在笔记本中,点击连接旁边的
下拉列表,然后点击连接到运行时。点击新建运行时。
在运行时模板中,选择要使用的 Vertex AI 运行时模板。
在运行时名称中,输入运行时的名称。
点击连接。
授予对笔记本的访问权限
若要向其他用户授予对笔记本的访问权限,请将这些用户添加到相应的 IAM 角色。
在 Google Cloud 控制台中,转到 BigQuery 页面。
在探索器窗格中,展开您的项目和笔记本文件夹,然后根据需要展开共享笔记本文件夹。找到您要授予其访问权限的笔记本。
点击笔记本旁边的 > 管理权限。
查看操作,然后点击共享在管理权限窗格中,点击添加用户/群组。
在新的主账号字段中,输入主账号。
在角色列表中,选择以下角色之一:
- Code Owner:可以对笔记本执行任何操作,包括删除或共享笔记本。
- Code Editor:可以修改笔记本。
- Code Viewer:可以查看笔记本。
可选:如需查看角色和高级共享设置的完整列表,请点击高级共享。
点击保存。
如需返回笔记本信息页面,请点击关闭。
共享笔记本
如需与其他用户共享笔记本,您可以生成并共享该笔记本的链接。如需让其他用户查看您共享的笔记本,您必须先授予对笔记本的访问权限。
如需运行笔记本,用户必须有权访问笔记本所访问的数据。如需了解详情,请参阅授予对数据集的访问权限。
在 Google Cloud 控制台中,转到 BigQuery 页面。
在探索器窗格中,展开您的项目和笔记本文件夹,然后根据需要展开共享笔记本文件夹。找到您要共享的笔记本。
点击笔记本旁边的 > 复制链接。
查看操作,然后点击共享与其他用户共享该链接。
停用笔记本输出保存
您可以通过停用笔记本输出保存来阻止与有权访问笔记本文件的其他用户共享保存的笔记本输出。
为所选笔记本停用输出保存功能后,BigQuery 会删除笔记本文件中保存的所有输出,且不会保存后续运行的输出。
但是,具有笔记本访问权限的用户仍可以通过以下方式查看其输出:
- 运行笔记本以查看其当前输出。此输出不保存。
- 在修订历史记录中查看笔记本的归档版本及其输出。
如需为所选笔记本停用输出保存功能,请按以下步骤操作:
在 Google Cloud 控制台中,转到 BigQuery 页面。
在探索器窗格中,展开您的项目和笔记本文件夹,然后选择要对其停用保存输出功能的笔记本。
点击 > 修改 > 笔记本设置。
显示/隐藏标题在笔记本设置窗口中,选择保存此笔记本时忽略代码单元格输出项。
点击保存。
点击重新加载。
解决冲突
如果您和其他用户在笔记本中进行了有冲突的更改,该服务会引发错误 Automatic saving failed. This file was updated remotely or
in another tab.
,并提供 Show diff
链接。要解决此冲突,请按以下步骤操作:
- 点击
Show diff
链接。此时会打开查看远程更改对话框。 - 可选:如需比较笔记本源代码,请选中原始源代码复选框。
- 可选:如需以内嵌方式(而不是在单独的窗格中)比较版本,请选中内嵌差异复选框。
- 查看这些更改并决定保留哪个更改,如有必要,则修改您的输入。
- 点击保存更改。
重命名笔记本
要重命名笔记本,请按以下步骤操作:
在 Google Cloud 控制台中,转到 BigQuery 页面。
在探索器窗格中,展开您的项目和笔记本文件夹,然后根据需要展开共享笔记本文件夹。找到您要重命名的笔记本。
点击笔记本旁边的
查看操作,然后点击重命名。输入笔记本的名称,然后点击重命名。
问题排查
如需了解详情,请参阅排查 Colab Enterprise 问题。
后续步骤
- 了解如何管理笔记本。