Databricks

创建 Looker 用户

Looker 通过个人访问令牌向 Databricks 进行身份验证。按照 Databricks 文档中的说明创建可供 Databricks 用户在 Looker 中使用的个人访问令牌。

使用 GRANT 为此用户添加权限。

Looker 至少应具有 SELECTREAD_METADATA

GRANT SELECT ON DATABASE <YOUR_DATABASE> TO `<looker>@<your.databricks.com>`
GRANT READ_METADATA ON DATABASE <YOUR_DATABASE> TO `<looker>@<your.databricks.com>`

服务器信息

按照 Databricks 文档中的说明查找 Databricks 集群的 HTTP 路径。在本页中,这称为 <YOUR_HTTP_PATH>

设置永久性派生表

如需使用永久性派生表,请创建单独的数据库。

CREATE DATABASE <YOUR_SCRATCH_DATABASE>

这还需要授予其他基于写入的用户权限。

GRANT SELECT CREATE MODIFY ON DATABASE <YOUR_SCRATCH_DATABASE> TO `<looker>@<your.databricks.com>`
GRANT READ_METADATA ON DATABASE <YOUR_SCRATCH_DATABASE> TO `<looker>@<your.databricks.com>`

设置 Looker 连接

Admin 面板的 Database 部分中选择 Connections。在 Connections 页面上,点击 Add Connection 按钮。Looker 会显示连接设置页面。连接设置页面中显示的字段取决于所选的方言。大多数设置是大多数数据库方言通用的,并在将 Looker 连接到数据库文档页面中进行了介绍。

  • 名称:指定连接的名称。您将以这种方式引用 LookML 项目中的连接。
  • 方言:指定方言 Databricks
  • 主机:指定主机名。
  • 端口:指定数据库端口。默认值为 443。
  • 数据库:指定数据库名称。默认值为 default
  • 用户名:输入值 token(请不要在此字段中输入 Databricks 用户电子邮件地址)。
  • Password(密码):输入之前创建的个人访问令牌。
  • Persistent Derived Tables:选中此复选框可启用持久派生表。系统随即会显示温度数据库字段和 PDT 替换列。
  • 临时数据库:输入您要用于存储 PDT 的数据库。
  • PDT Builder 最大连接数:指定此连接可能的并发 PDT build 数。将此值设为过高可能会对查询时间产生负面影响。如需了解详情,请参阅将 Looker 连接到数据库文档页面。
  • 其他参数:添加任何其他 Spark JDBC 参数

  • PDT 和数据组维护时间表:一个 cron 表达式,用于指示 Looker 应何时检查数据组和持久派生表。如需详细了解此设置,请参阅我们的 PDT 和数据组维护时间表文档。

  • SSL:选中可使用 SSL 连接。

  • Verify SSL Cert(验证 SSL 证书):选中即可强制执行严格的 SSL 证书验证。

  • 最大连接数:最初可以采用默认值。如需详细了解此设置,请参阅将 Looker 连接到数据库文档页面的最大连接数部分。

  • 连接池超时:最初可以保留默认值。如需详细了解此设置,请参阅将 Looker 连接到数据库文档页面的连接池超时部分。

  • SQL Runner Precache:如需使 SQL Runner 不预加载表信息以及仅在选定表时加载表信息,请取消选中此选项。如需详细了解此设置,请参阅将 Looker 连接到数据库文档页面的 SQL 运行程序预缓存部分。

  • 数据库时区:指定数据库中使用的时区。如果您不想转换时区,请将此字段留空。如需了解详情,请参阅使用时区设置文档页面。

点击测试这些设置以测试连接,确保配置正确。如果您看到可以连接,请按添加连接。系统会运行其余的连接测试,以验证服务帐号是否设置正确且具有适当的角色。

如需详细了解连接设置,请参阅将 Looker 连接到数据库文档页面。

功能支持

为了让 Looker 支持某些功能,您的数据库方言也必须支持这些功能。

Databricks 支持以下 Looker 功能:

后续步骤

完成数据库配置后,从 Looker 连接到数据库