Databricks

加密网络流量

最佳实践是对 Looker 应用和数据库之间的网络流量进行加密。考虑启用安全的数据库访问文档页面中介绍的某个选项。

创建 Looker 用户

Looker 通过个人访问令牌向 Databricks 进行身份验证。按照 Databricks 文档创建个人访问令牌,以供 Databricks 用户在 Looker 中使用。

使用 GRANT 为此用户添加权限。

Looker 用户至少应具有 SELECTREAD_METADATA

GRANT SELECT ON DATABASE <YOUR_DATABASE> TO `<looker>@<your.databricks.com>`
GRANT READ_METADATA ON DATABASE <YOUR_DATABASE> TO `<looker>@<your.databricks.com>`

服务器信息

按照 Databricks 文档,查找 Databricks 集群的 HTTP 路径。在本页中,这称为 <YOUR_HTTP_PATH>

设置永久性派生表

如需使用永久性派生表,请创建一个单独的数据库。

CREATE DATABASE <YOUR_SCRATCH_DATABASE>

这还需要授予基于写入的额外用户权限。

GRANT SELECT CREATE MODIFY ON DATABASE <YOUR_SCRATCH_DATABASE> TO `<looker>@<your.databricks.com>`
GRANT READ_METADATA ON DATABASE <YOUR_SCRATCH_DATABASE> TO `<looker>@<your.databricks.com>`

创建 Looker 与数据库的连接

在 Looker 的管理部分中,选择连接,然后点击添加连接

填写连接详情。大多数设置对大多数数据库方言是通用的。如需了解详情,请参阅将 Looker 连接到您的数据库文档页面。下面将介绍其中一些设置:

  • 名称:指定连接的名称。这是您在 LookML 项目中引用连接的方式。
  • 方言:指定 Databricks 方言。
  • Host(主机):指定主机名。
  • Port:指定数据库端口。默认值为 443。
  • 数据库:指定数据库名称。默认值为 default
  • 用户名:输入值 token(请勿在此字段中输入 Databricks 用户电子邮件地址)。
  • Password:输入之前创建的个人访问令牌。
  • 启用 PDT:使用此切换开关可启用永久性派生表。启用 PDT 后,连接窗口会显示其他 PDT 设置以及 PDT 覆盖部分。
  • 临时数据库:输入您要用于存储 PDT 的数据库。
  • PDT 构建器连接数上限:指定此连接上可能的并发 PDT 构建数。如果设置得过高,可能会对查询时间产生不利影响。如需了解详情,请参阅将 Looker 连接到您的数据库文档页面。
  • 其他 JDBC 参数:添加任何其他 Spark JDBC 参数

  • 数据组和 PDT 维护时间表:一个 cron 表达式,用于指示 Looker 应在何时检查数据组和永久性派生表。如需详细了解此设置,请参阅数据组和 PDT 维护时间表文档。

  • SSL:选中此选项可使用 SSL 连接。

  • Verify SSL(验证 SSL):选中后可强制执行严格的 SSL 证书验证。

  • 每个节点的连接数上限:您可以先将此设置保留为默认值。如需详细了解此设置,请参阅将 Looker 连接到您的数据库文档页面的每个节点的连接数上限部分。

  • 连接池超时:您可以将此设置最初保留为默认值。如需详细了解此设置,请参阅将 Looker 连接到数据库文档页面的连接池超时部分。

  • SQL Runner 预缓存:要使 SQL Runner 不预加载表信息而仅在选中表时加载表信息,请取消选中此选项。如需详细了解此设置,请参阅将 Looker 连接到数据库文档页面的 SQL Runner 预缓存部分。

  • Database Time Zone:指定数据库中使用的时区。如果您不想进行时区转换,请将此字段留空。如需了解详情,请参阅使用时区设置文档页面。

点击测试,以测试连接并确保其配置正确无误。如果您看到可以连接,请按连接。这将运行其余的连接测试,以验证服务帐号的设置是否正确,以及角色是否正确。如需了解问题排查信息,请参阅测试数据库连接文档页面。

通过 Databricks Unity Catalog 实现 Looker 功能

对于与启用了 Unity Catalog 的 Databricks 数据库的 Looker 连接,大多数 Looker 功能将仅访问默认目录中的架构,例如在以下情况下:

  • 从数据库架构生成新的 LookML 项目时,Looker 将根据 Unity Catalog 默认目录中的表创建项目文件。
  • 对于现有项目,使用 Looker IDE 基于表创建视图时,Looker 只能根据 Unity Catalog 默认目录中的表创建视图文件。
  • 使用 SQL Runner 时,您只能从 Unity Catalog 默认目录中选择架构。

功能支持

为了让 Looker 支持某些功能,您的数据库方言也必须支持这些功能。

从 Looker 24.6 开始,Databricks 支持以下功能:

特征 是否支持?
支持级别
受支持
Looker (Google Cloud Core)
对称聚合
派生表
永久性 SQL 派生表
永久性原生派生表
稳定版视图
查询终止
基于 SQL 的数据透视
时区
SSL
小计
JDBC 其他参数
区分大小写
位置类型
列表类型
百分位
非重复百分位
SQL Runner 显示进程
SQL Runner 描述表
SQL Runner 显示索引
SQL Runner 优选 10
SQL 运行程序数量
SQL 说明
OAuth 凭据
上下文注释
连接池
HLL 素描
总体认知度
递增 PDT
毫秒
微秒
具体化视图
近似计数不重复