加密网络流量
最佳实践是对 Looker 应用和数据库之间的网络流量进行加密。考虑启用安全的数据库访问文档页面中介绍的某个选项。
创建 Looker 用户
Looker 通过个人访问令牌向 Databricks 进行身份验证。按照 Databricks 文档创建个人访问令牌,以供 Databricks 用户在 Looker 中使用。
使用 GRANT
为此用户添加权限。
Looker 用户至少应具有 SELECT
和 READ_METADATA
。
GRANT SELECT ON DATABASE <YOUR_DATABASE> TO `<looker>@<your.databricks.com>`
GRANT READ_METADATA ON DATABASE <YOUR_DATABASE> TO `<looker>@<your.databricks.com>`
服务器信息
按照 Databricks 文档,查找 Databricks 集群的 HTTP 路径。在本页中,这称为 <YOUR_HTTP_PATH>
。
设置永久性派生表
如需使用永久性派生表,请创建一个单独的数据库。
CREATE DATABASE <YOUR_SCRATCH_DATABASE>
这还需要授予基于写入的额外用户权限。
GRANT SELECT CREATE MODIFY ON DATABASE <YOUR_SCRATCH_DATABASE> TO `<looker>@<your.databricks.com>`
GRANT READ_METADATA ON DATABASE <YOUR_SCRATCH_DATABASE> TO `<looker>@<your.databricks.com>`
创建 Looker 与数据库的连接
在 Looker 的管理部分中,选择连接,然后点击添加连接。
填写连接详情。大多数设置对大多数数据库方言是通用的。如需了解详情,请参阅将 Looker 连接到您的数据库文档页面。下面将介绍其中一些设置:
- 名称:指定连接的名称。这是您在 LookML 项目中引用连接的方式。
- 方言:指定 Databricks 方言。
- Host(主机):指定主机名。
- Port:指定数据库端口。默认值为 443。
- 数据库:指定数据库名称。默认值为
default
。 - 用户名:输入值
token
(请勿在此字段中输入 Databricks 用户电子邮件地址)。 - Password:输入之前创建的个人访问令牌。
- 启用 PDT:使用此切换开关可启用永久性派生表。启用 PDT 后,连接窗口会显示其他 PDT 设置以及 PDT 覆盖部分。
- 临时数据库:输入您要用于存储 PDT 的数据库。
- PDT 构建器连接数上限:指定此连接上可能的并发 PDT 构建数。如果设置得过高,可能会对查询时间产生不利影响。如需了解详情,请参阅将 Looker 连接到您的数据库文档页面。
其他 JDBC 参数:添加任何其他 Spark JDBC 参数。
数据组和 PDT 维护时间表:一个
cron
表达式,用于指示 Looker 应在何时检查数据组和永久性派生表。如需详细了解此设置,请参阅数据组和 PDT 维护时间表文档。SSL:选中此选项可使用 SSL 连接。
Verify SSL(验证 SSL):选中后可强制执行严格的 SSL 证书验证。
每个节点的连接数上限:您可以先将此设置保留为默认值。如需详细了解此设置,请参阅将 Looker 连接到您的数据库文档页面的每个节点的连接数上限部分。
连接池超时:您可以将此设置最初保留为默认值。如需详细了解此设置,请参阅将 Looker 连接到数据库文档页面的连接池超时部分。
SQL Runner 预缓存:要使 SQL Runner 不预加载表信息而仅在选中表时加载表信息,请取消选中此选项。如需详细了解此设置,请参阅将 Looker 连接到数据库文档页面的 SQL Runner 预缓存部分。
Database Time Zone:指定数据库中使用的时区。如果您不想进行时区转换,请将此字段留空。如需了解详情,请参阅使用时区设置文档页面。
点击测试,以测试连接并确保其配置正确无误。如果您看到可以连接,请按连接。这将运行其余的连接测试,以验证服务帐号的设置是否正确,以及角色是否正确。如需了解问题排查信息,请参阅测试数据库连接文档页面。
通过 Databricks Unity Catalog 实现 Looker 功能
对于与启用了 Unity Catalog 的 Databricks 数据库的 Looker 连接,大多数 Looker 功能将仅访问默认目录中的架构,例如在以下情况下:
- 从数据库架构生成新的 LookML 项目时,Looker 将根据 Unity Catalog 默认目录中的表创建项目文件。
- 对于现有项目,使用 Looker IDE 基于表创建视图时,Looker 只能根据 Unity Catalog 默认目录中的表创建视图文件。
- 使用 SQL Runner 时,您只能从 Unity Catalog 默认目录中选择架构。
功能支持
为了让 Looker 支持某些功能,您的数据库方言也必须支持这些功能。
从 Looker 24.6 开始,Databricks 支持以下功能:
特征 | 是否支持? |
---|---|
支持级别 | 受支持 |
Looker (Google Cloud Core) | 是 |
对称聚合 | 是 |
派生表 | 是 |
永久性 SQL 派生表 | 是 |
永久性原生派生表 | 是 |
稳定版视图 | 是 |
查询终止 | 是 |
基于 SQL 的数据透视 | 是 |
时区 | 是 |
SSL | 是 |
小计 | 是 |
JDBC 其他参数 | 是 |
区分大小写 | 是 |
位置类型 | 是 |
列表类型 | 是 |
百分位 | 是 |
非重复百分位 | 否 |
SQL Runner 显示进程 | 否 |
SQL Runner 描述表 | 是 |
SQL Runner 显示索引 | 否 |
SQL Runner 优选 10 | 是 |
SQL 运行程序数量 | 是 |
SQL 说明 | 是 |
OAuth 凭据 | 否 |
上下文注释 | 是 |
连接池 | 否 |
HLL 素描 | 否 |
总体认知度 | 是 |
递增 PDT | 是 |
毫秒 | 是 |
微秒 | 是 |
具体化视图 | 否 |
近似计数不重复 | 否 |