Databricks

ネットワークトラフィックの暗号化

Looker アプリケーションとデータベース間のネットワーク トラフィックを暗号化することをおすすめします。セキュアなデータベースアクセスを可能にするドキュメント ページに記載されているオプションのいずれかを検討してください。

Looker ユーザーを作成する

Looker は、個人用のアクセス トークンによって Databricks の認証を行います。Databricks のドキュメントに従って、Databricks ユーザーが Looker で使用する個人用のアクセス トークンを作成します。

GRANT を使用して、このユーザーに権限を追加します。

少なくとも、Looker ユーザーには SELECTREAD_METADATA が必要です。

GRANT SELECT ON DATABASE <YOUR_DATABASE> TO `<looker>@<your.databricks.com>`
GRANT READ_METADATA ON DATABASE <YOUR_DATABASE> TO `<looker>@<your.databricks.com>`

サーバー情報

Databricks のドキュメントを参照して、Databricks クラスタの HTTP パスを探します。このページでは、<YOUR_HTTP_PATH> とします。

永続的な派生テーブルの設定

永続的な派生テーブルを使用するには、別のデータベースを作成します。

CREATE DATABASE <YOUR_SCRATCH_DATABASE>

これには、追加の書き込みベースのユーザー権限も付与する必要があります。

GRANT SELECT CREATE MODIFY ON DATABASE <YOUR_SCRATCH_DATABASE> TO `<looker>@<your.databricks.com>`
GRANT READ_METADATA ON DATABASE <YOUR_SCRATCH_DATABASE> TO `<looker>@<your.databricks.com>`

データベースへの Looker 接続の作成

Looker の [管理者] セクションで [接続] を選択し、[新しい接続] をクリックします。

接続の詳細を入力します。設定の大部分は、ほとんどのデータベース言語に共通するものです。詳細については、Looker をデータベースに接続するのドキュメント ページをご覧ください。設定の一部を次に説明します。

  • 名前: 接続の名前を指定します。LookML プロジェクトでこの接続を参照する際に使用します。
  • 言語: 言語 Databricks を指定します。
  • ホスト: ホスト名を指定します。
  • ポート: データベース ポートを指定します。デフォルト値は 443 です。
  • データベース: データベース名を指定します。デフォルトは default です。
  • ユーザー名: 値「token」を入力します(このフィールドに Databricks ユーザーのメールアドレスは入力しないでください)。
  • パスワード: 前の手順で作成した個人用アクセス トークンを入力します。
  • PDT を有効にする: 有効にするには、この切り替えボタンを使用して永続的な派生テーブルを有効にします。PDT が有効になると、追加の PDT 設定と [PDT オーバーライド]が [接続] ウィンドウに表示されます。
  • 一時データベース: PDT の保存に使用するデータベースを入力します。
  • PDT ビルダー接続の最大数: この接続で同時に可能な PDT ビルドの数を指定します。この値を大きく設定しすぎると、クエリ時間に悪影響を及ぼす可能性があります。詳細については、Looker をデータベースに接続のドキュメント ページをご覧ください。
  • その他の JDBC パラメータ: その他の Spark JDBC パラメータを追加します。

  • データグループと PDT メンテナンス スケジュール: cron 式。Looker がいつデータグループと永続的な派生テーブルを確認するかを示します。この設定の詳細については、データグループと PDT のメンテナンス スケジュールのドキュメントをご覧ください。

  • SSL: SSL 接続を使用する場合にオンにします。

  • SSL の検証: 厳格な SSL 証明書の適用を確認します。

  • ノードあたりの最大接続数: この設定は、最初はデフォルト値のままで問題ありません。この設定の詳細については、Looker をデータベースに接続するドキュメント ページのノードごとの最大接続数セクションをご覧ください。

  • 接続プールのタイムアウト: この設定は、最初はデフォルト値のままで問題ありません。この設定の詳細については、Looker をデータベースに接続するのドキュメント ページの接続プールのタイムアウトのセクションをご覧ください。

  • SQL Runner Precache: SQL Runner でテーブルの情報を事前に読み込まず、テーブルを選択したときにのみテーブルの情報が読み込まれるようにするには、このオプションをオフにします。この設定の詳細については、Looker をデータベースに接続するのドキュメント ページの SQL Runner の事前キャッシュのセクションをご覧ください。

  • データベースのタイムゾーン: データベースで使用されるタイムゾーンを指定します。タイムゾーン変換を希望しない場合は、このフィールドを空白のままにします。詳しくは、タイムゾーン設定の使用のドキュメント ページをご覧ください。

[テスト] をクリックして接続をテストし、正しく構成されていることを確認します。[接続可能] と表示されたら、[接続] を押します。残りの接続テストが実行され、サービスアカウントが適切なロールで正常に設定されたことを検証します。トラブルシューティング情報については、データベース接続のテストのドキュメント ページをご覧ください。

Databricks Unity Catalog を使用した Looker 機能

Unity Catalog が有効になっている Databricks データベースに Looker を接続する場合、次のシナリオのように、ほとんどの Looker 機能がデフォルトのカタログからのみスキーマにアクセスします。

  • データベース スキーマから新しい LookML プロジェクトを生成する場合、Looker では Unity Catalog のデフォルト カタログのテーブルに基づいてプロジェクト ファイルを作成します。
  • 既存のプロジェクトの場合、Looker IDE を使用してテーブルからビューを作成する場合、Looker では Unity Catalog のデフォルト カタログのテーブルからのみビューファイルを作成できます。
  • SQL Runner を使用する場合は、Unity Catalog のデフォルト カタログからスキーマのみを選択できます。

機能のサポート

一部の機能については、Looker でサポートするには、データベース言語が同じ機能に対応している必要があります。

Databricks では、Looker 24.6 の時点で、次の機能がサポートされています。

特徴 サポート対象
サポート レベル
サポート対象
Looker(Google Cloud コア)
はい
対称集計
あり
派生テーブル
あり
永続的な SQL 派生テーブル
あり
永続的なネイティブ派生テーブル
あり
安定したビュー
あり
クエリの強制終了
あり
SQL ベースのピボット
あり
タイムゾーン
あり
SSL
あり
Subtotals
あり
JDBC の追加パラメータ
あり
Case Sensitive
あり
ロケーション タイプ
あり
リストのタイプ
あり
パーセンタイル
あり
個別のパーセンタイル
いいえ
SQL Runner の表示プロセス
いいえ
SQL Runner の説明テーブル
あり
SQL Runner 表示インデックス
いいえ
SQL Runner Select 10
あり
SQL ランナーの数
あり
SQL の説明
あり
Oauth 認証情報
いいえ
コンテキスト コメント
あり
接続プーリング
いいえ
HLL スケッチ
いいえ
集計認識
あり
増分PDT
あり
ミリ秒
あり
マイクロ秒
あり
マテリアライズド ビュー
いいえ
Approximate Count Distinct
いいえ