Databricks

Looker ユーザーの作成

Looker は、個人用のアクセス トークンによって Databricks の認証を行います。Databricks のドキュメントに沿って、Databricks ユーザーが Looker で使用する個人用のアクセス トークンを作成します。

GRANT を使用して、このユーザーに権限を追加します。

Looker ユーザーには、少なくとも SELECTREAD_METADATA が必要です。

GRANT SELECT ON DATABASE <YOUR_DATABASE> TO `<looker>@<your.databricks.com>`
GRANT READ_METADATA ON DATABASE <YOUR_DATABASE> TO `<looker>@<your.databricks.com>`

サーバー情報

Databricks ドキュメントの手順に沿って、Databricks クラスタの HTTP パスを確認します。このページでは、これを <YOUR_HTTP_PATH> と呼びます。

永続的な派生テーブルの設定

永続的な派生テーブルを使用するには、別のデータベースを作成します。

CREATE DATABASE <YOUR_SCRATCH_DATABASE>

また、書き込みベースのユーザー権限も付与する必要があります。

GRANT SELECT CREATE MODIFY ON DATABASE <YOUR_SCRATCH_DATABASE> TO `<looker>@<your.databricks.com>`
GRANT READ_METADATA ON DATABASE <YOUR_SCRATCH_DATABASE> TO `<looker>@<your.databricks.com>`

Looker 接続の設定

[管理] パネルの [データベース] セクションで [接続] を選択します。[Connections] ページで、[Add Connection] ボタンをクリックします。Looker に [Connection Settings] ページが表示されます。[接続設定] ページに表示されるフィールドは、選択した言語によって異なります。設定の大半はほとんどのデータベース言語で使用されており、Looker のデータベースへの接続に関するドキュメント ページで説明しています。

  • 名前: 接続の名前を指定します。これは、LookML プロジェクトの接続の参照方法です。
  • 言語: Databricks 言語を指定します。
  • Host: ホスト名を指定します。
  • ポート: データベース ポートを指定します。デフォルトは 443 です。
  • データベース: データベース名を指定します。デフォルトは default です。
  • ユーザー名: 値 token を入力します(このフィールドには、Databricks ユーザーのメールアドレスは入力しないでください)。
  • Password: 前の手順で作成した個人用のアクセス トークンを入力します。
  • 永続的な派生テーブル: 永続派生テーブルを有効にするには、このチェックボックスをオンにします。これにより、[Temp Database] フィールドと [PDT Overrides] 列が表示されます。
  • Temp Database: PDT の保存に使用するデータベースを入力します。
  • 最大 PDT ビルダー接続: この接続で可能な同時 PDT ビルドの数を指定します。この値を大きくしすぎると、クエリ時間に悪影響を及ぼす可能性があります。詳細については、Looker のデータベースへの接続ドキュメント ページをご覧ください。
  • その他のパラメータ: 追加の Spark JDBC パラメータを追加します。

  • PDT とデータグループのメンテナンス スケジュール: Looker でデータグループと永続的な派生テーブルをいつチェックするかを指定する cron 式。この設定の詳細については、PDT とデータグループのメンテナンス スケジュールのドキュメントをご覧ください。

  • SSL: SSL 接続を使用する場合はチェックボックスをオンにします。

  • Verify SSL Cert: 厳格な SSL 証明書の検証を実施する場合はチェックボックスをオンにします。

  • 最大接続数: 最初はデフォルト値のままでも構いません。この設定の詳細については、Looker のデータベースへの接続ドキュメントで最大接続数をご覧ください。

  • Connection Pool Timeout: 最初はデフォルト値のままでも構いません。この設定の詳細については、Looker のデータベースへの接続に関するドキュメントの接続プールのタイムアウトをご覧ください。

  • SQL Runner のプリキャッシュ: SQL Runner でテーブル情報をプリロードせず、テーブルが選択されている場合にのみテーブル情報を読み込みないようにするには、このオプションをオフにします。この設定の詳細については、Looker のデータベースへの接続ドキュメント ページの SQL Runner プリキャッシュ セクションをご覧ください。

  • データベースのタイムゾーン: データベースで使用するタイムゾーンを指定します。タイムゾーンの変換を希望しない場合は、このフィールドを空白のままにします。詳しくは、タイムゾーンの設定の使用に関するドキュメントをご覧ください。

[Test Settings] をクリックして接続をテストし、正しく設定されていることを確認します。[接続できます] と表示されたら、[接続を追加] を押します。残りの接続テストが実行され、サービスアカウントが適切なロールで正常に設定されたことを検証します。

接続設定の詳細については、Looker のデータベースへの接続ドキュメント ページをご覧ください。

機能のサポート

一部の機能については、Lookerでサポートするには、データベースダイアレクトが同じ機能に対応している必要があります。

Databricks は、次の Looker 機能をサポートしています。

次のステップ

データベースの構成が完了したら、Looker からデータベースに接続します。