ネットワークトラフィックの暗号化
Looker アプリケーションとデータベース間のネットワーク トラフィックを暗号化することをおすすめします。セキュアなデータベースアクセスを可能にするドキュメント ページに記載されているオプションのいずれかを検討してください。
Looker ユーザーを作成する
Looker は、個人用のアクセス トークンによって Databricks の認証を行います。Databricks のドキュメントに従って、Databricks ユーザーが Looker で使用する個人用のアクセス トークンを作成します。
GRANT
を使用して、このユーザーに権限を追加します。
少なくとも、Looker ユーザーには SELECT
と READ_METADATA
が必要です。
GRANT SELECT ON DATABASE <YOUR_DATABASE> TO `<looker>@<your.databricks.com>`
GRANT READ_METADATA ON DATABASE <YOUR_DATABASE> TO `<looker>@<your.databricks.com>`
サーバー情報
Databricks のドキュメントを参照して、Databricks クラスタの HTTP パスを探します。このページでは、<YOUR_HTTP_PATH>
とします。
永続的な派生テーブルの設定
永続的な派生テーブルを使用するには、別のデータベースを作成します。
CREATE DATABASE <YOUR_SCRATCH_DATABASE>
また、追加の書き込みベースのユーザー権限を付与する必要があります。
GRANT SELECT CREATE MODIFY ON DATABASE <YOUR_SCRATCH_DATABASE> TO `<looker>@<your.databricks.com>`
GRANT READ_METADATA ON DATABASE <YOUR_SCRATCH_DATABASE> TO `<looker>@<your.databricks.com>`
データベースへの Looker 接続の作成
Looker の [管理者] セクションで [接続] を選択し、[新しい接続] をクリックします。
接続の詳細を入力します。設定の大部分は、ほとんどのデータベース言語に共通するものです。詳細については、Looker をデータベースに接続するのドキュメント ページをご覧ください。設定の一部を次に説明します。
- Name: 接続の名前を指定します。LookML プロジェクトでこの接続を参照する際に使用します。
- 言語: 言語 Databricks を指定します。
- ホスト: ホスト名を指定します。
- ポート: データベース ポートを指定します。デフォルト値は 443 です。
- データベース: データベース名を指定します。デフォルトは
default
です。 - ユーザー名: 値「
token
」を入力します(このフィールドに Databricks ユーザーのメールアドレスは入力しないでください)。 - パスワード: 前の手順で作成した個人用アクセス トークンを入力します。
- PDT を有効にする: 有効にするには、この切り替えボタンを使用して永続的な派生テーブルを有効にします。PDT が有効になると、追加の PDT 設定と [PDT オーバーライド]が [接続] ウィンドウに表示されます。
- Temp Database: PDT の保存に使用するデータベースを入力します。
- PDT ビルダーの最大接続数: この接続で同時に可能な PDT ビルドの数を指定します。この値を大きく設定しすぎると、クエリ時間に悪影響を及ぼす可能性があります。詳細については、Looker をデータベースに接続のドキュメント ページをご覧ください。
その他の JDBC パラメータ: その他の Spark JDBC パラメータを追加します。
データグループと PDT メンテナンス スケジュール:
cron
式。Looker がいつデータグループと永続的な派生テーブルを確認するかを示します。この設定の詳細については、データグループと PDT のメンテナンス スケジュールのドキュメントをご覧ください。SSL: SSL 接続を使用する場合にオンにします。
SSL の検証: 厳格な SSL 証明書の適用を確認します。
ノードあたりの最大接続数: この設定は、最初はデフォルト値のままで問題ありません。この設定の詳細については、Looker をデータベースに接続するドキュメント ページのノードごとの最大接続数セクションをご覧ください。
接続プールのタイムアウト: この設定は、最初はデフォルト値のままで問題ありません。この設定の詳細については、Looker をデータベースに接続するのドキュメント ページの接続プールのタイムアウトのセクションをご覧ください。
SQL Runner Precache: SQL Runner でテーブルの情報を事前に読み込まず、テーブルを選択したときにのみテーブルの情報が読み込まれるようにするには、このオプションをオフにします。この設定の詳細については、Looker をデータベースに接続するのドキュメント ページの SQL Runner の事前キャッシュのセクションをご覧ください。
データベースのタイムゾーン: データベースで使用されるタイムゾーンを指定します。タイムゾーン変換を希望しない場合は、このフィールドを空白のままにします。詳しくは、タイムゾーン設定の使用のドキュメント ページをご覧ください。
[テスト] をクリックして接続をテストし、正しく構成されていることを確認します。[接続可能] と表示されたら、[接続] を押します。残りの接続テストが実行され、サービスアカウントが適切なロールで正常に設定されたことを検証します。トラブルシューティング情報については、データベース接続のテストのドキュメント ページをご覧ください。
Databricks Unity Catalog を使用した Looker 機能
Unity Catalog が有効になっている Databricks データベースに Looker を接続する場合、次のシナリオのように、ほとんどの Looker 機能がデフォルトのカタログからのみスキーマにアクセスします。
- データベース スキーマから新しい LookML プロジェクトを生成する場合、Looker では Unity Catalog のデフォルト カタログのテーブルに基づいてプロジェクト ファイルを作成します。
- 既存のプロジェクトの場合、Looker IDE を使用してテーブルからビューを作成する場合、Looker では Unity Catalog のデフォルト カタログのテーブルからのみビューファイルを作成できます。
- SQL Runner を使用する場合は、Unity Catalog のデフォルト カタログからスキーマのみを選択できます。
機能のサポート
一部の機能については、Looker でサポートするには、データベース言語が同じ機能に対応している必要があります。
Databricks では、Looker 24.8 の時点で、次の機能がサポートされています。
特徴 | サポート対象 |
---|---|
サポート レベル | サポート対象 |
Looker(Google Cloud コア) | はい |
対称集計 | あり |
派生テーブル | あり |
永続的な SQL 派生テーブル | あり |
永続的なネイティブ派生テーブル | あり |
安定したビュー | あり |
クエリの強制終了 | あり |
SQL ベースのピボット | あり |
タイムゾーン | あり |
SSL | あり |
Subtotals | あり |
JDBC の追加パラメータ | あり |
Case Sensitive | あり |
ロケーション タイプ | あり |
リストのタイプ | あり |
パーセンタイル | あり |
個別のパーセンタイル | いいえ |
SQL Runner の表示プロセス | いいえ |
SQL Runner の説明テーブル | あり |
SQL Runner 表示インデックス | いいえ |
SQL Runner Select 10 | あり |
SQL ランナーの数 | あり |
SQL の説明 | あり |
Oauth 認証情報 | いいえ |
コンテキスト コメント | あり |
接続プーリング | いいえ |
HLL スケッチ | いいえ |
集計認識 | あり |
増分PDT | あり |
ミリ秒 | あり |
マイクロ秒 | あり |
マテリアライズド ビュー | いいえ |
Approximate Count Distinct | いいえ |