Looker に接続する

この記事では、Azure Databricks クラスターまたは Databricks SQL ウェアハウスを使用して、Looker を使用する方法について説明します (以前の Databricks SQL エンドポイント)。

重要

永続的な派生テーブル (PDT) が有効になっている場合、Looker では既定で、関連付けられているデータベースに接続して 5 分ごとに PDT を再生成します。 Databricks では、過剰なコンピューティング コストが発生しないように、既定の頻度を変更することをお勧めします。 詳細については、「永続的な派生テーブル (PDT) を有効にして管理する」を参照してください。

要件

Looker に手動で接続する前に、次のものが必要です。

  • Azure Databricks ワークスペース内のクラスターまたは SQL ウェアハウス。

  • クラスターまたは SQL ウェアハウスの接続の詳細。具体的には、[サーバーのホスト名][ポート]、および [HTTP パス] の値です。

  • Azure Databricks 個人用アクセス トークンまたは Microsoft Entra ID (旧称 Azure Active Directory) トークン。 個人用アクセス トークンを作成するには、次の操作を行います。

    1. Azure Databricks ワークスペースの上部バーで、目的の Azure Databricks ユーザー名をクリックし、次にドロップダウンから [設定] を選択します。
    2. [開発者] をクリックします。
    3. [アクセス トークン] の横にある [管理] をクリックします。
    4. [新しいトークンの生成] をクリックします。
    5. (省略可能) 将来このトークンを識別するのに役立つコメントを入力し、トークンの既定の有効期間 90 日を変更します。 有効期間のないトークンを作成するには (推奨されません)、[有効期間 (日)] ボックスを空のままにします。
    6. [Generate](生成) をクリックします。
    7. 表示されたトークンを安全な場所にコピーし、[完了] をクリックします。

    Note

    コピーしたトークンは必ず安全な場所に保存してください。 コピーしたトークンは他人に見せないでください。 コピーしたトークンを失った場合、それとまったく同じトークンは再生成できません。 代わりに、この手順を繰り返して新しいトークンを作成する必要があります。 コピーしたトークンを紛失した場合や、トークンが侵害されていると思われる場合、Databricks では、[アクセス トークン] ページのトークンの横にあるごみ箱 ([取り消し]) アイコンをクリックして、ワークスペースからそのトークンをすぐに削除することを強くお勧めします。

    ワークスペースでトークンを作成することや使用することができない場合は、ワークスペース管理者によってトークンが無効にされているか、トークンを作成または使用する権限が作業者に付与されていない可能性があります。 ワークスペース管理者に連絡するか、以下の情報を参照してください。

    Note

    セキュリティのベスト プラクティスとして、自動化ツール、システム、スクリプト、アプリを使用して認証する場合、Databricks では、ワークスペース ユーザーではなくサービス プリンシパルに属する個人用アクセス トークンを使用することを推奨しています。 サービス プリンシパルのトークンを作成するには、「サービス プリンシパルのトークンを管理する」をご覧ください。

Looker に手動で接続する

Looker に手動で接続するには、次の操作を行います。

  1. Looker で、[管理者] > [接続] > [接続の追加] をクリックします。

    接続パラメーター

  2. 接続の固有な名前を入力してください。

    ヒント

    接続名には、小文字、数字、アンダースコアのみを含める必要があります。 他の文字は受け入れられる場合がありますが、後で予期しない結果が発生することがあります。

  3. [言語][Databricks] を選択します。

  4. リモート ホストには、要件の [サーバー ホスト名] を入力します。

  5. [ポート] については、要件の [ポート] を入力します。

  6. [データベース] には、接続経由でアクセスするワークスペース内のデータベースの名前を入力します (例: default)。

  7. [ユーザー名] に「token」という単語を入力します。

  8. [パスワード] に、要件の個人用アクセス トークンを入力します。

  9. [追加のパラメーター] に「transportMode=http;ssl=1;httpPath=<http-path>」と入力します。ただし、<http-path> を要件の [HTTP パス] の値に置き換えます。

    ワークスペースで Unity カタログが有効になっている場合、既定のカタログも追加で設定します。 「ConnCatalog=<catalog-name>」と入力し、<catalog-name> をカタログ名前に置き換えます。

  10. PDT および Datagroup メンテナンス スケジュールの場合は、有効なcron式を入力して、PDT を再生成するための既定の頻度を変更します。 既定の頻度は 5 分ごとです。

  11. クエリを他のタイム ゾーンに変換する場合は、クエリ タイム ゾーンを調整します。

  12. 残りのフィールドについては、特に次の場合は、既定値のままにします。

    • [最大接続数][接続プール タイムアウト] を既定値のままにします。
    • [データベース タイム ゾーン] は空白のままにします (UTC ですべてを格納しているとします)。
  13. [これらの設定のテスト] をクリックします。

  14. テストが成功した場合は、[接続の追加] をクリックします。

Looker でデータベースをモデル化する

このセクションでは、プロジェクトを作成し、ジェネレーターを実行します。 次の手順では、接続用のデータベースに永続的なテーブルが格納されていると想定しています。

  1. [開発] メニューの [開発モード] をオンにします。

  2. [開発] > [LookML プロジェクトの管理] の順にクリックします。

  3. [新しい LookML プロジェクト] をクリックします。

  4. 一意の [プロジェクト名] を入力します。

    ヒント

    プロジェクト名には、小文字、数字、アンダースコアのみを含める必要があります。 他の文字は受け入れられる場合がありますが、後で予期しない結果が発生することがあります。

  5. [接続] で、手順 2 の接続の名前を選択します。

  6. [スキーマ] には、「default」と入力します。ただし、接続を介してモデル化する他のデータベースがある場合は除きます。

  7. 残りのフィールドについては、特に次の場合は、既定値のままにします。

    • [開始点][データベース スキーマからモデルを生成する] に設定されたままにします。
    • [ビューのビルド元][すべての テーブル] に設定されたままにします。
  8. [プロジェクトの作成] をクリックします。

プロジェクトを作成してジェネレーターを実行すると、Looker に、1 つの .model ファイルと複数の .view ファイルを含むユーザー インターフェイスが表示されます。 .model ファイルには、スキーマ内のテーブルと、それらの間の検出された結合関係が表示されます。.view ファイルには、スキーマ内のテーブルごとに使用できるそれぞれのディメンション (列) が一覧表示されます。

次の手順

プロジェクトの操作を開始するには、Looker Web サイトで次のリソースを参照してください。

永続的な派生テーブル (PDT) を有効にして管理する

Looker では、永続的な派生テーブル (PDT) を作成することで、クエリ時間とデータベースの読み込み数を軽減できます。 PDT は、Looker がデータベースのスクラッチ スキーマに書き込む派生テーブルです。 その後、指定したスケジュールで Looker により PDT が再生成されます。 詳細については、永続的な派生テーブル (PDT) に関する Looker ドキュメントを参照してください。

データベース接続に対して PDT を有効にするには、その接続の永続的な派生テーブルを選択し、画面の指示をすべて終えます。 詳細については、永続的な派生テーブルPDT プロセスのログイン資格情報に関する Looker ドキュメントを参照してください。

PDT が有効になっている場合、Looker では既定で、関連付けられているデータベースに接続して 5 分ごとに PDT を再生成します。 Looker では、関連した Azure Databricks リソースが停止した場合に再起動します。 Databricks では、データベース接続の [PDT とデータグループのメンテナンス スケジュール] フィールドを有効な cron 式に設定し、既定の頻度を変更することをお勧めします。 詳細については、PDT およびデータグループのメンテナンス スケジュールに関する Looker ドキュメントを参照してください。

PDT を有効にするか、既存のデータベース接続の PDT 再生成頻度を変更するには、[管理者] > [データベース接続] の順にクリックし、データベース接続の横にある [編集] をクリックして、上記の手順に従います。

その他の技術情報

Looker のサポート