Databricks ノートブック間でコードを共有する

この記事では、Python ファイルを作成およびインポートする方法など、ファイルを使用してコードをモジュール化する方法について説明します。

Databricks ではマルチタスク ジョブもサポートされています。これにより、ノートブックを複雑な依存関係を持つワークフローに結合できます。 詳細については、Azure Databricks ジョブの作成と実行に関するページを参照してください。

ファイルを使用してコードをモジュール化する

Databricks Runtime 11.3 LTS 以降では、Azure Databricks ワークスペースでソース コード ファイルを作成して管理し、必要に応じてこれらのファイルをノートブックにインポートできます。 Databricks リポジトリを使用して、ファイルを Git リポジトリと同期することもできます。 詳細については、「Python および R モジュールの処理」と「Git と Databricks Git フォルダーの統合」を参照してください。

ファイルを作成する

ファイルを作成するには、次の手順を実行します。

  1. ワークスペース内のフォルダーに移動します
  2. フォルダー名を右クリックし、>[ファイルの作成] を選択します。
  3. ファイルの名前を入力し、[ファイルの作成] をクリックするか、Enter キーを押します。 ファイルがエディター ウィンドウで開きます。 変更は自動的に保存されます。

ファイルを開く

ワークスペース内のファイルに移動し、それをクリックします。 ファイルの名前にカーソルを合わせると、ファイル パスが表示されます。

ノートブックにファイルをインポートする

標準の Python インポート コマンドを使用して、ノートブックにファイルをインポートできます。

次のファイルがあるとします。

関数を定義するファイル

そのファイルをノートブックにインポートし、ファイルで定義されている関数を呼び出すことができます:

ノートブックにファイルをインポートする

ファイルを実行する

エディターからファイルを実行できます。 これはテストに役立ちます。 ファイルを実行するには、コード領域にカーソルを置き、Shift + Enter キーを押してセルを実行するか、セル内のコードを強調表示して Shift + Ctrl + Enter キーを押して、選択したコードのみを実行します。

ファイルを削除する

ワークスペース メニューにアクセスしてワークスペース内のファイルや他の項目を削除する方法については、「フォルダー」と「ワークスペース オブジェクトの操作」を参照してください。

ファイル名を変更する

開いているファイルのタイトルを変更するには、タイトルをクリックしてインラインで編集するか、[ファイル] > [名前の変更] をクリックします。

ファイルへのアクセスを制御する

Azure Databricks アカウントに Premium プランがある場合は、ワークスペースのアクセス制御を使用して、ファイルにアクセスできるユーザーを制御できます。