Share via


Microsoft Fabric ノートブックの使用方法

Microsoft Fabric ノートブックは、Apache Spark ジョブと機械学習実験を開発するための主要なコード項目です。 これは、データ サイエンティストやデータ エンジニアが、豊富な視覚化と Markdown テキストの恩恵を受けながらコードを記述するために使用する、Web ベースの対話型サーフェスです。 データ エンジニアは、データ インジェスト、データ準備、データ変換のためのコードを作成します。 データ サイエンティストは、実験やモデルの作成、モデルの追跡、展開などの機械学習ソリューションを構築するためにノートブックも使用します。

Fabric ノートブックを使用すると、次のことが可能になります。

  • 設定作業をせずに使用を開始する。
  • 直感的なローコード エクスペリエンスにより、データを簡単に探索して処理できます。
  • 組み込みのエンタープライズ セキュリティ機能を使用してデータを安全に保つ。
  • 強力な Spark 機能を使用して、未加工の形式 (CSV、txt、JSON など)、処理されたファイル形式 (parquet、Delta Lake など) にわたるデータを分析する。
  • 高度な作成機能と組み込みのデータの視覚化で生産性を高める。

この記事では、データ サイエンスおよびデータ エンジニアリングのエクスペリエンスでノートブックを使用する方法について説明します。

ノートブックを作成する

新しいノートブックを作成することも、既存のノートブックをインポートすることもできます。

新しいノートブックを作成する

他の標準的な Fabric 項目の作成プロセスと同様に、Fabric Data Engineering ホームページ、ワークスペースの [新規] オプション、または [ハブの作成] から新しいノートブックを簡単に作成できます。

既存のノートブックをインポートする

Data Engineering または Data Science のホームページから、ローカル コンピューターから Fabric ワークスペースに 1 つ以上の既存のノートブックをインポートできます。 Fabric ノートブックは、標準の Jupyter Notebook .ipynb ファイル、および .py、.scala、.sql などのソース ファイルを認識し、それに応じて新しいノートブック項目を作成します。

[新規] メニューのノートブック オプションの場所を示すスクリーンショット。

ノートブックをエクスポートする

ノートブックを他の標準形式にエクスポートできます。 Synapse ノートブックは以下にエクスポートできます。

  • Jupyter ノートブックで使用される標準ノートブック ファイル (.ipynb)。
  • ブラウザーから直接開くことができる HTML ファイル (.html)。
  • Python ファイル (.py)。
  • Latex ファイル (.tex)。

ノートブックをエクスポートする場所を示すスクリーンショット。

ノートブックを保存する

Fabric では、ノートブックを開いて編集すると、デフォルトでノートブックが自動的に保存されます。コードの変更が失われることを心配する必要はありません。 [コピーの保存] を使用して、現在のワークスペースまたは別のワークスペースに別のコピーのクローンを作成することもできます。

コピーの保存場所を示すスクリーンショット。

ノートブックを手動で保存したい場合は、手動保存オプションに切り替えてノートブック項目のローカル ブランチを作成してから、[保存] または [CTRL+s] を使用して変更を保存することができます。

手動保存を切り替える場所を示すスクリーンショット。

[編集]->[保存オプション]->[手動] を選択して手動保存モードに切り替えることもできます。 ノートブックのローカル ブランチをオンにしてから手動で保存するには、[保存] を選択するか、Ctrl + s キーボード ショートカットを使用します。

レイクハウスとノートブックを接続する

Fabric ノートブックは、レイクハウスとの緊密な対話をサポートするようになりました。レイクハウス エクスプローラーから新規または既存のレイクハウスを簡単に追加できます。

レイクハウス エクスプローラーでさまざまなレイクハウスに移動し、1 つのレイクハウスを固定して既定として設定できます。 その後、既定ではランタイム作業ディレクトリにマウントされ、ローカル パスを使用して既定のレイクハウスの読み取りまたは書き込みができるようになります。

既定のレイクハウスを固定する場所を示すスクリーンショット。

Note

新しいレイクハウスを固定するか、既定のレイクハウスの名前を変更した後、セッションを再起動する必要があります。

レイクハウスを追加または削除する

レイクハウス名の横にある [X] アイコンを選択すると、レイクハウスがノートブック タブから削除されますが、レイクハウス項目はワークスペースに残ります。

[レイクハウスの追加] を選択して、既存のレイクハウスを追加するか、新しいレイクハウスを作成して、さらにレイクハウスをノートブックに追加します。

レイクハウス ファイルを調べる

Lake ビューの TablesFiles セクションにあるサブフォルダーとファイルは、レイクハウス リストとノートブック コンテンツの間のコンテンツ領域に表示されます。 TablesFiles セクションで別のフォルダーを選択して、コンテンツ領域を更新します。

フォルダーとファイルの操作

マウスの右クリックでファイル (.csv、.parquet、.txt、.jpg、.png など) を選択すると、データの読み込みには Spark API または Pandas API を使用できます。 新しいコード セルが生成され、フォーカス セルの下に挿入されます。

選択したファイルまたはフォルダーとは異なる形式のパスを簡単にコピーし、コード内で対応するパスを使用できます。

レイクハウス内のファイルのコンテキスト メニューを示すスクリーンショット。

Notebook のリソース

ノートブック リソース エクスプローラーは、フォルダーとファイルの管理に役立つ Unix のようなファイル システムを提供します。 コード モジュール、セマンティック モデル、イメージなどの小さなサイズのファイルを保存できる書き込み可能なファイル システム スペースを提供します。 ローカル ファイル システムを操作しているかのように、ノートブック内のコードを使用して簡単にアクセスできます。

ノートブック リソースのアニメーション GIF。

この組み込みフォルダーは、ノートブック インスタンスごとのシステム定義済みフォルダーです。 現在のノートブックの依存関係を格納するために、最大 500 MB のストレージが保持されます。 ノートブック リソースの主な機能は次のとおりです。

  • UI を通じて、作成/削除、アップロード/ダウンロード、ドラッグ/ドロップ、名前変更、複製、検索などの一般的な操作を使用できます。
  • builtin/YourData.txt のような相対パスを使用すると、すばやく探索できます。 mssparkutils.nbResPath メソッドは完全なパスの作成に役立ちます。
  • [Lakehouse への書き込み] オプションを使用して、検証済みのデータをレイクハウスに簡単に移動できます。 Fabric には、すぐに使い始められるように、一般的なファイル タイプ用の豊富なコード スニペットが埋め込まれています。
  • これらのリソースは、mssparkutils.notebook.run() を介してリファレンス ノートブックの実行ケースでも使用できます。

Note

  • 現在、Fabric では、.py.whl.jar.txt.json.yml.xml.csv.html.png.jpg.xlsx ファイルなど、特定のファイル タイプを UI を通じてアップロードすることがサポートされています。 コードを使用して、リストにないファイル タイプの組み込みフォルダーに書き込むことができます。ただし、Fabric ノートブックは、サポートされていないファイル タイプでのコード スニペットの生成をサポートしません。
  • 各ファイルのサイズは 50MB 未満である必要があり、組み込みフォルダーでは合計で最大 100 個のファイル/フォルダー インスタンスが許可されます。
  • mssparkutils.notebook.run() を使用する場合は、mssparkutils.nbResPath コマンドを使用して対象のノートブック リソースにアクセスします。 相対パス “builtin/” は常にルート ノートブックの組み込みフォルダーを指します。

ノートブックで共同作業を行う

Fabric ノートブックは、複数のユーザーによる同じノートブックの編集をサポートする共同作業項目です。

ノートブックを開くと、既定で共同編集モードになり、ノートブックの編集内容はすべて自動的に保存されます。 同僚が同時に同じノートブックを開いた場合は、同僚のプロファイル、実行出力、カーソル インジケーター、選択インジケーター、編集トレースが表示されます。 共同作業機能を使用することで、ペア プログラミング、リモート デバッグ、個別指導のシナリオを簡単に実行できます。

別のユーザーが編集しているコード セルを示すスクリーンショット。

ノートブックを共有する

ノートブックの共有は、チーム メンバーと共同作業を行うための便利な方法です。 承認されたワークスペース ロールは、既定でノートブックを表示または編集/実行できます。 指定したアクセス許可が付与されたノートブックを共有できます。

  1. ノートブック ツールバーの [共有] を選択します。

    [共有] を選択する場所を示すスクリーンショット。

  2. このノートブックを表示できるユーザーに対応するカテゴリを選択します。 受信者の [共有][編集]、または [実行] アクセス許可を選択できます。

    [アクセス許可] を選択する場所を示すスクリーンショット。

  3. [適用] を選択した後、ノートブックを直接送信するか、リンクを他のユーザーにコピーできます。 その後、受信者は、アクセス許可レベルによって付与された対応するビューを使用してノートブックを開くことができます。

    リンクを作成して送信する場所を示すスクリーンショット。

  4. ノートブックのアクセス許可をさらに管理するには、[Workspace item list] (ワークスペース項目の一覧)>[その他のオプション] を選択してから、[アクセス許可の管理] を選択します。 その画面から、既存のノートブックのアクセスとアクセス許可を更新できます。

    ワークスペースでアクセス許可を管理する場所を示すスクリーンショット。

コード セルにコメントを付ける

コメントは、共同作業のシナリオで役立つもう 1 つの機能です。 現在、Fabric ではセルレベルのコメントの追加がサポートされています。

  1. ノートブックのツールバーまたはセルのコメント インジケーターの [コメント] ボタンを選択して、[コメント] ウィンドウを開きます。

    コメントを選択する場所を示すスクリーンショット。

  2. コード セルでコードを選択し、[コメント] ペインで [新規] を選択してコメントを追加し、[コメントの投稿] を選択して保存します。

    [+ 新規] を選ぶ場所を示すスクリーンショット。

  3. 必要な場合は、コメントの横にある [その他] オプションを選択して、コメントの編集スレッドの解決スレッドの削除オプションを見つけます。

コメント内の他のユーザーをタグ付けする

"タグ付け" とは、コメント スレッドでユーザーにメンションして通知し、詳細に対する共同作業を効率的に強化することを指します。

  1. セル内のコードセクションと新しいコメント スレッドを選択します。

  2. ユーザー名を入力し、特定のセクションについて話し合うために他のユーザーをメンションする場合は、候補リストで正しいものを選択します。

  3. 分析情報を共有し、投稿します。

  4. 電子メールによる通知がトリガーされ、ユーザーは [コメントを開く] リンクをクリックして、このセルをすばやく見つけます。

  5. さらに、アクセス権を持たないユーザーにタグを付けるときに、ユーザーのアクセス許可を承認して構成し、コード資産が適切に管理されるようにします。

コメントで他のユーザーをタグ付けするアニメーション GIF。

Note

コメント項目の場合、1 時間以内にコメントを更新した場合、タグ付けされたユーザーは電子メールによる通知を受信しなくなります。 ただし、新しくタグ付けされたユーザーに電子メールによる通知が送信されます。

ノートブック モードの切り替え

Fabric ノートブックは 2 つのモードをサポートしており、編集モードと表示モードを簡単に切り替えることができます。

モードの切り替え先を示すスクリーンショット。

  • 編集モード: セルを編集して実行し、ノートブック上で他のユーザーと共同作業することができます。
  • 表示モード: ノートブックのセルの内容、出力、コメントのみを表示できます。 ノートブックに変更を加える操作はすべて無効になります。