Microsoft Fabric ノートブックの使用方法
Microsoft Fabric ノートブックは、Apache Spark ジョブと機械学習実験を開発するための主要なコード項目です。 これは、データ サイエンティストやデータ エンジニアが、豊富な視覚化と Markdown テキストの恩恵を受けながらコードを記述するために使用する、Web ベースの対話型サーフェスです。 データ エンジニアは、データ インジェスト、データ準備、データ変換のためのコードを作成します。 データ サイエンティストは、実験やモデルの作成、モデルの追跡、展開などの機械学習ソリューションを構築するためにノートブックも使用します。
Fabric ノートブックを使用すると、次のことが可能になります。
- 設定作業をせずに使用を開始する。
- 直感的なローコード エクスペリエンスにより、データを簡単に探索して処理できます。
- 組み込みのエンタープライズ セキュリティ機能を使用してデータを安全に保つ。
- 強力な Spark 機能を使用して、未加工の形式 (CSV、txt、JSON など)、処理されたファイル形式 (parquet、Delta Lake など) にわたるデータを分析する。
- 高度な作成機能と組み込みのデータの視覚化で生産性を高める。
この記事では、データ サイエンスおよびデータ エンジニアリングのエクスペリエンスでノートブックを使用する方法について説明します。
ノートブックを作成する
新しいノートブックを作成することも、既存のノートブックをインポートすることもできます。
新しいノートブックを作成する
他の標準的な Fabric 項目の作成プロセスと同様に、Fabric Data Engineering ホームページ、ワークスペースの [新規] オプション、または [ハブの作成] から新しいノートブックを簡単に作成できます。
既存のノートブックをインポートする
Data Engineering または Data Science のホームページから、ローカル コンピューターから Fabric ワークスペースに 1 つ以上の既存のノートブックをインポートできます。 Fabric ノートブックは、標準の Jupyter Notebook .ipynb ファイル、および .py、.scala、.sql などのソース ファイルを認識し、それに応じて新しいノートブック項目を作成します。
ノートブックをエクスポートする
ノートブックを他の標準形式にエクスポートできます。 Synapse ノートブックは以下にエクスポートできます。
- Jupyter ノートブックで使用される標準ノートブック ファイル (.ipynb)。
- ブラウザーから直接開くことができる HTML ファイル (.html)。
- Python ファイル (.py)。
- Latex ファイル (.tex)。
ノートブックを保存する
Fabric では、ノートブックを開いて編集すると、デフォルトでノートブックが自動的に保存されます。コードの変更が失われることを心配する必要はありません。 [コピーの保存] を使用して、現在のワークスペースまたは別のワークスペースに別のコピーのクローンを作成することもできます。
ノートブックを手動で保存したい場合は、手動保存オプションに切り替えてノートブック項目のローカル ブランチを作成してから、[保存] または [CTRL+s] を使用して変更を保存することができます。
[編集]->[保存オプション]->[手動] を選択して手動保存モードに切り替えることもできます。 ノートブックのローカル ブランチをオンにしてから手動で保存するには、[保存] を選択するか、Ctrl + s キーボード ショートカットを使用します。
レイクハウスとノートブックを接続する
Fabric ノートブックは、レイクハウスとの緊密な対話をサポートするようになりました。レイクハウス エクスプローラーから新規または既存のレイクハウスを簡単に追加できます。
レイクハウス エクスプローラーでさまざまなレイクハウスに移動し、1 つのレイクハウスを固定して既定として設定できます。 その後、既定ではランタイム作業ディレクトリにマウントされ、ローカル パスを使用して既定のレイクハウスの読み取りまたは書き込みができるようになります。
Note
新しいレイクハウスを固定するか、既定のレイクハウスの名前を変更した後、セッションを再起動する必要があります。
レイクハウスを追加または削除する
レイクハウス名の横にある [X] アイコンを選択すると、レイクハウスがノートブック タブから削除されますが、レイクハウス項目はワークスペースに残ります。
[レイクハウスの追加] を選択して、既存のレイクハウスを追加するか、新しいレイクハウスを作成して、さらにレイクハウスをノートブックに追加します。
レイクハウス ファイルを調べる
Lake ビューの Tables と Files セクションにあるサブフォルダーとファイルは、レイクハウス リストとノートブック コンテンツの間のコンテンツ領域に表示されます。 Tables と Files セクションで別のフォルダーを選択して、コンテンツ領域を更新します。
フォルダーとファイルの操作
マウスの右クリックでファイル (.csv、.parquet、.txt、.jpg、.png など) を選択すると、データの読み込みには Spark API または Pandas API を使用できます。 新しいコード セルが生成され、フォーカス セルの下に挿入されます。
選択したファイルまたはフォルダーとは異なる形式のパスを簡単にコピーし、コード内で対応するパスを使用できます。
Notebook のリソース
ノートブック リソース エクスプローラーは、フォルダーとファイルの管理に役立つ Unix のようなファイル システムを提供します。 コード モジュール、セマンティック モデル、イメージなどの小さなサイズのファイルを保存できる書き込み可能なファイル システム スペースを提供します。 ローカル ファイル システムを操作しているかのように、ノートブック内のコードを使用して簡単にアクセスできます。
この組み込みフォルダーは、ノートブック インスタンスごとのシステム定義済みフォルダーです。 現在のノートブックの依存関係を格納するために、最大 500 MB のストレージが保持されます。 ノートブック リソースの主な機能は次のとおりです。
- UI を通じて、作成/削除、アップロード/ダウンロード、ドラッグ/ドロップ、名前変更、複製、検索などの一般的な操作を使用できます。
builtin/YourData.txt
のような相対パスを使用すると、すばやく探索できます。mssparkutils.nbResPath
メソッドは完全なパスの作成に役立ちます。- [Lakehouse への書き込み] オプションを使用して、検証済みのデータをレイクハウスに簡単に移動できます。 Fabric には、すぐに使い始められるように、一般的なファイル タイプ用の豊富なコード スニペットが埋め込まれています。
- これらのリソースは、
mssparkutils.notebook.run()
を介してリファレンス ノートブックの実行ケースでも使用できます。
Note
- 現在、Fabric では、.py、.whl、.jar、.txt、.json、.yml、.xml、.csv、.html、.png、.jpg、.xlsx ファイルなど、特定のファイル タイプを UI を通じてアップロードすることがサポートされています。 コードを使用して、リストにないファイル タイプの組み込みフォルダーに書き込むことができます。ただし、Fabric ノートブックは、サポートされていないファイル タイプでのコード スニペットの生成をサポートしません。
- 各ファイルのサイズは 50MB 未満である必要があり、組み込みフォルダーでは合計で最大 100 個のファイル/フォルダー インスタンスが許可されます。
mssparkutils.notebook.run()
を使用する場合は、mssparkutils.nbResPath
コマンドを使用して対象のノートブック リソースにアクセスします。 相対パス “builtin/” は常にルート ノートブックの組み込みフォルダーを指します。
ノートブックで共同作業を行う
Fabric ノートブックは、複数のユーザーによる同じノートブックの編集をサポートする共同作業項目です。
ノートブックを開くと、既定で共同編集モードになり、ノートブックの編集内容はすべて自動的に保存されます。 同僚が同時に同じノートブックを開いた場合は、同僚のプロファイル、実行出力、カーソル インジケーター、選択インジケーター、編集トレースが表示されます。 共同作業機能を使用することで、ペア プログラミング、リモート デバッグ、個別指導のシナリオを簡単に実行できます。
ノートブックを共有する
ノートブックの共有は、チーム メンバーと共同作業を行うための便利な方法です。 承認されたワークスペース ロールは、既定でノートブックを表示または編集/実行できます。 指定したアクセス許可が付与されたノートブックを共有できます。
ノートブック ツールバーの [共有] を選択します。
このノートブックを表示できるユーザーに対応するカテゴリを選択します。 受信者の [共有]、[編集]、または [実行] アクセス許可を選択できます。
[適用] を選択した後、ノートブックを直接送信するか、リンクを他のユーザーにコピーできます。 その後、受信者は、アクセス許可レベルによって付与された対応するビューを使用してノートブックを開くことができます。
ノートブックのアクセス許可をさらに管理するには、[Workspace item list] (ワークスペース項目の一覧)>[その他のオプション] を選択してから、[アクセス許可の管理] を選択します。 その画面から、既存のノートブックのアクセスとアクセス許可を更新できます。
コード セルにコメントを付ける
コメントは、共同作業のシナリオで役立つもう 1 つの機能です。 現在、Fabric ではセルレベルのコメントの追加がサポートされています。
ノートブックのツールバーまたはセルのコメント インジケーターの [コメント] ボタンを選択して、[コメント] ウィンドウを開きます。
コード セルでコードを選択し、[コメント] ペインで [新規] を選択してコメントを追加し、[コメントの投稿] を選択して保存します。
必要な場合は、コメントの横にある [その他] オプションを選択して、コメントの編集、スレッドの解決、スレッドの削除オプションを見つけます。
コメント内の他のユーザーをタグ付けする
"タグ付け" とは、コメント スレッドでユーザーにメンションして通知し、詳細に対する共同作業を効率的に強化することを指します。
セル内のコードセクションと新しいコメント スレッドを選択します。
ユーザー名を入力し、特定のセクションについて話し合うために他のユーザーをメンションする場合は、候補リストで正しいものを選択します。
分析情報を共有し、投稿します。
電子メールによる通知がトリガーされ、ユーザーは [コメントを開く] リンクをクリックして、このセルをすばやく見つけます。
さらに、アクセス権を持たないユーザーにタグを付けるときに、ユーザーのアクセス許可を承認して構成し、コード資産が適切に管理されるようにします。
Note
コメント項目の場合、1 時間以内にコメントを更新した場合、タグ付けされたユーザーは電子メールによる通知を受信しなくなります。 ただし、新しくタグ付けされたユーザーに電子メールによる通知が送信されます。
ノートブック モードの切り替え
Fabric ノートブックは 2 つのモードをサポートしており、編集モードと表示モードを簡単に切り替えることができます。
- 編集モード: セルを編集して実行し、ノートブック上で他のユーザーと共同作業することができます。
- 表示モード: ノートブックのセルの内容、出力、コメントのみを表示できます。 ノートブックに変更を加える操作はすべて無効になります。
関連するコンテンツ
フィードバック
https://aka.ms/ContentUserFeedback」を参照してください。
以下は間もなく提供いたします。2024 年を通じて、コンテンツのフィードバック メカニズムとして GitHub の issue を段階的に廃止し、新しいフィードバック システムに置き換えます。 詳細については、「フィードバックの送信と表示