Azure Data Lake Storage Gen1 を使用して Event Hubs からデータをキャプチャする

Azure Data Lake Storage Gen1 を使用して、Azure Event Hubs で受信したデータをキャプチャする方法を説明します。

前提条件

  • Azure サブスクリプションAzure 無料試用版の取得に関するページを参照してください。

  • Azure Data Lake Storage Gen1 アカウント。 これを作成する手順については、Azure Data Lake Storage Gen1 の使用開始に関する記事をご覧ください。

  • Event Hubs 名前空間。 手順については、「Event Hubs 名前空間を作成します」を参照してください。 Data Lake Storage Gen1 アカウントと Event Hubs 名前空間が同じ Azure サブスクリプションにあるようにしてください。

Event Hubs にアクセス許可を割り当てる

このセクションでは、Event Hubs からデータをキャプチャするアカウント内にフォルダーを作成します。 さらに、Event Hubs にアクセス許可を割り当てて、Data Lake Storage Gen1 アカウントにデータを書き込むことができるようにします。

  1. Event Hubs からデータをキャプチャする Data Lake Storage Gen1 アカウントを開き、 [データ エクスプローラー] をクリックします。

    Data Lake Storage Gen1 data explorer

  2. [新しいフォルダー] をクリックし、データをキャプチャするフォルダーの名前を入力します。

    Create a new folder in Data Lake Storage Gen1

  3. Data Lake Storage Gen1 のルートにアクセス許可を割り当てます。

    a. [データ エクスプローラー] をクリックし、Data Lake Storage Gen1 アカウントのルートを選択して、 [アクセス] をクリックします。

    Screenshot of the Data explorer with the root of the account and the Access option called out.

    b. [アクセス][追加][ユーザーまたはグループの選択] の順にクリックし、Microsoft.EventHubs を検索します。

    Screenshot of the Access page with the Add option, Select User or Group option, and Microsoft Eventhubs option called out.

    [選択] をクリックします。

    c. [アクセス許可の割り当て][アクセス許可の選択] をクリックします。 [アクセス許可][実行] に設定します。 [追加先][このフォルダーとすべての子] に設定します。 [追加ユーザー][アクセス許可エントリと既定のアクセス許可エントリ] に設定します。

    重要

    Azure Event Hubs で受信したデータをキャプチャするための新しいフォルダー階層を作成する際、これは宛先フォルダーに確実にアクセスする簡単な方法です。 ただし、子ファイルとフォルダーが多数含まれる最上位フォルダーのすべての子にアクセス許可を追加すると、長い時間がかかる可能性があります。 ルート フォルダーに多数のファイルとフォルダーが含まれている場合、最終的な宛先フォルダーへのパスに Microsoft.EventHubs実行権限を各フォルダーに個別に追加した方が速いことがあります。

    Screenshot of the Assign Permissions section with the Select Permissions option called out. The Select Permissions section is next to it with the Execute option, Add to option, and Add as option called out.

    [OK] をクリックします。

  4. データをキャプチャする Data Lake Storage Gen1 アカウントのフォルダーにアクセス許可を割り当てます。

    a. [データ エクスプローラー] をクリックし、Data Lake Storage Gen1 アカウントのフォルダーを選択して、 [アクセス] をクリックします。

    Screenshot of the Data explorer with a folder in the account and the Access option called out.

    b. [アクセス][追加][ユーザーまたはグループの選択] の順にクリックし、Microsoft.EventHubs を検索します。

    Screenshot of the Data explorer Access page with the Add option, Select User or Group option, and Microsoft Eventhubs option called out.

    [選択] をクリックします。

    c. [アクセス許可の割り当て][アクセス許可の選択] をクリックします。 [アクセス許可][読み取り、書き込み][実行] に設定します。 [追加先][このフォルダーとすべての子] に設定します。 最後に、 [追加ユーザー][アクセス許可エントリと既定のアクセス許可エントリ] に設定します。

    Screenshot of the Assign Permissions section with the Select Permissions option called out. The Select Permissions section is next to it with the Read, Write, and Execute options, the Add to option, and the Add as option called out.

    [OK] をクリックします。

Data Lake Storage Gen1 にデータをキャプチャするよう Event Hubs を構成する

このセクションでは、Event Hubs 名前空間内にイベント ハブを作成します。 さらに、Azure Data Lake Storage Gen1 アカウントにデータをキャプチャするよう、そのイベント ハブを構成します。 このセクションでは、Event Hubs 名前空間を既に作成していることを前提としています。

  1. Event Hubs 名前空間の [概要] ウィンドウで、 + [イベント ハブ] をクリックします。

    Screenshot of the Overview pane with the Event Hub option called out.

  2. 次の値を設定して、Data Lake Storage Gen1 にデータをキャプチャするよう Event Hubs を構成します。

    Screenshot of the Create Event Hub dialog box with the Name text box, the Capture option, the Capture Provider option, the Select Data Lake Store option, and the Data Lake Path option called out.

    a. イベント ハブの名前を指定します。

    b. このチュートリアルでは、 [パーティション数][メッセージのリテンション期間] を既定値に設定します。

    c. [キャプチャ][オン] に設定します。 [時間枠] (キャプチャの頻度) と [ウィンドウのサイズ変更] (キャプチャするデータのサイズ) を設定します。

    d. [Capture Provider]\(キャプチャ プロバイダー\) には [Azure Data Lake Store] を選択し、前に作成した Data Lake Storage Gen1 アカウントを選択します。 [Data Lake Path]\(Data Lake パス\) には、Data Lake Storage Gen1 アカウントに作成したフォルダーの名前を入力します。 入力するのはフォルダーの相対パスだけでかまいません。

    e. [サンプルのキャプチャ ファイル名の形式] は既定値のままにします。 このオプションは、キャプチャ フォルダーの下に作成されるフォルダー構造を制御します。

    f. Create をクリックしてください。

設定をテストする

Azure Event Hubs にデータを送信することで、ソリューションをテストできるようになりました。 Azure Event Hubs へのイベントの送信に関するページで説明されている手順に従ってください。 データの送信を開始すると、指定したフォルダー構造を使用して Data Lake Storage Gen1 に反映されたデータが表示されます。 例として、Data Lake Storage Gen1 アカウントに表示されたフォルダー構造を次のスクリーンショットに示します。

Sample EventHub data in Data Lake Storage Gen1

注意

Event Hubs に送信されたメッセージがない場合でも、Event Hubs はヘッダーだけの空ファイルを Data Lake Storage Gen1 アカウントに書き込みます。 これらのファイルは、イベント ハブの作成時に指定した期間と同じ間隔で書き込まれます。

Data Lake Storage Gen1 でのデータの分析

データが Data Lake Storage Gen1 に保存されると、分析ジョブを実行してデータを処理および高速処理できます。 Azure Data Lake Analytics を使用してこれを行う方法については、USQL Avro の例のページを参照してください。

関連項目