Öğretici: Azure Data Lake Storage 2. Nesil(Genel Önizleme) içinde depolanan delta tablosuna yazma

Bu öğreticide, Azure Data Lake Storage 2. Nesil'daki bir Delta tablosuna yazmak için Stream Analytics işi oluşturma işlemi gösterilmektedir. Bu öğreticide aşağıdakilerin nasıl yapılacağını öğreneceksiniz:

  • Olay hub'ınıza örnek veriler gönderen bir olay oluşturucu dağıtma
  • Akış Analizi işi oluşturma
  • Delta tablosuyla Azure Data Lake Storage 2. Nesil yapılandırma
  • Stream Analytics işini çalıştırma

Önkoşullar

Başlamadan önce aşağıdaki adımları tamamlayın:

Akış Analizi işi oluşturma

  1. Azure Portal’ında oturum açın.

  2. Soldaki menüden Tüm hizmetler'i seçin.

  3. Fareyi Analiz bölümündeki Stream Analytics işlerinin üzerine getirin ve + (artı) seçeneğini belirleyin.

    Screenshot that shows the selection of Stream Analytics jobs in the All services page.

  4. Azure portalının sol üst köşesinde bulunan Kaynak oluştur öğesini seçin.

  5. Sonuçlar listesinden Analytics>Stream Analytics işi'ni seçin.

  6. Yeni Stream Analytics işi sayfasında şu adımları izleyin:

    1. Abonelik için Azure aboneliğinizi seçin.
    2. Kaynak grubu için, Daha önce TollApp dağıtımında kullandığınız kaynağın aynısını seçin.
    3. Ad alanına iş için bir ad girin. Stream Analytics işinin adı yalnızca alfasayısal karakter, kısa çizgi ve alt çizgi içerebilir ve 3 ila 63 karakter uzunluğunda olmalıdır.
    4. Barındırma ortamı için Bulut'un seçili olduğunu onaylayın.
    5. Akış birimleri için 1'i seçin. Akış birimleri, bir işin yürütülmesi için gereken bilgi işlem kaynaklarını temsil eder. Akış birimlerini ölçeklendirme hakkında bilgi edinmek için akış birimlerini anlama ve ayarlama başlıklı makaleye bakın.

    Screenshot that shows the Create Stream Analytics job page.

  7. Sayfanın alt kısmındaki Gözden geçir ve oluştur'u seçin.

  8. Gözden geçir ve oluştur sayfasında ayarları gözden geçirin ve Oluştur'u seçerek Stream Analytics sayfası oluşturun.

  9. Dağıtım sayfasında Kaynağa git'i seçerek Stream Analytics iş sayfasına gidin.

İş girişi yapılandırma

Sonraki adım, TollApp dağıtımında oluşturulan olay hub'ını kullanarak işin verileri okuması için bir giriş kaynağı tanımlamaktır.

  1. Önceki bölümde oluşturulan Stream Analytics işini bulun.

  2. Stream Analytics işinin İş Topolojisi bölümünde Girişler'i seçin.

  3. + Giriş ve Olay hub'ı ekle'yi seçin.

    Screenshot that shows the Inputs page.

  4. Giriş formunu TollApp Azure Şablonu aracılığıyla oluşturulan aşağıdaki değerlerle doldurun:

    1. Giriş diğer adı olarak giriş akışı girin.

    2. Aboneliklerinizden Olay Hub'ı Seç'i seçin.

    3. Abonelik için Azure aboneliğinizi seçin.

    4. Olay Hub'ı ad alanı için önceki bölümde oluşturduğunuz olay hub'ı ad alanını seçin.

    5. Kalan ayarlarda varsayılan seçenekleri kullanın ve Kaydet’i seçin.

      Screenshot that shows the selection of the input event hub.

İş çıkışını yapılandırma

Sonraki adım, işin veri yazabileceği bir çıkış havuzu tanımlamaktır. Bu öğreticide, çıkışı Azure Data Lake Storage 2. Nesil bir Delta tablosuna yazarsınız.

  1. Stream Analytics işinin İş Topolojisi bölümünde Çıkışlar seçeneğini belirleyin.

  2. + Çıkış>Blob depolaması/ADLS 2. Nesil ekle'yi seçin.

    Screenshot that shows the Outputs page.

  3. Çıkış formunu aşağıdaki ayrıntılarla doldurun ve Kaydet'i seçin:

    1. Çıkış diğer adı olarak DeltaOutput girin.

    2. Aboneliklerinizden Blob depolama/ADLS 2. Nesil'i seçin.

    3. Abonelik için Azure aboneliğinizi seçin.

    4. Depolama hesabı için oluşturduğunuz ADLS 2. Nesil hesabını (tollapp ile başlayan hesap) seçin.

    5. Kapsayıcı için Yeni oluştur'u seçin ve benzersiz bir kapsayıcı adı sağlayın.

    6. Olay Serileştirme Biçimi için Delta Lake (Önizleme)'yi seçin. Delta lake buradaki seçeneklerden biri olarak listelenmiş olsa da veri biçimi değildir. Delta Lake, verilerinizi depolamak için sürümlenmiş Parquet dosyalarını kullanır. Delta lake hakkında daha fazla bilgi edinmek için.

    7. Delta tablo yolu için öğretici klasörü/delta tablosu girin.

    8. Kalan ayarlarda varsayılan seçenekleri kullanın ve Kaydet’i seçin.

      Screenshot that shows configuration of the output.

Sorgu oluşturma

Bu noktada, gelen veri akışını okumak için ayarlanmış bir Stream Analytics işiniz vardır. Sonraki adım, verileri gerçek zamanlı olarak analiz eden bir sorgu oluşturmaktır. Sorgular, Stream Analytics'e özgü bazı uzantıları olan SQL benzeri bir dil kullanır.

  1. Şimdi soldaki menüden İş topolojisi'nin altında Sorgu'yu seçin.

  2. Sorgu penceresine aşağıdaki sorguyu girin. Bu örnekte sorgu, Event Hubs'daki verileri okur ve seçilen değerleri ADLS 2. Nesil'deki bir Delta tablosuna kopyalar.

     SELECT State, CarModel.Make, TollAmount
     INTO DeltaOutput
     FROM EntryStream TIMESTAMP BY EntryTime
    
  3. Araç çubuğunda Sorguyu kaydet'i seçin.

    Screenshot that shows query for the job.

Stream Analytics işini başlatıp çıktıyı denetleyin

  1. Azure portalında işe genel bakış sayfasına dönün ve Başlat'ı seçin.

    Screenshot that shows the selection of Start job button on the Overview page.

  2. İşi başlat sayfasında İş çıktısı başlangıç zamanı için Şimdi seçeneğinin belirlendiğini onaylayın ve ardından sayfanın alt kısmındaki Başlat'ı seçin.

    Screenshot that shows the selection of Start job page.

  3. Birkaç dakika sonra portalda iş için çıkış olarak yapılandırdığınız depolama hesabını ve kapsayıcıyı bulun. Artık delta tablosunu kapsayıcıda belirtilen klasörde görebilirsiniz. İşin ilk kez başlatılması birkaç dakika sürer, başlatıldıktan sonra veriler geldikçe çalışmaya devam eder.

    Screenshot that shows output data files in the container.

Kaynakları temizleme

Artık gerekli olmadığında kaynak grubunu, Stream Analytics işini ve tüm ilgili kaynakları silin. İşin silinmesi, iş tarafından kullanılan akış birimlerinin faturalanmasını önler. İşi gelecekte kullanmayı planlıyorsanız, durdurup daha sonra gerektiğinde yeniden başlatabilirsiniz. Bu işi kullanmaya devam etmeyecekseniz, aşağıdaki adımları kullanarak bu öğretici tarafından oluşturulan tüm kaynakları silin:

  1. Azure portalında sol taraftaki menüden, Kaynak grupları'nı ve ardından oluşturduğunuz kaynağın adını seçin.
  2. Kaynak grubu sayfanızda, Sil'i seçin, metin kutusuna silinecek kaynağın adını yazın ve ardından Sil'i seçin.

Sonraki adımlar

Bu öğreticide basit bir Stream Analytics işi oluşturdunuz, gelen verileri filtrelediyseniz ve sonuçları ADLS 2. Nesil hesabında bir Delta tablosuna yazdınız. Stream Analytics işleri hakkında daha fazla bilgi edinmek için: