Data Factory eşleme veri akışlarını kullanarak sabit uzunlukta metin dosyalarını işleme

UYGULANANLAR: Azure Data Factory Azure Synapse Analytics

Bahşiş

Kuruluşlar için hepsi bir arada analiz çözümü olan Microsoft Fabric'te Data Factory'yi deneyin. Microsoft Fabric , veri taşımadan veri bilimine, gerçek zamanlı analize, iş zekasına ve raporlamaya kadar her şeyi kapsar. Yeni bir deneme sürümünü ücretsiz olarak başlatmayı öğrenin!

Microsoft Azure Data Factory'de eşleme veri akışlarını kullanarak sabit genişlikli metin dosyalarındaki verileri dönüştürebilirsiniz. Aşağıdaki görevde, sınırlayıcı içermeyen bir metin dosyası için bir veri kümesi tanımlayacak ve ardından sıralı konuma göre alt dize bölmeleri ayarlayacağız.

İşlem hattı oluşturma

  1. Yeni bir işlem hattı oluşturmak için +Yeni İşlem Hattı'na tıklayın.

  2. Sabit genişlikli dosyaları işlemek için kullanılacak bir veri akışı etkinliği ekleyin:

    Fixed Width Pipeline

  3. Veri akışı etkinliğinde Yeni eşleme veri akışı'nı seçin.

  4. Kaynak, Türetilmiş Sütun, Seç ve Havuz dönüşümü ekleyin:

    Fixed Width Data Flow

  5. Kaynak dönüştürmesini, Sınırlandırılmış Metin türünde olacak yeni bir veri kümesi kullanacak şekilde yapılandırın.

  6. Herhangi bir sütun sınırlayıcısı veya üst bilgi ayarlamayın.

    Şimdi bu dosyanın içeriği için alan başlangıç noktalarını ve uzunluklarını ayarlayacağız:

    1234567813572468
    1234567813572468
    1234567813572468
    1234567813572468
    1234567813572468
    1234567813572468
    1234567813572468
    1234567813572468
    1234567813572468
    1234567813572468
    1234567813572468
    1234567813572468
    1234567813572468
    
  7. Kaynak dönüşümünüzün Projeksiyon sekmesinde, Column_1 adlı bir dize sütunu görmeniz gerekir.

  8. Türetilmiş sütununda yeni bir sütun oluşturun.

  9. Sütunlara col1 gibi basit adlar vereceğiz.

  10. İfade oluşturucusunda aşağıdakileri yazın:

    substring(Column_1,1,4)

    derived column

  11. Ayrıştırmanız gereken tüm sütunlar için 10. adımı yineleyin.

  12. Oluşturulacak yeni sütunları görmek için İncele sekmesini seçin:

    inspect

  13. Dönüştürme için ihtiyacınız olmayan sütunlardan herhangi birini kaldırmak için Dönüştürmeyi seç'i kullanın:

    select transformation

  14. Bir klasöre veri çıkışı yapmak için Havuz kullanın:

    fixed width sink

    Çıkış şöyle görünür:

    fixed width output

Sabit genişlikli veriler artık bölünmüştür ve her biri dört karakterden oluşur ve Col1, Col2, Col3, Col4 vb.'ye atanır. Önceki örnekten yola çıkarak veriler dört sütuna ayrılmıştır.