使用 Data Factory 對應資料流處理固定長度文字檔

發行項
04/27/2024

適用於：Azure Data Factory Azure Synapse Analytics

提示

試用 Microsoft Fabric 中的 Data Factory，這是適用於企業的全方位分析解決方案。 Microsoft Fabric 涵蓋從資料移動到資料科學、即時分析、商業智慧和報告的所有項目。了解如何免費開始新的試用！

您可以使用 Microsoft Azure Data Factory 中的對應資料流，從固定寬度文字檔轉換資料。在以下工作中，我們將不使用分隔符號定義文字檔資料集，然後根據序數位置設定 substring 分割。

建立新管線

選取 [+ 新增管線]，建立新管線。
新增資料流程活動，此活動將用於處理固定寬度檔案：
在資料流程活動中，選取 [新增對應資料流]。
新增 [來源]、[衍生的資料行]、[選取] 和 [接收] 轉換：
將 [來源] 轉換設定為使用新資料集，資料集會是分隔文字類型。

請勿設定任何資料行分隔符號或標頭。

我們現在要設定此檔案內容的欄位起點和長度：

1234567813572468
1234567813572468
1234567813572468
1234567813572468
1234567813572468
1234567813572468
1234567813572468
1234567813572468
1234567813572468
1234567813572468
1234567813572468
1234567813572468
1234567813572468

在 [來源] 轉換的 [投影] 索引標籤上，您應該會看到 Column_1 字串資料行。
在 [衍生的資料行] 中，建立新資料行。
我們會為資料行取簡單名稱，如 col1。
在運算式建立器中，輸入下列內容：

substring(Column_1,1,4)
對您必須剖析的所有資料行重複步驟 10。
選取 [檢查] 索引標籤，查看將產生的新資料行：
使用 [選取] 轉換，移除不須轉換的任何資料行：
使用 [接收] 將資料輸出至資料夾：

輸出看起來像這樣：

現在已分割固定寬度資料，每個有四個字元，並指派給 Col1、Col2、Col3、Col4 等。根據上述範例，資料會分割成四個資料行。

使用對應資料流程轉換，以組建資料流程邏輯的其餘部分。

使用 Data Factory 對應資料流處理固定長度文字檔

建立新管線

相關內容

其他資源