Rövid útmutató: Az első adatfolyam létrehozása az adatok lekéréséhez és átalakításához

Az adatfolyamok önkiszolgáló, felhőalapú, adat-előkészítési technológiák. Ebben a cikkben létrehozza az első adatfolyamot, lekéri az adatfolyam adatait, majd átalakítja az adatokat, és közzéteszi az adatfolyamot.

Előfeltételek

A kezdés előtt a következő előfeltételek szükségesek:

Adatfolyam létrehozása

Ebben a szakaszban az első adatfolyamot hozza létre.

  1. Váltson a Data Factory felületére.

    Screenshot with the data factory experience emphasized.

  2. Lépjen a Microsoft Fabric-munkaterületre.

    Screenshot of the workspaces window where you navigate to your workspace.

  3. Válassza az Új, majd az Adatfolyam Gen2 lehetőséget.

    Screenshot with the Dataflow Gen2 selection emphasized.

Adatok lekérése

Szerezzünk be néhány adatot! Ebben a példában egy OData-szolgáltatásból kap adatokat. Az adatfolyam adatainak lekéréséhez kövesse az alábbi lépéseket.

  1. Az adatfolyam-szerkesztőben válassza az Adatok lekérése, majd az Egyebek lehetőséget.

    Screenshot with the Get Data option selected and More emphasized in the drop-down box.

  2. Az Adatforrás kiválasztása területen válassza a Továbbiak megtekintése lehetőséget.

    Screenshot of Get data source with View more emphasized.

  3. Az Új forrásban válassza az Egyéb>OData lehetőséget adatforrásként.

    Screenshot of Get data source with the Other category and the OData connector emphasized.

  4. Írja be az URL-címethttps://services.odata.org/v4/northwind/northwind.svc/, majd válassza a Tovább gombot.

    Screenshot of the OData data source where you enter the data URL.

  5. Válassza a Rendelések és ügyfelek táblát, majd a Létrehozás lehetőséget.

    Screenshot of the Power Query navigator with the Customers and Orders tables emphasized.

Az adatbeolvasási felületről és a funkciókról az Adatok lekérése áttekintés című témakörben olvashat bővebben.

Átalakítások alkalmazása és közzététel

Most betöltötte az adatokat az első adatfolyamba, gratulálunk! Most itt az ideje, hogy néhány átalakítást alkalmazzon, hogy ezeket az adatokat a kívánt alakzatba hozza.

Ezt a feladatot a Power Query-szerkesztőből fogja elvégezni. A Power Query-szerkesztő részletes áttekintését a Power Query felhasználói felületén találja.

Az átalakítások alkalmazásához és közzétételéhez kövesse az alábbi lépéseket:

  1. Győződjön meg arról, hogy az adatprofilozási eszközök engedélyezve vannak az Otthoni>beállítások>globális beállításaihoz való navigálással.

    Screenshot of Global options with the Column profile selections emphasized.

    Győződjön meg arról is, hogy engedélyezte a diagramnézetet a Power Query-szerkesztő menüszalagJának Nézet lapjának beállításaival, vagy a Power Query ablakának jobb alsó sarkában található diagramnézet ikonra kattintva.

    Screenshot of the overall look of Power Query diagram view.

  2. A Rendelések táblában kiszámítja az ügyfélenkénti rendelések teljes számát. A cél eléréséhez válassza ki a CustomerID oszlopot az adatelőnézetben, majd válassza a Csoportosítás elemet a menüszalag Átalakítás lapján.

    Screenshot showing the Orders table selected, and Group by emphasized in the Transform tab.

  3. A sorok számát a Csoportosítás szempontja összesítésként hajtja végre. A csoportosítási és összegzési lehetőségekről a csoportosítási és összegzési lehetőségekről tudhat meg többet.

    Screenshot of Group by, with the Count rows operation selected.

  4. Miután csoportosította az adatokat a Rendelések táblában, egy kétoszlopos táblát szerzünk be a CustomerID azonosítóval és a Count (Darabszám) oszlopokkal.

    Screenshot of the two column table.

  5. Ezután egyesíteni szeretné a Vevők táblából származó adatokat az ügyfélenkénti rendelések számával. Az adatok kombinálásához válassza ki az Ügyfelek lekérdezést a Diagram nézetben, és a "⋮" menüvel új átalakításként érheti el az Egyesítő lekérdezéseket.

    Screenshot of the dataflow editor, with the vertical ellipsis of the Customers table and Merge queries as new emphasized.

  6. Konfigurálja az egyesítési műveletet az alábbi képernyőképen látható módon úgy, hogy mindkét táblában a CustomerID elemet választja egyező oszlopként. Ezután válassza az OK gombot.

    Screenshot of the Merge window.

    Képernyőkép az Egyesítés ablakról, amelyen a Bal oldali tábla az egyesítéshez a Vevők táblára, a Jobb oldali tábla pedig a Rendelések táblára egyesítéshez. A CustomerID oszlop a Vevők és a Rendelések táblákhoz is ki van jelölve. Emellett az Illesztés típus bal oldali külső értékre van állítva. Az összes többi kijelölés az alapértelmezett értékre van állítva.

  7. Az Egyesítő lekérdezések új műveletként történő végrehajtásakor egy új lekérdezést kap a Vevők tábla összes oszlopával, egy oszlopot pedig a Rendelések táblából beágyazott adatokkal.

    Screenshot of the dataflows editor with the new Merge query added to the right of the Customers and Orders tables.

  8. Ebben a példában csak az Ügyfelek tábla oszlopainak egy részhalmaza érdekli. Ezeket az oszlopokat a sémanézet használatával választhatja ki. Engedélyezze a sémanézetet az adatfolyam-szerkesztő jobb alsó sarkában található váltógombon belül.

    Screenshot of the dataflows editor with the schema view button emphasized in the bottom-right corner.

  9. A sémanézet egy szűrt nézetet biztosít egy tábla sémaadataiban, beleértve az oszlopneveket és az adattípusokat. A sémanézet sémaeszközök készletével rendelkezik, melyek egy környezetfüggő menüszalaglapon érhetők el. Ebben a forgatókönyvben a CustomerID, a CompanyName és a Orders (2) oszlopot, majd az Oszlopok eltávolítása gombot, majd a Sémaeszközök lapon válassza a További oszlopok eltávolítása lehetőséget.

    Screenshot of the schema view showing all of the available column names, with the CustomerID, CompanyName, and Orders (2) columns emphasized.

    Screenshot of the schema tools menu with Remove other columns emphasized.

  10. A Rendelések (2) oszlop beágyazott információkat tartalmaz, amely a néhány lépéssel ezelőtt végrehajtott egyesítési műveletből származik. Most váltson vissza az adatnézetre a felhasználói felület jobb alsó sarkában, a Sémanézet megjelenítése gomb melletti Adatnézet megjelenítése gombra kattintva. Ezután a Rendelések (2) oszlopfejléc Oszlopkibontása átalakításával jelölje ki a Darabszám oszlopot.

    Screenshot for using data view.

  11. Végső műveletként a rendelések száma alapján szeretné rangsorolni az ügyfeleket. Jelölje ki a Darabszám oszlopot, majd válassza a Rangsor oszlop gombot a menüszalag Oszlop hozzáadása lapja alatt.

    Screenshot of the dataflows editor with the Count column selected.

  12. Tartsa meg az alapértelmezett beállításokat a Rangsor oszlopban. Ezután kattintson az OK gombra az átalakítás alkalmazásához.

    Screenshot of the Rank window with all default settings displayed.

  13. Most nevezze át az eredményként kapott lekérdezést rangsorolt ügyfeleknek a képernyő jobb oldalán található Lekérdezés beállításai panel használatával.

    Screenshot of the dataflows editor with the Ranked Customers name emphasized under the query settings properties.

  14. Befejezte az adatok átalakítását és kombinálását. Így most már konfigurálhatja a kimeneti célhely beállításait. Válassza az Adatcél kiválasztása lehetőséget a Lekérdezés beállításai panel alján.

    Screenshot of the dataflows editor with the location of the Data destination selection emphasized.

  15. Ebben a lépésben konfigurálhat egy kimenetet a lakehouse-hoz, ha van elérhető, vagy kihagyhatja ezt a lépést, ha nem. Ezen a felületen a frissítési módszer (Hozzáfűzés vagy Csere) mellett konfigurálhatja a lekérdezési eredmények céltóját és tábláját is.

    Screenshot of the Connect to data destination window with lakehouse selected.

    Screenshot of the Choose destination settings window.

  16. Az adatfolyam készen áll a közzétételre. Tekintse át a lekérdezéseket a diagram nézetben, majd válassza a Közzététel lehetőséget.

    Screenshot of the dataflows editor with the Publish button on the lower-right side emphasized.

    Most visszakerül a munkaterületre. Az adatfolyam neve melletti tárcsa ikon azt jelzi, hogy a közzététel folyamatban van. A közzététel befejezése után az adatfolyam készen áll a frissítésre!

    Fontos

    Amikor az első Adatfolyam Gen2 létrejön egy munkaterületen, a Lakehouse és a Warehouse-elemek ki lesznek építve a kapcsolódó SQL Analytics-végponttal és szemantikai modellekkel együtt. Ezeket az elemeket a munkaterület összes adatfolyama megosztja, és a 2. generációs adatfolyam működéséhez szükséges, nem szabad törölni, és nem közvetlenül a felhasználók használják őket. Az elemek a Dataflow Gen2 implementációjának részletei. Az elemek nem láthatók a munkaterületen, de más szolgáltatásokban is elérhetők lehetnek, például a Jegyzetfüzet, az SQL Analytics végpontja, a Lakehouse és a Warehouse szolgáltatásban. A névben szereplő előtag alapján felismerheti az elemeket. Az elemek előtagja az "AdatfolyamokStaging".

  17. A munkaterületen válassza a Frissítés ütemezése ikont.

    Screenshot of the workspace with the schedule refresh icon emphasized.

  18. Kapcsolja be az ütemezett frissítést, válassza a Másik időpont hozzáadása lehetőséget, és konfigurálja a frissítést az alábbi képernyőképen látható módon.

    Screenshot showing how to select another time.

    Képernyőkép az ütemezett frissítési lehetőségekről, be van kapcsolva az ütemezett frissítés, a frissítés gyakorisága Napi értékre, az időzóna a koordinált egyetemes időpontra és a 4:00-ra beállított idő. A bekapcsolva gomb, az Add another time selection, az adatfolyam tulajdonosa és az alkalmaz gomb mind ki van emelve.

Az erőforrások eltávolítása

Ha nem fogja tovább használni ezt az adatfolyamot, törölje az adatfolyamot az alábbi lépésekkel:

  1. Lépjen a Microsoft Fabric-munkaterületre.

    Screenshot of the workspaces window where you navigate to your workspace.

  2. Válassza ki az adatfolyam neve melletti függőleges három pontot, majd válassza a Törlés lehetőséget.

    Screenshot with the three vertical dots and the delete option in the drop-down menu emphasized.

  3. Válassza a Törlés lehetőséget az adatfolyam törlésének megerősítéséhez.

    Screenshot of the Delete dataflow window, with the Delete button emphasized.

A mintában szereplő adatfolyam bemutatja, hogyan tölthet be és alakíthat át adatokat a 2. generációs adatfolyamban. Megtanulta végrehajtani az alábbi műveleteket:

  • Adatfolyam gen2 létrehozása.
  • Adatok átalakítása.
  • Konfigurálja az átalakított adatok célbeállítását.
  • Futtassa és ütemezze az adatfolyamot.

A következő cikkből megtudhatja, hogyan hozhatja létre első adatfolyamát.