Szybki start: tworzenie pierwszego przepływu danych w celu pobierania i przekształcania danych

Przepływy danych to samoobsługowa, oparta na chmurze technologia przygotowywania danych. W tym artykule utworzysz swój pierwszy przepływ danych, pobierzesz dane dla przepływu danych, a następnie przekształcisz dane i opublikujesz przepływ danych.

Wymagania wstępne

Przed rozpoczęciem wymagane są następujące wymagania wstępne:

Utwórz przepływ danych

W tej sekcji tworzysz pierwszy przepływ danych.

  1. Przejdź do środowiska fabryki danych.

    Screenshot with the data factory experience emphasized.

  2. Przejdź do obszaru roboczego usługi Microsoft Fabric.

    Screenshot of the workspaces window where you navigate to your workspace.

  3. Wybierz pozycję Nowy, a następnie wybierz pozycję Przepływ danych Gen2.

    Screenshot with the Dataflow Gen2 selection emphasized.

Pobierz dane

Pobierzmy pewne dane! W tym przykładzie uzyskujesz dane z usługi OData. Aby uzyskać dane w przepływie danych, wykonaj następujące kroki.

  1. W edytorze przepływu danych wybierz pozycję Pobierz dane , a następnie wybierz pozycję Więcej.

    Screenshot with the Get Data option selected and More emphasized in the drop-down box.

  2. W obszarze Wybierz źródło danych wybierz pozycję Wyświetl więcej.

    Screenshot of Get data source with View more emphasized.

  3. W obszarze Nowe źródło wybierz pozycję Inne>dane OData jako źródło danych.

    Screenshot of Get data source with the Other category and the OData connector emphasized.

  4. Wprowadź adres URL https://services.odata.org/v4/northwind/northwind.svc/, a następnie wybierz pozycję Dalej.

    Screenshot of the OData data source where you enter the data URL.

  5. Wybierz tabele Orders and Customers (Zamówienia i klienci), a następnie wybierz pozycję Utwórz.

    Screenshot of the Power Query navigator with the Customers and Orders tables emphasized.

Aby dowiedzieć się więcej na temat środowiska i funkcji pobierania danych, zobacz Uzyskiwanie przeglądu danych.

Stosowanie przekształceń i publikowanie

Dane zostały załadowane do pierwszego przepływu danych, gratulacje! Teraz nadszedł czas, aby zastosować kilka przekształceń, aby przenieść te dane do żądanego kształtu.

Wykonasz to zadanie z poziomu edytora Power Query. Szczegółowe omówienie edytora Power Query można znaleźć w sekcji Interfejs użytkownika dodatku Power Query.

Wykonaj następujące kroki, aby zastosować przekształcenia i opublikować:

  1. Upewnij się, że narzędzia profilowania danych są włączone, przechodząc do> pozycji Opcje globalne opcji> strony głównej.

    Screenshot of Global options with the Column profile selections emphasized.

    Upewnij się również, że widok diagramu został włączony przy użyciu opcji na karcie Widok na wstążce edytora Power Query lub wybierając ikonę widoku diagramu w prawym dolnym rogu okna Dodatku Power Query.

    Screenshot of the overall look of Power Query diagram view.

  2. W tabeli Orders (Zamówienia) obliczana jest łączna liczba zamówień na klienta. Aby osiągnąć ten cel, wybierz kolumnę CustomerID w podglądzie danych, a następnie wybierz pozycję Grupuj według na karcie Przekształć na wstążce.

    Screenshot showing the Orders table selected, and Group by emphasized in the Transform tab.

  3. Liczbę wierszy należy wykonać jako agregację w obszarze Grupuj według. Aby dowiedzieć się więcej na temat funkcji Grupuj według, zobacz Grupowanie lub podsumowywanie wierszy.

    Screenshot of Group by, with the Count rows operation selected.

  4. Po zgrupowaniu danych w tabeli Orders (Zamówienia) uzyskamy dwukolumny tabelę z kolumnami CustomerID (Identyfikator klienta) i Count (Liczba ).

    Screenshot of the two column table.

  5. Następnie chcesz połączyć dane z tabeli Customers (Klienci) z tabelą Count of Orders per customer (Liczba zamówień na klienta). Aby połączyć dane, wybierz zapytanie Klienci w widoku diagramu i użyj menu "⋮", aby uzyskać dostęp do zapytań scalania jako nowej transformacji.

    Screenshot of the dataflow editor, with the vertical ellipsis of the Customers table and Merge queries as new emphasized.

  6. Skonfiguruj operację scalania, jak pokazano na poniższym zrzucie ekranu, wybierając pozycję CustomerID jako pasującą kolumnę w obu tabelach. Następnie wybierz Ok.

    Screenshot of the Merge window.

    Zrzut ekranu przedstawiający okno Scalanie z tabelą Po lewej stronie dla scalania ustawioną na tabelę Customers (Klienci) i tabelą Right (Prawa) dla scalania ustawioną na tabelę Orders (Zamówienia). Kolumna CustomerID jest wybierana zarówno dla tabel Customers, jak i Orders. Ponadto dla opcji Rodzaj sprzężenia jest ustawiona wartość Lewa zewnętrzna. Wszystkie inne opcje są ustawione na ich wartość domyślną.

  7. Podczas wykonywania zapytań scalania jako nowej operacji uzyskujesz nowe zapytanie ze wszystkimi kolumnami z tabeli Customers i jedną kolumną z zagnieżdżonymi danymi z tabeli Orders (Zamówienia).

    Screenshot of the dataflows editor with the new Merge query added to the right of the Customers and Orders tables.

  8. W tym przykładzie interesuje Cię tylko podzbiór kolumn w tabeli Customers. Te kolumny są wybierane przy użyciu widoku schematu. Włącz widok schematu w przycisku przełącznika w prawym dolnym rogu edytora przepływów danych.

    Screenshot of the dataflows editor with the schema view button emphasized in the bottom-right corner.

  9. Widok schematu zapewnia skoncentrowany widok na informacje o schemacie tabeli, w tym nazwy kolumn i typy danych. Widok schematu zawiera zestaw narzędzi schematu dostępnych za pomocą kontekstowej karty wstążki. W tym scenariuszu wybierasz kolumny CustomerID, CompanyName i Orders (2), a następnie wybierz przycisk Usuń kolumny, a następnie wybierz pozycję Usuń inne kolumny na karcie Narzędzia schematu.

    Screenshot of the schema view showing all of the available column names, with the CustomerID, CompanyName, and Orders (2) columns emphasized.

    Screenshot of the schema tools menu with Remove other columns emphasized.

  10. Kolumna Orders (2) zawiera zagnieżdżone informacje wynikające z operacji scalania wykonanej kilka kroków temu. Teraz wróć do widoku danych, wybierając przycisk Pokaż widok danych obok przycisku Pokaż widok schematu w prawym dolnym rogu interfejsu użytkownika. Następnie użyj przekształcenia Rozwiń kolumnę w nagłówku kolumny Orders (2), aby wybrać kolumnę Count (Liczba ).

    Screenshot for using data view.

  11. Jako ostateczna operacja chcesz sklasyfikować klientów w oparciu o ich liczbę zamówień. Wybierz kolumnę Liczba , a następnie wybierz przycisk Kolumna rangi na karcie Dodaj kolumnę na wstążce.

    Screenshot of the dataflows editor with the Count column selected.

  12. Zachowaj ustawienia domyślne w kolumnie Ranga. Następnie wybierz przycisk OK , aby zastosować tę transformację.

    Screenshot of the Rank window with all default settings displayed.

  13. Teraz zmień nazwę wynikowego zapytania jako Sklasyfikowani klienci przy użyciu okienka Ustawienia zapytania po prawej stronie ekranu.

    Screenshot of the dataflows editor with the Ranked Customers name emphasized under the query settings properties.

  14. Zakończono przekształcanie i łączenie danych. Dlatego teraz skonfigurujesz jego ustawienia wyjściowe miejsca docelowego. Wybierz pozycję Wybierz miejsce docelowe danych w dolnej części okienka Ustawienia zapytania.

    Screenshot of the dataflows editor with the location of the Data destination selection emphasized.

  15. W tym kroku możesz skonfigurować dane wyjściowe w usłudze Lakehouse, jeśli masz dostępną, lub pominąć ten krok, jeśli nie. W tym środowisku możesz skonfigurować docelowy magazyn lakehouse i tabelę dla wyników zapytania, oprócz metody aktualizacji (Append or Replace).

    Screenshot of the Connect to data destination window with lakehouse selected.

    Screenshot of the Choose destination settings window.

  16. Przepływ danych jest teraz gotowy do opublikowania. Przejrzyj zapytania w widoku diagramu, a następnie wybierz pozycję Publikuj.

    Screenshot of the dataflows editor with the Publish button on the lower-right side emphasized.

    Teraz wrócisz do obszaru roboczego. Ikona pokrętła obok nazwy przepływu danych wskazuje, że publikowanie jest w toku. Po zakończeniu publikowania przepływ danych jest gotowy do odświeżenia.

    Ważne

    Po utworzeniu pierwszego przepływu danych Gen2 w obszarze roboczym elementy usługi Lakehouse i Warehouse są aprowizowane wraz z powiązanymi punktami końcowymi i semantycznymi modelami analizy SQL. Te elementy są współużytkowane przez wszystkie przepływy danych w obszarze roboczym i są wymagane, aby przepływ danych Gen2 działał, nie powinien być usuwany i nie jest przeznaczony do bezpośredniego użycia przez użytkowników. Elementy są szczegółami implementacji usługi Dataflow Gen2. Elementy nie są widoczne w obszarze roboczym, ale mogą być dostępne w innych środowiskach, takich jak notes, punkt końcowy analizy SQL, usługa Lakehouse i magazyn. Elementy można rozpoznać według ich prefiksu w nazwie. Prefiks elementów to "Przepływy danychStaging".

  17. W obszarze roboczym wybierz ikonę Zaplanuj odświeżanie .

    Screenshot of the workspace with the schedule refresh icon emphasized.

  18. Włącz zaplanowane odświeżanie, wybierz pozycję Dodaj kolejny raz i skonfiguruj odświeżanie, jak pokazano na poniższym zrzucie ekranu.

    Screenshot showing how to select another time.

    Zrzut ekranu przedstawiający opcje zaplanowanego odświeżania z włączonym zaplanowanym odświeżaniem, częstotliwością odświeżania ustawioną na wartość Codziennie, strefą czasową ustawioną na uniwersalny czas koordynowany oraz czasem ustawionym na 4:00. Przycisk włączone, wybór Dodaj inny czas, właściciel przepływu danych i przycisk Zastosuj są podkreślone.

Czyszczenie zasobów

Jeśli nie zamierzasz nadal korzystać z tego przepływu danych, usuń przepływ danych, wykonując następujące czynności:

  1. Przejdź do obszaru roboczego usługi Microsoft Fabric.

    Screenshot of the workspaces window where you navigate to your workspace.

  2. Wybierz wielokropek pionowy obok nazwy przepływu danych, a następnie wybierz pozycję Usuń.

    Screenshot with the three vertical dots and the delete option in the drop-down menu emphasized.

  3. Wybierz pozycję Usuń , aby potwierdzić usunięcie przepływu danych.

    Screenshot of the Delete dataflow window, with the Delete button emphasized.

W przepływie danych w tym przykładzie pokazano, jak ładować i przekształcać dane w przepływie danych Gen2. W tym samouczku omówiono:

  • Utwórz przepływ danych Gen2.
  • Przekształcanie danych.
  • Skonfiguruj ustawienia docelowe dla przekształconych danych.
  • Uruchamianie i planowanie potoku danych.

Przejdź do następnego artykułu, aby dowiedzieć się, jak utworzyć pierwszy potok danych.