Upraszczanie struktury danych

Ukończone

Podczas importowania danych z wielu źródeł do programu Power BI Desktop dane zachowują wstępnie zdefiniowane nazwy tabel i kolumn. Niektóre z tych nazw warto zmienić, aby zachować spójny format, ułatwić sobie pracę lub sprawić, aby były bardziej zrozumiałe dla użytkownika.  Aby zmienić nazwy i uprościć strukturę danych, można użyć edytora Power Query w programie Power BI Desktop.

Aby kontynuować poprzedni scenariusz, w którym nadano kształt początkowym danym w modelu, podejmij dalsze działania mające na celu uproszczenie struktury danych dotyczących sprzedaży i przygotowanie ich do opracowywania raportów dla zespołu ds. sprzedaży.  Nazwy kolumn zostały już zmienione. Teraz należy więc sprawdzić nazwy zapytań (tabel), aby określić, czy można wprowadzić jakieś ulepszenia. Należy również przejrzeć zawartość kolumn i zamienić wszystkie wartości, które wymagają korekty.

Zmiana nazwy zapytania

Dobrym rozwiązaniem jest zmiana nietypowych lub nieprzydatnych nazw zapytań na nazwy, które są bardziej oczywiste lub bardziej znane użytkownikowi. Jeśli na przykład zaimportujesz tabelę faktów produktu do Power BI Desktop, a nazwa zapytania będzie wyświetlana jako FactProductTable, warto zmienić ją na bardziej przyjazną dla użytkownika nazwę, taką jak Products. Podobnie, jeśli zaimportujesz widok, widok może mieć nazwę zawierającą prefiks v, taki jak vProduct. Takie nazwy mogą być niejasne lub mylące dla użytkownika, więc lepiej usuwać takie prefiksy.

W tym przykładzie przyjrzano się nazwie zapytania TargetSales i zdecydowano, że jest ona nieprzydatna, ponieważ spowoduje utworzenie zapytania o takiej nazwie dla każdego roku.  Aby uniknąć nieporozumień, chcesz dodać rok do nazwy zapytania.

W Edytor Power Query w okienku Zapytania po lewej stronie danych wybierz zapytanie, którego nazwę chcesz zmienić. Kliknij prawym przyciskiem myszy zapytanie i wybierz polecenie Zmień nazwę. Edytuj bieżącą nazwę lub wpisz nową nazwę, a następnie naciśnij klawisz Enter.

Zmiana nazwy zapytania

Zamienianie wartości

Możesz użyć funkcji Zamień wartości w Edytor Power Query, aby zastąpić dowolną wartość inną wartością w wybranej kolumnie.

W tym przykładzie zauważysz, że w kolumnie Atrybut miesiąc grudzień jest błędnie napisany.  Musisz poprawić ten błąd pisowni. Wybierz kolumnę zawierającą wartość, którą chcesz zamienić (atrybut w tym przypadku), a następnie wybierz pozycję Zamień wartości na karcie Przekształć .

Funkcja Zamienianie wartości w edytorze Power Query

W polu Wartość do znalezienia wprowadź nazwę wartości, którą chcesz zamienić, a następnie w polu Zamień na wprowadź poprawną nazwę wartości, a następnie wybierz przycisk OK.  W edytorze Power Query nie można wybrać jednej komórki i zmienić jednej wartości tak jak na przykład w programie Excel.

Zamiana jednej wartości na inną w polu Wartość do znalezienia

Możesz przejrzeć listę kroków, które wykonano, aby zmienić strukturę i poprawić dane w okienku Ustawienia zapytania . Po wykonaniu wszystkich kroków, które chcesz wykonać, możesz wybrać pozycję Zamknij & Zastosuj, aby zamknąć Edytor Power Query i zastosować zmiany do modelu danych.  Możesz też wykonać dalsze czynności, aby wyczyścić i przekształcić dane.

Zamiana wartości null

Czasami może się okazać, że źródła danych zawierają wartości null. Na przykład kwota frachtu w zamówieniu sprzedaży może mieć wartość null, jeśli jest równoznaczna z zerem. Jeśli wartość pozostanie równa null, średnie nie zostaną poprawnie obliczone.  Jednym z rozwiązań jest zmiana wartości null na zera, dzięki czemu będzie można dokładniej obliczyć średnie koszty frachtu. W tym przypadku wykonanie tych samych kroków co wcześniej pomoże Ci zamienić wartości null na zera.

Zamiana wartości null wartością zerową

Usuwanie duplikatów

Można również usunąć duplikaty z kolumn, aby zachować unikatowe nazwy tylko w wybranej kolumnie przy użyciu funkcji Usuń duplikaty w Power Query.

W tym przykładzie zwróć uwagę, że kolumna Nazwa kategorii zawiera duplikaty dla każdej kategorii. W związku z tym chcesz utworzyć tabelę z unikatowymi kategoriami i użyć jej w modelu semantycznym. Tę akcję można osiągnąć, wybierając kolumnę, klikając prawym przyciskiem myszy nagłówek kolumny, a następnie wybierając opcję Usuń duplikaty .

Przed usunięciem duplikatów warto rozważyć utworzenie kopii tabeli. Opcja Kopiuj znajduje się u góry menu kontekstowego, jak pokazano na poniższym zrzucie ekranu. Jeśli skopiujesz tabelę przed usunięciem duplikatów, będzie można porównać obie tabele i skorzystać z nich w razie konieczności.

Funkcja usuwania duplikatów

Najlepsze rozwiązania dotyczące nazewnictwa tabel, kolumn i wartości

Nie istnieją sztywne reguły nazywania tabel, kolumn i wartości, zaleca się jednak używanie języka i skrótów, które są często używane w organizacji. Ważne jest też, aby konwencja nazewnictwa była ogólnie akceptowalna i traktowana jako powszechnie stosowana.

Najlepszym rozwiązaniem jest nadawanie tabelom, kolumnom i miarom nazw opisowych zgodnych z terminologią biznesową oraz zastępowanie znaków podkreślenia („_”) spacjami. Zachowaj spójność ze skrótami, prefiksami i wyrazami takimi jak "number" i "ID". Zbyt krótkie skróty mogą powodować nieporozumienie, jeśli nie są one często używane w organizacji.

Ponadto, usuwając z nazw tabel prefiksy lub sufiksy i nadając tabelom proste nazwy, można uniknąć pomyłek.

Podczas zamieniania wartości spróbuj wyobrazić sobie, jak te wartości będą wyświetlane w raporcie. Zbyt długie wartości mogą być trudne do odczytania i mogą nie mieścić się na wizualizacji. Zbyt krótkie wartości mogą być trudne do zinterpretowania. Unikanie akronimów w wartościach jest również dobrym pomysłem, pod warunkiem, że tekst będzie pasować do wizualizacji.