Tabele w magazynowaniu danych w usłudze Microsoft Fabric

Dotyczy: Magazyn w usłudze Microsoft Fabric

W tym artykule szczegółowo przedstawiono kluczowe pojęcia dotyczące projektowania tabel w usłudze Microsoft Fabric.

W tabelach dane są logicznie zorganizowane w formacie wierszy i kolumn. Każdy wiersz reprezentuje unikatowy rekord, a każda kolumna reprezentuje pole w rekordzie.

  • W magazynie tabele to obiekty bazy danych zawierające wszystkie dane transakcyjne.

Określanie kategorii tabeli

Schemat gwiazdy organizuje dane w tabele faktów i wymiarów. Niektóre tabele są używane do integracji lub przemieszczania danych przed przejściem do tabeli faktów lub wymiarów. Podczas projektowania tabeli zdecyduj, czy dane tabeli należą do tabeli faktów, wymiarów lub tabeli integracji. Ta decyzja informuje o odpowiedniej strukturze tabeli.

  • Tabele faktów zawierają dane ilościowe, które są często generowane w systemie transakcyjnym, a następnie ładowane do magazynu danych. Na przykład firma detaliczna generuje transakcje sprzedaży każdego dnia, a następnie ładuje dane do tabeli faktów magazynu danych na potrzeby analizy.

  • Tabele wymiarów zawierają dane atrybutów , które mogą ulec zmianie, ale zwykle zmieniają się rzadko. Na przykład nazwa i adres klienta są przechowywane w tabeli wymiarów i aktualizowane tylko wtedy, gdy profil klienta ulegnie zmianie. Aby zminimalizować rozmiar dużej tabeli faktów, nazwa i adres klienta nie muszą znajdować się w każdym wierszu tabeli faktów. Zamiast tego tabela faktów i tabela wymiarów mogą udostępniać identyfikator klienta. Zapytanie może łączyć dwie tabele w celu skojarzenia profilu i transakcji klienta.

  • Tabele integracji zapewniają miejsce na integrowanie lub przemieszczanie danych. Można na przykład załadować dane do tabeli przejściowej, wykonać przekształcenia danych w środowisku przejściowym, a następnie wstawić dane do tabeli produkcyjnej.

Tabela przechowuje dane w usłudze OneLake w ramach magazynu. Tabela i dane utrzymują się, czy sesja jest otwarta.

Tabele w magazynie

Aby wyświetlić organizację tabel, można użyć factwartości , dimlub int jako prefiksów do nazw tabel. W poniższej tabeli przedstawiono niektóre nazwy schematów i tabel dla przykładowego magazynu danych WideWorldImportersDW .

Nazwa tabeli źródłowej WideWorldImportersDW Typ tabeli Nazwa tabeli magazynu danych
City Wymiar wwi.DimCity
Zamówienie Fakt wwi.FactOrder
  • W nazwach tabel jest uwzględniana wielkość liter.
  • Nazwy tabel nie mogą zawierać / ani \ kończyć się symbolem ..

Utwórz tabelę

W przypadku magazynu możesz utworzyć tabelę jako nową pustą tabelę. Możesz również utworzyć i wypełnić tabelę wynikami instrukcji select. Poniżej przedstawiono polecenia języka T-SQL służące do tworzenia tabeli.

T-SQL, instrukcja opis
CREATE TABLE Tworzy pustą tabelę, definiując wszystkie kolumny i opcje tabeli.
CREATE TABLE AS SELECT Wypełnia nową tabelę wynikami instrukcji select. Kolumny tabeli i typy danych są oparte na wynikach instrukcji select. Aby zaimportować dane, ta instrukcja może wybrać elementy z tabeli zewnętrznej.

W tym przykładzie zostanie utworzona tabela z dwiema kolumnami:

CREATE TABLE MyTable (col1 int, col2 int );  

Nazwy schematu

Magazyn obsługuje tworzenie schematów niestandardowych. Podobnie jak w programie SQL Server schematy są dobrym sposobem grupowania obiektów używanych w podobny sposób. Poniższy kod tworzy schemat zdefiniowany przez użytkownika o nazwie wwi.

  • W nazwach schematów jest rozróżniana wielkość liter.
  • Nazwy schematów nie mogą zawierać / ani \ kończyć się ciągiem ..
CREATE SCHEMA wwi;

Typy danych

Usługa Microsoft Fabric obsługuje najczęściej używane typy danych T-SQL.

Sortowanie

Latin1_General_100_BIN2_UTF8 Obecnie jest to domyślne i obsługiwane sortowanie tylko dla tabel i metadanych.

Statystyki

Optymalizator zapytań używa statystyk na poziomie kolumny podczas tworzenia planu wykonywania zapytania. Aby zwiększyć wydajność zapytań, ważne jest, aby statystyki dotyczące poszczególnych kolumn, zwłaszcza kolumn używanych w sprzężeniach zapytań. Magazyn obsługuje automatyczne tworzenie statystyk.

Aktualizacja statystyczna nie jest automatycznie aktualizowana. Zaktualizuj statystyki po dodaniu lub zmianie liczby wierszy. Na przykład zaktualizuj statystyki po załadowaniu. Aby uzyskać więcej informacji, zobacz Statystyka.

Klucz podstawowy, klucz obcy i unikatowy klucz

W przypadku magazynu klucz PODSTAWOWY i ograniczenie UNIKATOWE są obsługiwane tylko wtedy, gdy są używane wartości NONCLUSTERED i NOT ENFORCED.

KLUCZ OBCY jest obsługiwany tylko wtedy, gdy nie jest używany wymuszony.

Dopasowywanie danych źródłowych do magazynu danych

Tabele magazynu są wypełniane przez ładowanie danych z innego źródła danych. Aby osiągnąć pomyślne ładowanie, liczba i typy danych kolumn w danych źródłowych muszą być zgodne z definicją tabeli w magazynie danych.

Jeśli dane pochodzą z wielu magazynów danych, możesz przenosić dane do magazynu danych i przechowywać je w tabeli integracji. Gdy dane będą znajdować się w tabeli integracji, możesz użyć możliwości magazynu danych do zaimplementowania operacji przekształcania. Po przygotowaniu danych można wstawić je do tabel produkcyjnych.

Ograniczenia

Magazyn obsługuje wiele funkcji tabeli oferowanych przez inne bazy danych, ale nie wszystkie.

Na poniższej liście przedstawiono niektóre funkcje tabeli, które nie są obecnie obsługiwane.

  • Maksymalna liczba kolumn na tabelę: 1024
  • Obliczone kolumny
  • Widoki indeksowane
  • Tabele partycjonowane
  • Sequence
  • Kolumny rozrzedłe
  • Klucze zastępcze w sekwencjach liczbowych z kolumnami tożsamości
  • Synonimy
  • Tabele tymczasowe
  • Wyzwalacze
  • Indeksy unikatowe
  • Typy definiowane przez użytkownika