Rychlý Start: vytvoření nové databáze Lake využití databázových šablon

V tomto rychlém startu získáte postup na konci dvou scénářů, jak můžete použít šablony databáze k vytvoření databáze Lake, zarovnání dat na nový model a k analýze dat použít integrované prostředí.

Požadavky

  • K prozkoumávání šablony databáze Lake z Galerie se vyžadují aspoň synapse oprávnění role uživatele.
  • V pracovním prostoru synapse pro vytvoření databáze Lake se vyžadují oprávnění správce synapse nebo synapse Přispěvatel.
  • Storage Oprávnění Přispěvatel dat objektu BLOB se vyžadují pro data Lake.

Vytvoření databáze Lake z šablon databáze

Pomocí nových funkcí šablon databází (Preview) vytvořte databázi Lake, kterou můžete použít ke konfiguraci datového modelu pro databázi.

Pro náš scénář budeme používat šablonu prodejní databáze a vybrat následující entity:

  • RetailProduct – produkt je cokoli, co se dá nabídnout na trh, který by mohl vyhovět potenciálním zákazníkům. Tento produkt je součtem všech fyzických, psychologický, symbolických a přidružených atributů služby.
  • Transakce – nejnižší úroveň pracovní práce nebo aktivity zákazníka. Transakce se skládá z jedné nebo více diskrétních událostí.
  • TransactionLineItem – součásti transakce, které jsou rozděleny podle produktu a množství, jedna za každou položku řádku.
  • Strana – strana je osoba, organizace, právní subjekt, sociální organizace nebo obchodní jednotka zájmem podniku.
  • Zákazník – zákazník je individuální nebo právnická osoba, která má nebo koupila produkt nebo službu.
  • Kanál – kanál představuje způsob, jakým se produkty nebo služby prodávají a distribuují.

Nejjednodušší způsob, jak je najít, je použití vyhledávacího pole nad různými obchodními oblastmi, které obsahují tabulky.

Příklad šablony databáze

Konfigurace Lake Database

Po vytvoření databáze se ujistěte, že je účet úložiště & FilePath nastavený na místo, kam chcete data uložit. Tato cesta bude ve výchozím nastavení nastavená na primární účet úložiště v rámci synapse Analytics, ale dá se změnit podle vašich potřeb.

Ukázka Lake Database

Pro uložení rozložení a zpřístupnění v rámci synapse publikování všech změn. Tento krok dokončí instalaci Lake Database a zpřístupní ji všem komponentám v rámci synapse Analytics a mimo.

Ingestování dat do Lake Database

Chcete-li ingestovat data do databáze Lake, můžete spustit kanály s mapováním toku dat bez kódu, který má spojnici databáze pracovního prostoru pro načtení dat přímo do tabulky databáze. K ingestování dat do tabulek Lake Database můžete použít také interaktivní notebooky Spark:

%%sql
INSERT INTO `retail_mil`.`customer` VALUES (1,'2021-02-18',1022,557,101,'Tailspin Toys (Head Office)','Waldemar Fisar',90410,466);

Vytváření dotazů na data

Po vytvoření databáze Lake jsou k dispozici různé způsoby dotazování dat. V současné době podporujeme SQL-Ondemand v rámci synapse, která automaticky rozumí nově vytvořenému formátu Lake Database a zpřístupňuje z něj data.

SELECT TOP (100) [ProductId]
,[ProductName]
,[ProductDescription]
,[ProductInternalName]
,[ItemSku]
,[PrimaryBrandId]
FROM [Retail_mil].[dbo].[RetailProduct]

Dalším způsobem, jak získat přístup k datům v rámci synapse, je otevřít nový Poznámkový blok Spark a použít integrované prostředí.

df = spark.sql("SELECT * FROM `Retail_mil`.`RetailProduct`")
df.show(10)

Trénování modelů strojového učení

Lake Database můžete použít ke studiu modelů strojového učení a k vyhodnocení dat. Další podrobnosti o výukových modelech strojového učení

Další kroky

Dál Prozkoumejte možnosti návrháře databáze pomocí odkazů níže.