Kurz: Vytvoření poznámkového bloku Jupyter ve službě Azure Cosmos DB for NoSQL pro analýzu a vizualizaci dat (Preview)
PLATÍ PRO: NoSQL
Upozorňující
Funkce Jupyter Notebooks služby Azure Cosmos DB bude vyřazena 30. března 2024; Nebudete moct používat integrované poznámkové bloky Jupyter z účtu služby Azure Cosmos DB. Doporučujeme použít podporu editoru Visual Studio Code pro poznámkové bloky Jupyter nebo preferovaného klienta poznámkových bloků.
Tento kurz vás provede použitím funkce Jupyter Notebooks služby Azure Cosmos DB k importu ukázkových maloobchodních dat do účtu Azure Cosmos DB for NoSQL. Uvidíte, jak pomocí příkazů magic Azure Cosmos DB spouštět dotazy, analyzovat data a vizualizovat výsledky.
Předpoklady
- Existující účet Azure Cosmos DB for NoSQL.
- Pokud máte existující předplatné Azure, vytvořte nový účet.
- Žádné předplatné Azure? Službu Azure Cosmos DB můžete vyzkoušet zdarma bez nutnosti platební karty.
Vytvoření nového poznámkového bloku
V této části vytvoříte databázi Azure Cosmos, kontejner a importujete maloobchodní data do kontejneru.
Přejděte do svého účtu služby Azure Cosmos DB a otevřete Průzkumníka dat.
Vyberte Nový poznámkový blok.
V potvrzovací dialogovém okně, které se zobrazí, vyberte Vytvořit.
Poznámka:
Vytvoří se dočasný pracovní prostor, který vám umožní pracovat s poznámkovými bloky Jupyter. Po vypršení platnosti relace se odeberou všechny poznámkové bloky v pracovním prostoru.
Vyberte jádro, které chcete pro poznámkový blok použít.
Tip
Teď, když je nový poznámkový blok vytvořený, můžete ho přejmenovat na něco jako VisualizeRetailData.ipynb.
Vytvoření databáze a kontejneru pomocí sady SDK
Začněte ve výchozí buňce kódu.
Importujte všechny balíčky, které pro účely tohoto kurzu potřebujete.
import azure.cosmos from azure.cosmos.partition_key import PartitionKey
Vytvořte databázi s názvem RetailIngest pomocí integrované sady SDK.
database = cosmos_client.create_database_if_not_exists('RetailIngest')
Vytvořte kontejner s názvem WebsiteMetrics s klíčem oddílu
/CartID
.container = database.create_container_if_not_exists(id='WebsiteMetrics', partition_key=PartitionKey(path='/CartID'))
Vyberte Spustit a vytvořte databázi a prostředek kontejneru.
Import dat pomocí příkazů magic
Přidejte novou buňku kódu.
Do buňky kódu přidejte následující příkaz magic, který chcete nahrát do existujícího kontejneru, do dat JSON z této adresy URL: https://cosmosnotebooksdata.blob.core.windows.net/notebookdata/websiteData.json
%%upload --databaseName RetailIngest --containerName WebsiteMetrics --url https://cosmosnotebooksdata.blob.core.windows.net/notebookdata/websiteData.json
Výběrem možnosti Spustit aktivní buňku spustíte příkaz pouze v této konkrétní buňce.
Poznámka:
Dokončení příkazu importu by mělo trvat 5 až 10 sekund.
Sledujte výstup příkazu run. Ujistěte se, že se importovalo 2 654 dokumentů.
Documents successfully uploaded to WebsiteMetrics Total number of documents imported: Success: 2654 Failure: 0 Total time taken : 00:00:04 hours Total RUs consumed : 27309.660000001593
Vizualizace dat
Vytvořte další novou buňku kódu.
V buňce kódu použijte dotaz SQL k naplnění datového rámce Pandas.
%%sql --database RetailIngest --container WebsiteMetrics --output df_cosmos SELECT c.Action, c.Price as ItemRevenue, c.Country, c.Item FROM c
Výběrem možnosti Spustit aktivní buňku spustíte příkaz pouze v této konkrétní buňce.
Vytvořte další novou buňku kódu.
V buňce kódu zadejte výstup prvních 10 položek z datového rámce.
df_cosmos.head(10)
Výběrem možnosti Spustit aktivní buňku spustíte příkaz pouze v této konkrétní buňce.
Sledujte výstup spuštění příkazu.
Akce ItemRevenue Země/oblast Item 0 Koupeno 19.99 Makedonie Tričko s tlačítkem 1 Zobrazeno 12,00 Papua-Nová Guinea Náhrdelník 2 Zobrazeno 25.00 Slovensko (Slovenská republika) Svetr s karganem 3 Koupeno 14,00 Senegal Flip Flop Boty 4 Zobrazeno 50.00 Panama Denim Shorts 5 Zobrazeno 14,00 Senegal Flip Flop Boty 6 Přidáno 14,00 Senegal Flip Flop Boty 7 Přidáno 50.00 Panama Denim Shorts 8 Koupeno 33,00 Palestinská území Červená nahoře 9 Zobrazeno 30.00 Malta Zelený svetr Vytvořte další novou buňku kódu.
V buňce kódu importujte balíček pandas a přizpůsobte výstup datového rámce.
import pandas as pd pd.options.display.html.table_schema = True pd.options.display.max_rows = None df_cosmos.groupby("Item").size()
Výběrem možnosti Spustit aktivní buňku spustíte příkaz pouze v této konkrétní buňce.
Ve výstupu vyberte možnost Spojnicový graf , abyste zobrazili jinou vizualizaci dat.
Zachování poznámkového bloku
V části Poznámkové bloky otevřete místní nabídku poznámkového bloku, který jste vytvořili pro tento kurz, a vyberte Stáhnout.
Tip
Pokud chcete práci uložit trvale, uložte poznámkové bloky do úložiště GitHub nebo si poznámkové bloky stáhněte do místního počítače před ukončením relace.