Megosztás a következőn keresztül:


Első lépések: Adatok lekérdezése és vizualizációja jegyzetfüzetből

Ez az első lépéseket ismertető cikk bemutatja, hogy egy Azure Databricks-jegyzetfüzet használatával lekérdezheti a Unity Catalogban tárolt mintaadatokat AZ SQL, a Python, a Scala és az R használatával, majd megjelenítheti a lekérdezés eredményeit a jegyzetfüzetben.

Követelmények

A cikkben szereplő feladatok elvégzéséhez meg kell felelnie a következő követelményeknek:

1. lépés: Új jegyzetfüzet létrehozása

Jegyzetfüzet létrehozása a munkaterületen:

  1. Kattintson Új ikonaz Oldalsáv Új elemére, majd a Jegyzetfüzet gombra.
  2. A Jegyzetfüzet létrehozása lapon:
    • Adjon meg egy egyedi nevet a jegyzetfüzetnek.
    • Állítsa be a jegyzetfüzet alapértelmezett nyelvét, majd kattintson a Megerősítés gombra, ha a rendszer kéri.
    • Számítási erőforrás kiválasztásához használja a Csatlakozás legördülő menüt. Új számítási erőforrás létrehozásához lásd: Számítás használata.

A jegyzetfüzetek létrehozásáról és kezeléséről további információt a Jegyzetfüzetek kezelése című témakörben talál.

2. lépés: Tábla lekérdezése

samples.nyctaxi.trips A Unity Catalogban a kívánt nyelv használatával kérdezheti le a táblát.

  1. Másolja és illessze be a következő kódot az új üres jegyzetfüzetcellába. Ez a kód megjeleníti a táblának a samples.nyctaxi.trips Unity Katalógusban való lekérdezéséből származó eredményeket.

    SQL

    SELECT * FROM samples.nyctaxi.trips
    

    Python

    display(spark.read.table("samples.nyctaxi.trips"))
    

    Scala

    display(spark.read.table("samples.nyctaxi.trips"))
    

    R

    library(SparkR)
    display(sql("SELECT * FROM samples.nyctaxi.trips"))
    
  2. Nyomja le Shift+Enter a cellát, majd lépjen a következő cellára.

    A lekérdezés eredményei megjelennek a jegyzetfüzetben.

3. lépés: Az adatok megjelenítése

Az átlagos viteldíj összege utazási távolság szerint, a csomagfelvétel irányítószáma szerint csoportosítva.

  1. Kattintson a Táblázat lap mellett a +Vizualizáció elemre.

    Megjelenik a vizualizációszerkesztő.

  2. A Vizualizáció típusa legördülő listában ellenőrizze, hogy a sáv ki van-e jelölve.

  3. Válassza ki fare_amount az X oszlopot.

  4. Válassza ki trip_distance az Y oszlopot.

  5. Válassza ki Average az összesítés típusát.

  6. Válassza ki pickup_zip a Csoportosítás oszlop szerint lehetőséget.

    Sávdiagram

  7. Kattintson a Mentés gombra.

Következő lépések