Başlarken: Not defterinden verileri sorgulama ve görselleştirme

Bu başlangıç makalesi SQL, Python, Scala ve R kullanarak Unity Kataloğu'nda depolanan örnek verileri sorgulamak ve ardından sorgu sonuçlarını not defterinde görselleştirmek için Azure Databricks not defterini kullanmada size yol gösterir.

Gereksinimler

Bu makaledeki görevleri tamamlamak için aşağıdaki gereksinimleri karşılamanız gerekir:

1. Adım: Yeni not defteri oluşturma

Çalışma alanınızda not defteri oluşturmak için:

  1. Yeni SimgeKenar çubuğunda Yeni'ye ve ardından Not Defteri'ne tıklayın.
  2. Not Defteri Oluştur sayfasında:
    • Not defteriniz için benzersiz bir ad belirtin.
    • Not defterinizin varsayılan dilini ayarlayın ve istenirse Onayla'ya tıklayın.
    • İşlem kaynağı seçmek için Bağlan açılan menüsünü kullanın. Yeni bir işlem kaynağı oluşturmak için bkz . İşlem kullanma.

Not defterlerini oluşturma ve yönetme hakkında daha fazla bilgi edinmek için bkz . Not defterlerini yönetme.

2. Adım: Tabloyu sorgulama

samples.nyctaxi.trips Unity Kataloğu'nda, seçtiğiniz dili kullanarak tabloyu sorgular.

SQL

  1. Aşağıdaki kodu kopyalayıp yeni boş not defteri hücresine yapıştırın. Bu kod, Unity Kataloğu'nda tabloyu sorgulamanın samples.nyctaxi.trips sonuçlarını görüntüler.
SELECT * FROM samples.nyctaxi.trips

Python

  1. Aşağıdaki kodu kopyalayıp yeni boş not defteri hücresine yapıştırın. Bu kod, Unity Kataloğu'nda tabloyu sorgulamanın samples.nyctaxi.trips sonuçlarını görüntüler.
display(spark.read.table("samples.nyctaxi.trips"))

Scala

  1. Aşağıdaki kodu kopyalayıp yeni boş not defteri hücresine yapıştırın. Bu kod, Unity Kataloğu'nda tabloyu sorgulamanın samples.nyctaxi.trips sonuçlarını görüntüler.
display(spark.read.table("samples.nyctaxi.trips"))

R

  1. Aşağıdaki kodu kopyalayıp yeni boş not defteri hücresine yapıştırın. Bu kod, Unity Kataloğu'nda tabloyu sorgulamanın samples.nyctaxi.trips sonuçlarını görüntüler.
library(SparkR)
display(sql("SELECT * FROM samples.nyctaxi.trips"))
  1. Hücreyi çalıştırmak için basın Shift+Enter ve ardından sonraki hücreye geçin.

    Sorgu sonuçları not defterinde görünür.

3. Adım: Verileri görüntüleme

Ortalama ücret miktarını, teslim alma posta koduna göre gruplandırılmış seyahat mesafesine göre görüntüleyin.

  1. Tablo sekmesinin yanındaki Görselleştirme'ye tıklayın + ve sonra da görsel öğeye tıklayın.

    Görselleştirme düzenleyicisi görüntülenir.

  2. Görselleştirme Türü açılan listesinde Çubuğun seçili olduğunu doğrulayın.

  3. X sütunu için seçinfare_amount.

  4. Y sütunu için seçintrip_distance.

  5. Toplama türü olarak seçin Average .

  6. Gruplandırma ölçütü sütunu olarak seçinpickup_zip.

    Çubuk grafik

  7. Kaydet'e tıklayın.

Sonraki adımlar