Hızlı Başlangıç: Veritabanı şablonlarını kullanarak yeni bir Lake veritabanı oluşturma

Bu hızlı başlangıç, bir lake veritabanı oluşturmak, verileri yeni modelinize hizalamak ve tümleşik deneyimi kullanarak verileri analiz etmek için veritabanı şablonlarını nasıl uygulayabilirsiniz?

Önkoşullar

  • Galeri'den bir lake veritabanı şablonunu keşfetmek için en azından Synapse Kullanıcı rolü izinleri gereklidir.
  • Synapse veritabanı oluşturmak için Synapse çalışma alanında Synapse Yöneticisi veya Synapse Katkıda Bulunanı izinleri gereklidir.
  • Depolama Veri Gölünde Blob VerileriNe Katkıda Bulunan izinleri gerekir.

Veritabanı şablonlarından lake veritabanı oluşturma

Veritabanı için veri modelinizi yapılandırmak üzere kullanabileceğiniz bir lake veritabanı oluşturmak için yeni veritabanı şablonları (önizleme) işlevini kullanın.

Senaryomuz için Perakende veritabanı şablonunu kullanacak ve aşağıdaki varlıkları seçecek:

  • RetailProduct : Ürün, potansiyel müşterilerin ihtiyaçlarını karşılay bir pazara sun sunan her şeydir. Bu ürün, ürünle ilişkili tüm fiziksel, duygusal, sembolik ve hizmet özniteliklerinin toplamıdır.
  • İşlem - En düşük yürütülebilir iş veya müşteri etkinliği düzeyi. bir işlem, bir veya daha fazla ayrık olaydan oluşur.
  • TransactionLineItem: Bir transaction öğesinin product ve Quantity değerine (her satır öğesi için bir tane) göre parçalı bileşenleri.
  • Taraf - Taraf bir kişi, kuruluş, yasal varlık, sosyal kuruluş veya işletmeyle ilgili iş birimidir.
  • Müşteri - Müşteri, ürün veya hizmet satın alan veya satın alan bir kişi veya tüzel kişidir.
  • Kanal - Kanal, ürünlerin veya hizmetlerin satıldığı ve/veya dağıtıldığı bir kanaldır.

Bunları bulmanın en kolay yolu, tabloları içeren farklı iş alanlarının üzerindeki arama kutusunu kullanmaktır.

Veritabanı Şablonu örneği

Lake veritabanını yapılandırma

Veritabanını oluşturduktan sonra, dosya yolu & depolama hesabının verileri depolamak istediğiniz konuma ayarlanmış olduğundan emin olun. Yol varsayılan olarak Synapse Analytics'in içindeki birincil depolama hesabını kullanır ancak değiştirilebilir.

Lake veritabanı örneği

Düzeninizi kaydetmek ve Synapse Tüm değişiklikleri yayımla içinde kullanılabilir hale etmek için. Bu adım, lake veritabanının kurulumunu tamamlar ve bu veritabanını Synapse Analytics için kullanılabilir yapar.

Lake veritabanına veri toplama

Verileri göl veritabanına alma için, verileri doğrudan veritabanı tablosuna yüklemek üzere çalışma alanı veritabanı bağlayıcısı olan kodsız veri akışı eşlemeleri ile işlem hatlarını yürütebilirsiniz. Ayrıca, lake veritabanı tablolarına veri alan etkileşimli Spark not defterlerini de kullanabilirsiniz:

%%sql
INSERT INTO `retail_mil`.`customer` VALUES (1,'2021-02-18',1022,557,101,'Tailspin Toys (Head Office)','Waldemar Fisar',90410,466);

Verileri sorgulama

Lake veritabanı oluşturulduktan sonra verileri sorgulamanın farklı yolları vardır. Şu anda Synapse'SQL-Ondemand yeni oluşturulan lake veritabanı biçimini otomatik olarak anan ve bu biçim aracılığıyla verileri ortaya çıkaran veri korumalarını destekliyoruz.

SELECT TOP (100) [ProductId]
,[ProductName]
,[ProductDescription]
,[ProductInternalName]
,[ItemSku]
,[PrimaryBrandId]
FROM [Retail_mil].[dbo].[RetailProduct]

Synapse içindeki verilere erişmenin diğer yolu, yeni bir Spark not defteri açmak ve tümleşik deneyimi orada kullanmaktır:

df = spark.sql("SELECT * FROM `Retail_mil`.`RetailProduct`")
df.show(10)

Makine öğrenmesi modellerini eğitme

Makine öğrenmesi modellerinizi eğitmek ve verileri puan almak için Lake Database'i kullanabilirsiniz. Diğer ayrıntılar için Makine öğrenmesi modellerini eğitin

Sonraki adımlar

Aşağıdaki bağlantıları kullanarak veritabanı tasarımcısının özelliklerini keşfetmeye devam edin.