Mulai Cepat: Membuat database lake baru yang memanfaatkan templat database

Mulai cepat ini memberi Anda sampel skenario lengkap mengenai cara menerapkan templat database untuk membuat database lake, menyelaraskan data ke model baru Anda, dan menggunakan pengalaman terintegrasi untuk menganalisis data.

Prasyarat

  • Setidaknya izin peran Pengguna Synapse diperlukan untuk menjelajahi templat database lake dari Galeri.
  • Izin Administrator Synapse atau Kontributor Synapse diperlukan di ruang kerja Azure Synapse untuk membuat database lake.
  • Izin Kontributor Data Blob Penyimpanan diperlukan pada data lake saat menggunakan opsi buat tabel Dari data lake.

Membuat database lake dari templat database

Gunakan fungsionalitas pola dasar database baru untuk membuat database lake yang dapat Anda gunakan untuk mengonfigurasi model data Anda untuk database.

Untuk skenario kami, kami akan menggunakan templat database Retail dan memilih entitas berikut:

  • RetailProduct – Produk adalah apa saja yang dapat ditawarkan ke pasar yang mungkin memenuhi kebutuhan oleh pelanggan potensial. Produk itu adalah jumlah dari semua atribut fisik, psikologis, simbolis, dan layanan yang terkait dengannya.
  • Transaksi - Tingkat terendah dari pekerjaan yang dapat dieksekusi atau aktivitas pelanggan. Transaksi terdiri dari satu atau lebih peristiwa diskrit.
  • TransactionLineItem – Komponen Transaksi dipecah berdasarkan Produk dan Kuantitas, satu item per baris.
  • Pihak adalah individu, organisasi, badan hukum, organisasi sosial, atau unit bisnis yang menarik bagi bisnis.
  • Pelanggan adalah individu atau badan hukum yang telah atau telah membeli produk atau layanan.
  • Saluran adalah sarana di mana produk atau layanan dijual dan / atau didistribusikan.

Cara termudah untuk menemukan entitas adalah dengan menggunakan kotak pencarian di atas berbagai area bisnis yang berisi tabel.

Screenshot contoh template database Ritel yang digunakan.

Mengonfigurasi database lake

Setelah Anda membuat database, pastikan akun penyimpanan dan jalur file diatur ke lokasi tempat Anda ingin menyimpan data. Jalur akan default ke akun penyimpanan utama dalam Azure Synapse Analytics, tetapi dapat diubah sesuai kebutuhan Anda.

Cuplikan layar properti entitas individual di Templat database ritel.

Untuk menyimpan tata letak Anda dan membuatnya tersedia dalam Azure Synapse, Terbitkan semua perubahan. Langkah ini melengkapi penyiapan database lake dan membuatnya tersedia untuk semua komponen di dalam dan di luar Azure Synapse Analytics.

Menelan data ke database lake

Untuk menelan data ke database danau, Anda dapat menjalankan pipa dengan pemetaan aliran data bebas kode, yang memiliki konektor Workspace DB untuk memuat data langsung ke tabel database. Anda juga dapat menggunakan notebook Spark interaktif untuk menelan data ke tabel database lake:

%%sql
INSERT INTO `retail_mil`.`customer` VALUES (1,date('2021-02-18'),1022,557,101,'Tailspin Toys (Head Office)','Waldemar Fisar',90410,466);

Mengkueri data

Setelah database lake dibuat, ada berbagai cara untuk query data. Saat ini, database SQL di kumpulan SQL tanpa server didukung dan secara otomatis memahami format database lake yang baru dibuat.

SELECT TOP (100) [ProductId]
,[ProductName]
,[ProductDescription]
,[ProductInternalName]
,[ItemSku]
,[PrimaryBrandId]
FROM [Retail_mil].[dbo].[RetailProduct]

Cara lain untuk mengakses data di dalam Azure Synapse adalah dengan membuka buku catatan Spark baru dan menggunakan pengalaman terintegrasi di sana:

df = spark.sql("SELECT * FROM `Retail_mil`.`RetailProduct`")
df.show(10)

Melatih model pembelajaran mesin

Anda dapat menggunakan database lake untuk melatih model pembelajaran mesin Anda dan mencetak data. Untuk lebih jelasnya Melatih model pembelajaran mesin

Langkah berikutnya

Lanjutkan untuk menjelajahi kemampuan perancang database menggunakan tautan di bawah ini.