Microsoft Fabric terminolojisi

Synapse Veri Ambarı, Synapse Veri Madenciliği, Synapse Veri Bilimi, Synapse Gerçek Zamanlı Analiz, Data Factory ve Power BI'a özgü terimler de dahil olmak üzere Microsoft Fabric'te kullanılan terimlerin tanımlarını öğrenin.

Genel koşullar

  • Kapasite: Kapasite, belirli bir zamanda kullanılmak üzere kullanılabilen ayrılmış bir kaynak kümesidir. Kapasite, bir kaynağın etkinlik gerçekleştirme veya çıkış oluşturma becerisini tanımlar. Farklı öğeler belirli bir zamanda farklı kapasite tüketir. Fabric, Doku SKU'su ve Denemeler aracılığıyla kapasite sunar. Daha fazla bilgi için bkz. Kapasite nedir?

  • Deneyim: Belirli bir işlevi hedefleyen özellikler koleksiyonu. Doku deneyimleri Synapse Veri Ambarı, Synapse Veri Madenciliği, Synapse Veri Bilimi, Synapse Gerçek Zamanlı Analiz, Data Factory ve Power BI'dır.

  • Öğe: Bir deneyim içindeki bir özellik kümesi olan bir öğe. Kullanıcılar bunları oluşturabilir, düzenleyebilir ve silebilir. Her öğe türü farklı özellikler sağlar. Örneğin, Veri Madenciliği deneyimi lakehouse, not defteri ve Spark iş tanımı öğelerini içerir.

  • Kiracı: Kiracı, bir kuruluş için tek bir Doku örneğidir ve Bir Microsoft Entra Kimliği ile hizalanır.

  • Çalışma alanı: Çalışma alanı, işbirliği için tasarlanmış tek bir ortamda farklı işlevleri bir araya getiren bir öğe koleksiyonudur. Yürütülen iş için kapasite kullanan ve içindeki öğelere kimlerin erişebileceğine yönelik denetimler sağlayan bir kapsayıcı işlevi görür. Örneğin, bir çalışma alanında kullanıcılar raporlar, not defterleri, anlam modelleri vb. oluşturur. Daha fazla bilgi için Çalışma alanları makalesine bakın.

Synapse Veri Mühendisliği

  • Lakehouse: Lakehouse, Apache Spark altyapısı ve SQL altyapısı tarafından büyük veri işleme için kullanılan bir veri gölü üzerindeki veritabanını temsil eden bir dosya, klasör ve tablo koleksiyonudur. Lakehouse, açık kaynak Delta biçimli tabloları kullanırken ACID işlemleri için gelişmiş özellikler içerir. Lakehouse öğesi, Microsoft OneLake'te benzersiz bir çalışma alanı klasöründe barındırılır. Klasörler ve alt klasörler halinde düzenlenmiş çeşitli biçimlerde (yapılandırılmış ve yapılandırılmamış) dosyalar içerir. Daha fazla bilgi için bkz. Göl evi nedir?

  • Not Defteri: Doku not defteri, zengin işlevlere sahip çok dilli etkileşimli bir programlama aracıdır. Kod ve markdown yazma, Spark işini çalıştırma ve izleme, sonucu görüntüleme ve görselleştirme ve ekiple işbirliği gibi özellikler. Veri mühendislerinin ve veri bilimcinin verileri keşfetmesine ve işlemesine ve hem kod hem de düşük kod deneyimiyle makine öğrenmesi denemeleri oluşturmasına yardımcı olur. Düzenleme için kolayca işlem hattı etkinliğine dönüştürülebilir.

  • Spark uygulaması: Apache Spark uygulaması, kullanıcı tarafından Spark'ın API dillerinden (Scala, Python, Spark SQL veya Java) veya Microsoft tarafından eklenen dillerden (C# veya F# ile.NET) birini kullanarak yazılmış bir programdır. Bir uygulama çalıştırıldığında, verileri daha hızlı işlemek için paralel olarak çalışan bir veya daha fazla Spark işine ayrılır. Daha fazla bilgi için bkz . Spark uygulaması izleme.

  • Apache Spark işi: Spark işi, uygulamadaki diğer işlerle paralel olarak çalıştırılacak bir Spark uygulamasının parçasıdır. bir iş birden çok görevden oluşur. Daha fazla bilgi için bkz . Spark işi izleme.

  • Apache Spark iş tanımı: Spark iş tanımı, bir Spark uygulamasının nasıl çalıştırılması gerektiğini belirten, kullanıcı tarafından ayarlanan bir parametre kümesidir. Spark kümesine toplu iş veya akış işleri göndermenizi sağlar. Daha fazla bilgi için bkz. Apache Spark iş tanımı nedir?

  • V sırası: Hızlı okuma ve maliyet verimliliği ile daha iyi performans sağlayan parquet dosya biçimine yönelik bir yazma iyileştirmesi. Tüm Doku altyapıları varsayılan olarak v sıralı parquet dosyaları yazar.

Data Factory

  • Bağlan veya: Data Factory, farklı türlerdeki veri depolarına bağlanmanızı sağlayan zengin bir bağlayıcı kümesi sunar. Bağlandıktan sonra verileri dönüştürebilirsiniz. Daha fazla bilgi için bkz . bağlayıcılar.

  • Veri işlem hattı: Data Factory'de, veri taşıma ve dönüştürmeyi düzenlemeye yönelik bir veri işlem hattı kullanılır. Bu işlem hatları, Doku'daki dağıtım işlem hatlarından farklıdır. Daha fazla bilgi için bkz . Data Factory'ye genel bakış bölümünde İşlem hatları .

  • Veri Akışı 2. Nesil: Veri akışları, yüzlerce veri kaynağından veri almak ve verilerinizi dönüştürmek için düşük kodlu bir arabirim sağlar. Dokudaki veri akışları, Veri Akışı 2. Nesil olarak adlandırılır. Veri akışı 1. Nesil Power BI'da mevcuttur. Veri Akışı 2. Nesil, Azure Data Factory veya Power BI'daki Veri akışlarına kıyasla ek özellikler sunar. 1. Nesil'den 2. Nesil'e yükseltemezsiniz. Daha fazla bilgi için bkz . Data Factory'ye genel bakış bölümünde Veri akışları .

Synapse Veri Bilimi

  • Data Wrangler: Data Wrangler, kullanıcılara keşif veri analizi gerçekleştirmek için çevreleyici bir deneyim sunan not defteri tabanlı bir araçtır. Bu özellik, kılavuz benzeri bir veri görüntüsünü dinamik özet istatistikleri ve bir dizi ortak veri temizleme işlemiyle birleştirir ve bunların tümü birkaç seçili simgeyle kullanılabilir. Her işlem, yeniden kullanılabilir bir betik olarak not defterine geri kaydedilebilen kod oluşturur.

  • Deneme: Makine öğrenmesi denemesi, tüm ilgili makine öğrenmesi çalıştırmaları için birincil kuruluş ve denetim birimidir. Daha fazla bilgi için bkz . Microsoft Fabric'te makine öğrenmesi denemeleri.

  • Model: Makine öğrenmesi modeli, belirli desen türlerini tanımak için eğitilmiş bir dosyadır. Modeli bir veri kümesi üzerinde eğitip bu veri kümesinden bilgi edinmek için kullandığı bir algoritma sağlarsınız. Daha fazla bilgi için bkz . Makine öğrenmesi modeli.

  • Çalıştırma: Çalıştırma, model kodunun tek bir yürütülmesine karşılık gelir. MLflow'da izleme, denemeleri ve çalıştırmaları temel alır.

Synapse veri ambarı

  • SQL analizi uç noktası: Her Lakehouse'da, bir kullanıcının TDS üzerinden TSQL ile delta tablo verilerini sorgulamasına olanak tanıyan bir SQL analiz uç noktası vardır. Daha fazla bilgi için bkz . SQL analytics uç noktası.

  • Synapse Veri Ambarı: Synapse Veri Ambarı geleneksel bir veri ambarı olarak çalışır ve kurumsal veri ambarından bekleyebileceğiniz tam işlemsel T-SQL özelliklerini destekler. Daha fazla bilgi için bkz . Synapse Veri Ambarı.

Synapse Gerçek Zamanlı Analiz

  • KQL veritabanı: KQL veritabanı, verileri KQL sorgularını yürütebileceğiniz bir biçimde tutar. Daha fazla bilgi için bkz . KQL veritabanını sorgulama.

  • KQL Sorgu Kümesi: KQL Sorgu Kümesi, Veri Gezgini veritabanınızdaki veriler üzerinde sorgu çalıştırmak, sonuçları görüntülemek ve sorgu sonuçlarını işlemek için kullanılan öğedir. Sorgu kümesi veritabanlarını ve tabloları, sorguları ve sonuçları içerir. KQL Queryset, sorguları gelecekte kullanmak üzere kaydetmenize veya sorguları dışarı aktarmanıza ve başkalarıyla paylaşmanıza olanak tanır. Daha fazla bilgi için bkz . KQL Sorgu Kümesindeki verileri sorgulama

  • Olay akışı: Microsoft Fabric olay akışları özelliği, gerçek zamanlı olayları yakalamak, dönüştürmek ve kod içermeyen bir deneyime sahip hedeflere yönlendirmek için Doku platformunda merkezi bir yer sağlar. Olay akışı çeşitli akış veri kaynaklarından, alım hedeflerinden ve dönüştürme gerektiğinde bir olay işlemciden oluşur. Daha fazla bilgi için bkz . Microsoft Fabric olay akışları.

OneLake

  • Kısayol: Kısayollar, OneLake içinde diğer dosya deposu konumlarına işaret eden ekli başvurulardır. Bunlar, doğrudan kopyalamak zorunda kalmadan mevcut verilere bağlanmak için bir yol sağlar. Daha fazla bilgi için bkz . OneLake kısayolları.