Azure SYNAPSE Analytics terminolojisi

Bu belge, Azure SYNAPSE Analytics 'in temel kavramlarında size rehberlik eder.

Temel Bilgiler

SYNAPSE çalışma alanı , Azure 'da bulut tabanlı kurumsal analizler gerçekleştirmek için güvenli kılınabilir bir işbirliği sınırıdır. Çalışma alanı belirli bir bölgeye dağıtılır ve ilişkili bir ADLS 2. hesabına ve dosya sistemine sahiptir (geçici verileri depolamak için). Çalışma alanı bir kaynak grubu altında.

bir çalışma alanı SQL ve Apache spark ile analiz gerçekleştirmenize olanak tanır. SQL ve spark analytics için kullanılabilen kaynaklar SQL ve spark havuzlarında düzenlenir.

Bağlı hizmetler

Bir çalışma alanı, herhangi bir sayıda bağlı hizmeti içerebilir ve bu, dış kaynaklara bağlanmak için çalışma alanı için gereken bağlantı bilgilerini tanımlayan bağlantı dizelerini içerir.

Synapse SQL

Synapse SQL , Synapse çalışma alanında T-SQL tabanlı analizler yapabilme olanağıdır. Synapse SQL iki tüketim modeline sahiptir: adanmış ve sunucusuz. adanmış model için adanmış SQL havuzlarını kullanın. Bir çalışma alanı bu havuzlardan herhangi bir sayıda olabilir. sunucusuz modeli kullanmak için sunucusuz SQL havuzlarını kullanın. Her çalışma alanı bu havuzlardan birine sahiptir.

Synapse Studio içinde, SQL betikleri çalıştırarak SQL havuzlarıyla çalışabilirsiniz.

SYNAPSE için Apache Spark

Spark Analytics 'i kullanmak için SYNAPSE çalışma alanınızda sunucusuz Apache Spark havuzları oluşturun ve kullanın. Spark havuzunu kullanmaya başladığınızda, çalışma alanları bu oturumla ilişkili kaynakları işlemek için bir Spark oturumu oluşturur.

SYNAPSE içinde Spark kullanmanın iki yolu vardır:

  • Veri veri bilimi ve Mühendisliği yapmak için Spark Not defterleri Scala, Pyspark, C# ve mini kullanılan SQL
  • Jar dosyalarını kullanarak Batch Spark işlerinin çalıştırılmasına yönelik Spark iş tanımları .

Pipelines

Pipelines Azure Synapse ' nin veri tümleştirmesi sağladığı, verileri hizmetler arasında taşımanızı ve etkinlikleri düzenleyebilmenizi sağlar.

  • İşlem hattı , bir görevi birlikte gerçekleştiren etkinliklerin mantıksal gruplandırmasıdır.
  • etkinlikler , verileri kopyalama, bir not defteri veya SQL betiği çalıştırma gibi veriler üzerinde gerçekleştirilecek eylemleri bir işlem hattı içinde tanımlar.
  • Veri akışları , SYNAPSE Spark kullanan bir veri dönüştürmesi gerçekleştirmek için kod içermeyen bir deneyim sunan belirli bir etkinlik türüdür.
  • Trigger -bir işlem hattı yürütür. El ile veya otomatik olarak çalıştırılabilir (zamanlama, pencere veya olay tabanlı)
  • Tümleştirme veri kümesi -bir etkinlikte giriş ve çıkış olarak kullanılacak verileri işaret eden veya başvuruda bulunan verilerin adlandırılmış görünümü. Bu, bağlı bir hizmete aittir.

Veri Gezgini (Önizleme)

Azure SYNAPSE Veri Gezgini, günlük ve telemetri verilerinden öngörüleri açmak için müşterilere etkileşimli bir sorgu deneyimi sağlar.

  • Veri Gezgini havuzları , en iyi duruma getirilmiş sorgu performansı ve kalıcılık için birden çok BLOB depolama (soğuk önbellek) IÇIN yerel SSD depolaması (sık erişimli önbellek) ile iki veya daha fazla işlem düğümü içeren adanmış kümelerdir
  • Veri Gezgini veritabanları Veri Gezgini havuzlarda barındırılır ve tablo ve diğer veritabanı nesneleri koleksiyonlarından oluşan mantıksal varlıklardır. Havuz başına birden fazla veritabanınız olabilir.
  • Tablolar , geleneksel bir ilişkisel veri modeli kullanılarak düzenlenen verileri içeren veritabanı nesneleridir. Veriler, her bir sütunun bir ad ve skaler veri türüne sahip bir sütun listesini tanımlayan Veri Gezgini iyi tanımlanmış tablo şemasına bağlı kayıtlar halinde depolanır. Skaler veri türleri yapısal (int, Real, DateTime veya TimeSpan), yarı yapılandırılmış (dinamik) veya boş metin (dize) olabilir. Dinamik tür, JSON ile benzerdir; tek bir skaler değer, bir dizi veya bu tür değerlerden oluşan bir sözlüğü tutabilirler.
  • dış tablolar , Veri Gezgini veritabanı dışında bir depolamaya veya SQL veri kaynağına başvuran tablolardır. Tablolara benzer şekilde, dış tablo, iyi tanımlanmış bir şemaya sahiptir (sütun adı ve veri türü çiftlerinin sıralı listesi). Verilerin Veri Gezgini havuzlara oluşturulduğu Veri Gezgini tablolardan farklı olarak, dış tablolar, depolanan ve yönetilen veri havuzları üzerinde çalışır. Dış tablolar hiçbir veriyi kalıcı hale almaz ve bir dış veri deposuna veri sorgulamak veya dışarı aktarmak için kullanılır.

Sonraki adımlar