Azure 'da bir veri analizi teknolojisi seçin
Büyük veri çözümlerinin çoğunun amacı analiz ve raporlama aracılığıyla veriler hakkında öngörüler sağlamaktır. Bu, önceden yapılandırılmış raporları ve görselleştirmeleri veya etkileşimli veri araştırması içerebilir.
Veri Analizi teknolojisini seçerken seçenekleriniz nelerdir?
Gereksinimlerinize bağlı olarak Azure 'da analiz, görselleştirme ve raporlama için birkaç seçenek vardır:
Power BI
Power BI , bir iş analizi araçları paketidir. Yüzlerce veri kaynağına bağlanabilir ve geçici analiz için kullanılabilir. Şu anda kullanılabilir olan veri kaynaklarının listesini görüntüleyin. ek lisans gerekmeden kendi uygulamalarınızda Power BI bütünleştirmek için Power BI Embedded kullanın.
kuruluşlar, raporları oluşturmak ve bunları kuruluşa yayımlamak için Power BI kullanabilir. Herkes, yönetim ve yerleşik olarak tasarlanankişiselleştirilmiş panolar oluşturabilir. Power BI, Power BI hizmetinde oturum açan kullanıcıların kimliğini doğrulamak için Azure Active Directory (Azure AD) kullanır ve kullanıcı kimlik doğrulaması gerektiren kaynaklara erişmeyi her denediğinde Power BI oturum açma kimlik bilgilerini kullanır.
Jupyter Notebooks
Jupyter Not defterleri , veri bilimcilerinin Python, Scala veya R kodu ve markı metni içeren Not defteri dosyaları oluşturmalarına olanak tanıyan tarayıcı tabanlı bir kabuk sağlar ve kodu paylaşarak ve belgeleyerek ve sonuçları tek bir belgede oluşturarak işbirliği yapmak için etkili bir yol oluşturur.
Spark veya Hadoop gibi HDInsight kümelerinin çoğu, verilerle etkileşim kurmak ve işlenmek üzere iş göndermek için Jupyıter Notebook ile önceden yapılandırılmış olarak gelir. Kullanmakta olduğunuz HDInsight kümesinin türüne bağlı olarak, kodunuzu yorumlamak ve çalıştırmak için bir veya daha fazla çekirdekler sunulacaktır. Örneğin, HDInsight 'ta Spark kümeleri, Spark altyapısını kullanarak Python veya Scala kodu yürütmek için arasından seçim yapabilirsiniz Spark ile ilgili çekirdekler sağlar.
Jupi Not defterleri, Power BI gibi bir bı/Reporting aracı ile daha gelişmiş görselleştirmeler oluşturmadan önce verilerinizi çözümlemek, görselleştirmek ve işlemek için harika bir ortam sağlar.
Zeppelin Not defterleri
Zeppelin Not defterleri , bir tarayıcı tabanlı kabuğun Işlevselliğinde Jupyter 'a benzer başka bir seçenektir. Bazı HDInsight kümeleri Zeppelin Not defterleri ile önceden yapılandırılmış olarakgelir. Ancak, HDInsight etkileşimli sorgu (HIVE LLAP) kümesi kullanıyorsanız, Zeppelin Şu anda yalnızca etkileşimli Hive sorguları çalıştırmak için kullanabileceğiniz bir not defteri seçiminiz vardır. Ayrıca, etki alanına katılmış bir HDInsight kümesikullanıyorsanız, Zeppelin Not defterleri, not defterlerine ve temel alınan Hive tablolarına erişimi denetlemek için farklı Kullanıcı oturum açmaları atamanızı sağlayan tek türdür.
Microsoft Azure not defterleri
Azure Notebooks , veri bilimcilerinin bulut tabanlı kitaplıklarda Jupyıter not defterlerini oluşturmalarına, çalıştırmasına ve paylaşmasına olanak tanıyan, çevrimiçi bir Jupo Not defteri tabanlı hizmettir. Azure Notebooks Python 2, Python 3, F # ve R için yürütme ortamları sağlar ve verileri görselleştirmeye yönelik ggçizimi, Matplotlib, bokeh ve Seaborn gibi çeşitli grafik kitaplıkları sağlar.
Kümenin varsayılan depolama hesabına bağlı olan bir HDInsight kümesinde çalışan jupi not defterlerinden farklı olarak Azure Notebooks herhangi bir veri sağlamaz. verileri bir çevrimiçi kaynaktan yükleme, Azure blobları veya tablo Depolama etkileşim kurma, bir SQL veritabanına bağlanma veya Azure Data Factory için kopyalama sihirbazı ile veri yükleme gibi çeşitli yollarla yüklemeniz gerekir.
Önemli avantajlar:
- Ücretsiz hizmet — Azure aboneliği gerekmez.
- Jupyıter ve destekleyici R veya Python dağıtımlarını yerel olarak yüklemek gerekmez; yalnızca bir tarayıcı kullanın.
- Kendi çevrimiçi kitaplıklarınızı yönetin ve herhangi bir cihazdan erişin.
- Not defterlerinizi ortak çalışanlarla paylaşabilirsiniz.
Dikkat edilmesi gerekenler:
- Çevrimdışı durumdayken not defterlerinize erişemeyecektir.
- Ücretsiz Not Defteri hizmetinin sınırlı işleme özellikleri büyük veya karmaşık modelleri eğitmek için yeterli olmayabilir.
Anahtar seçim ölçütleri
Seçimleri daraltmak için, bu soruları yanıtlayarak başlayın:
Etki alanınız genelinde veri yayma raporları oluşturmak için merkezi bir yer sağlayarak çok sayıda veri kaynağına bağlanmanız mı gerekiyor? Bu durumda, veri kaynaklarının 100s ' a bağlanmanıza izin veren bir seçenek belirleyin.
Dış Web sitesine veya uygulamaya dinamik görselleştirmeler eklemek istiyor musunuz? Bu durumda, ekleme özellikleri sağlayan bir seçenek belirleyin.
Çevrimdışı durumdayken görselleştirmelerinizi ve raporlarınızı tasarlamak istiyor musunuz? Yanıt Evet ise, çevrimdışı yetenekler içeren bir seçenek belirleyin.
Büyük veya karmaşık AI modellerini eğitebilmeniz veya çok büyük veri kümeleriyle çalışmak için ağır işlem gücü gerekir mi? Yanıt Evet ise, büyük bir veri kümesine bağlanabilecek bir seçenek belirleyin.
Yetenek matrisi
Aşağıdaki tablolar, özelliklerde önemli farklılıkları özetler.
Genel yetenekler
| Özellik | Power BI | Jupyter Notebooks | Zeppelin Not defterleri | Microsoft Azure not defterleri |
|---|---|---|---|---|
| gelişmiş işleme için büyük veri kümesine Bağlan | Yes | Yes | Yes | Hayır |
| Yönetilen hizmet | Yes | Evet 1 | Evet 1 | Evet |
| veri kaynaklarının Bağlan | Yes | Hayır | Hayır | Hayır |
| Çevrimdışı özellikler | Evet 2 | Hayır | Hayır | Hayır |
| Ekleme özellikleri | Yes | Hayır | Hayır | Hayır |
| Otomatik veri yenileme | Yes | Hayır | Hayır | Hayır |
| Çok sayıda açık kaynak pakete erişim | Hayır | Evet 3 | Evet 3 | Evet 4 |
| Veri dönüştürme/temizleme seçenekleri | Power Query, R | Python, R, Julia ve Scala dahil 40 dilleri | Python, JDBC ve R dahil olmak üzere 20 + yorumlayıcılar | Python, F #, R |
| Fiyatlandırma | Power BI Desktop (yazma) için ücretsiz, bkz. barındırma seçenekleri fiyatlandırması | Ücretsiz | Ücretsiz | Ücretsiz |
| Çok kullanıcılı işbirliği | Evet | Evet (paylaşım veya Jupyterhubgibi çok kullanıcılı bir sunucu ile) | Yes | Evet (paylaşım aracılığıyla) |
[1] yönetilen HDInsight kümesinin bir parçası olarak kullanıldığında.
[2] Power BI Desktop kullanımı.
[2] topluluk tarafından katkıda bulunulan paketler için Maven deposunda arama yapabilirsiniz.
[3] Python paketleri, PIP veya Conda kullanılarak yüklenebilir. R paketleri, CRAN veya GitHub 'den yüklenebilir. F # içindeki paketler, nuget.org aracılığıyla paket bağımlılığı Yöneticisikullanılarak yüklenebilir.