Azure Synapse Analytics'te Makine Öğrenmesi özellikleri

Azure SYNAPSE Analytics çeşitli makine öğrenimi özellikleri sunar. bu makalede, Azure Synapse bağlamında Machine Learning nasıl uygulayabilmeniz için bir genel bakış sunulmaktadır.

Bu genel bakışta, bir veri bilimi süreç perspektifinden Machine Learning ile ilgili SYNAPSE 'deki farklı yetenekler ele alınmaktadır.

Tipik bir veri bilimi sürecinin nasıl göründüğünü biliyor olabilirsiniz. Birçok makine öğrenimi projesinin izlediği iyi bilinen bir işlemdir.

Yüksek düzeyde, işlem aşağıdaki adımları içerir:

  • İş anlama (Bu makalede ele alınmıyor)
  • Veri edinme ve anlama
  • Modelleme
  • Model dağıtımı ve Puanlama

Bu makalede, bir veri bilimi süreç perspektifinden farklı analiz altyapılarındaki Azure SYNAPSE Machine Learning özellikleri açıklanmaktadır. Veri bilimi işlemindeki her adım için, yardımcı olabilecek Azure SYNAPSE özellikleri özetlenmektedir.

Veri edinme ve anlama

Çoğu makine öğrenimi projesi iyi belirlenen adımları içerir ve bu adımlardan biri verilere erişmek ve bunları anlamak.

Veri kaynağı ve işlem hatları

Azure SYNAPSE 'in yerel olarak tümleşik bir parçası olan Azure Data Factoryiçin, veri alma ve veri düzenleme işlem hatları için kullanabileceğiniz güçlü bir araç kümesi vardır. Bu, verilere erişmek ve verileri makine öğrenimi için kullanılabilecek bir biçime dönüştürmek için kolayca veri işlem hatlarını oluşturmanızı sağlar. SYNAPSE ' de veri işlem hatları hakkında daha fazla bilgi edinin .

Veri hazırlama ve araştırma/görselleştirme

Machine Learning işleminin önemli bir bölümü, keşif ve görselleştirmeler ile verileri anlamaktır.

Verilerin nerede depolandığına bağlı olarak, SYNAPSE analiz ve makine öğrenimi için keşfetmeye ve hazırlamaya yönelik bir dizi farklı araç sunar. veri araştırmasını kullanmaya başlamanın en hızlı yöntemlerinden biri, doğrudan veri gölü verileri üzerinde Apache Spark veya sunucusuz SQL havuzları kullanmaktır.

Modelleme

Azure SYNAPSE 'de Eğitim makinesi öğrenimi modelleri, Apache Spark havuzlarında PySpark/Python, Scala veya .NET gibi araçlarla gerçekleştirilebilir.

MLlib ile Spark havuzlarında modeller eğitme

Makine öğrenimi modelleri çeşitli algoritmalardan ve kitaplıklardan yardım ile eğitilmiş olabilir. Spark MLlib , klasik makine öğrenimi sorunlarının çoğunu çözmenize yardımcı olabilecek ölçeklenebilir makine öğrenimi algoritmaları sunar. SYNAPSE ' de MLlib kullanarak bir modeli eğitme hakkında bir öğretici için bkz. Apache Spark mllib ve Azure SYNAPSE Analytics ile makine öğrenimi uygulaması oluşturma.

MLlib 'in yanı sıra, Scikit öğreni gibi popüler kitaplıklar da modeller geliştirmek için de kullanılabilir. SYNAPSE Spark havuzlarında kitaplıkların nasıl yükleneceğine ilişkin ayrıntılar için bkz. Azure SYNAPSE Analytics 'te Apache Spark için kitaplıkları yönetme .

Azure Machine Learning otomatikleştirilmiş ML modelleri eğitme

Makine öğrenimi modellerini eğitmek için başka bir yöntem de, Machine Learning ile ilgili çok daha fazla bilgi gerektirmez. otomatik ML kullanmaktır. otomatik ML , bir makine öğrenimi modelleri kümesini otomatik olarak gösteren ve kullanıcının belirli ölçümleri temel alarak en iyi modeli seçmesini sağlayan bir özelliktir. Azure Synapse not defterlerinden Azure Machine Learning ile sorunsuz bir tümleştirme sayesinde, kullanıcılar Synapse içindeki otomatikleştirilmiş ML doğrudan geçiş Azure Active Directory kimlik doğrulamasıyla yararlanabilir. bu, yalnızca Azure Machine Learning çalışma alanınızı işaret etmeniz ve herhangi bir kimlik bilgisi girmeniz gerekmediği anlamına gelir. otomatik makine öğrenimi ile Python 'da bir modeli eğitme, Synapse Spark havuzlarında Azure Machine Learning otomatikleştirilmiş ML kullanarak modellerin nasıl eğiteinin açıklanmaktadır.

Model dağıtımı ve Puanlama

Azure SYNAPSE ya da Azure SYNAPSE dışında eğitilen modeller toplu Puanlama için kolayca kullanılabilir. Şu anda SYNAPSE ' de, toplu Puanlama çalıştırmak için iki yol vardır.

  • verilerinizin nerede yaşadığı tahminlerinizi çalıştırmak için Synapse SQL havuzlarındaki TSQL tahmin işlevini kullanabilirsiniz. Bu güçlü ve ölçeklenebilir işlevi, veri ambarınızdaki verileri taşımadan verilerinizi zenginleştirmenize olanak tanır. Synapse Studio 'da yeni bir kılavuzlu makine öğrenimi modeli deneyimi , toplu puanlama için Synapse SQL havuzlarındaki Azure Machine Learning modeli kayıt defterinden bir onnx modelini dağıtabileceğiniz yerde sunulmuştur.

  • Azure SYNAPSE 'deki toplu Puanlama makine öğrenimi modelleri için başka bir seçenek de Azure SYNAPSE için Apache Spark havuzlarından faydalanır. Modelleri eğitebilmeniz için kullanılan kitaplıklara bağlı olarak, Batch puanlamasını çalıştırmak için bir kod deneyimi kullanabilirsiniz.

Sonraki adımlar