Makine öğrenme teknolojisi azure'da seçmeChoosing a machine learning technology in Azure

Veri bilimi ve machine learning, genellikle veri uzmanları tarafından karşılanması gereken bir iş yükü olan.Data science and machine learning is a workload that is usually undertaken by data scientists. Uzman Araçları, çoğu özellikle türü etkileşimli veri keşfi ve modelleme bir veri Bilimcisi gerçekleştirmeniz gereken görevler için tasarlanmış gerektiriyor.It requires specialist tools, many of which are designed specifically for the type of interactive data exploration and modeling tasks that a data scientist must perform.

Machine learning çözümlerinden yinelemeli olarak oluşturulur ve farklı olan iki aşama vardır:Machine learning solutions are built iteratively, and have two distinct phases:

  • Veri hazırlama ve modelleme.Data preparation and modeling.
  • Dağıtımı ve tüketimi Tahmine dayalı Hizmetleri.Deployment and consumption of predictive services.

İçin veri hazırlama ve modelleme araçları ve HizmetleriTools and services for data preparation and modeling

Veri bilimcileri genellikle Python veya r ile yazılan özel kod kullanarak verilerle çalışmayı tercih Bu kod genellikle etkileşimli görselleştirmeler ve ilişkilerle belirlemeye yardımcı olması için istatistik oluşturuluyor sorgulamak ve verileri araştırmak için kullanarak veri uzmanları ile çalışır.Data scientists typically prefer to work with data using custom code written in Python or R. This code is generally run interactively, with the data scientists using it to query and explore the data, generating visualizations and statistics to help determine the relationships with it. R ve Python veri bilimcileri kullanabileceğiniz birçok etkileşimli ortamlarda vardır.There are many interactive environments for R and Python that data scientists can use. Belirli bir sık kullanılan olduğu Jupyter not defterleri oluşturmak veri bilimcilerine sağlayan tarayıcı tabanlı bir kabuk sağlayan not defteri , R veya Python kodu ve markdown metni içeren dosyaları.A particular favorite is Jupyter Notebooks that provides a browser-based shell that enables data scientists to create notebook files that contain R or Python code and markdown text. Bu paylaşımı ve kod belgeleme işbirliği yapmak için verimli bir yöntem ve tek bir belgeye neden olur.This is an effective way to collaborate by sharing and documenting code and results in a single document.

Diğer yaygın olarak kullanılan araçlar şunları içerir:Other commonly used tools include:

  • Spyder: Anaconda Python dağıtımı olan sağlanan Python için etkileşimli bir geliştirme ortamı (IDE).Spyder: The interactive development environment (IDE) for Python provided with the Anaconda Python distribution.
  • R Studio: Bir IDE olan R programlama dili için.R Studio: An IDE for the R programming language.
  • Visual Studio Code'u: Sık kullanılan çerçeveler yanı sıra Python makine öğrenimi ve yapay ZEKA geliştirme için destekleyen bir basit, platformlar arası kodlama ortam.Visual Studio Code: A lightweight, cross-platform coding environment that supports Python as well as commonly used frameworks for machine learning and AI development.

Bu araçlara ek olarak, kod ve model yönetimi basitleştirmek için Azure hizmetlerini veri uzmanları yararlanabilir.In addition to these tools, data scientists can leverage Azure services to simplify code and model management.

Azure NotebooksAzure Notebooks

Azure not defterleri, oluşturma, çalıştırma ve bulut tabanlı kitaplıkları Jupyter not defterlerinde paylaşmak veri bilimcilerine sağlayan çevrimiçi Jupyter not defterleri hizmetidir.Azure Notebooks is an online Jupyter Notebooks service that enables data scientists to create, run, and share Jupyter Notebooks in cloud-based libraries.

Başlıca yararları:Key benefits:

  • Ücretsiz hizmet—Azure aboneliği gerekir.Free service—no Azure subscription required.
  • Jupyter ve destekleyici R veya Python dağıtımlarını yerel olarak yüklemeniz gerekmez—yalnızca bir tarayıcı kullanın.No need to install Jupyter and the supporting R or Python distributions locally—just use a browser.
  • Kendi çevrimiçi kitaplıklarını yönetme ve bunlara herhangi bir CİHAZDAN erişebilirsiniz.Manage your own online libraries and access them from any device.
  • Not defterlerinizi ortak çalışanlarla paylaşır.Share your notebooks with collaborators.

Dikkat edilmesi gerekenler:Considerations:

  • Çevrimdışıyken defterlerinizi erişmek mümkün olmayacaktır.You will be unable to access your notebooks when offline.
  • Ücretsiz notebook hizmeti sınırlı işleme yeteneklerine büyük veya karmaşık modelleri eğitmek için yeterli olmayabilir.Limited processing capabilities of the free notebook service may not be enough to train large or complex models.

Veri bilimi sanal makinesiData science virtual machine

Veri bilimi sanal makinesi araçları ve çerçeveleri R, Python, Jupyter not defterleri, Visual Studio Code ve machine learning gibi modelleme için kitaplıkları dahil olmak üzere, veri uzmanları tarafından yaygın olarak kullanılan içeren bir Azure sanal makine görüntüsüdür Microsoft Bilişsel Araç Seti.The data science virtual machine is an Azure virtual machine image that includes the tools and frameworks commonly used by data scientists, including R, Python, Jupyter Notebooks, Visual Studio Code, and libraries for machine learning modeling such as the Microsoft Cognitive Toolkit. Bu araçlar, karmaşık ve zaman alıcı yükleme ve sürüm yönetimi sorunları için genellikle müşteri adayı birçok bağımlılıkları içeriyor olabilir.These tools can be complex and time consuming to install, and contain many interdependencies that often lead to version management issues. Önceden yüklenmiş bir görüntü sahip veri bilimcileri ortam sorunlarını giderme, üzerinde veri keşfi odaklanmak için harcadığınız zamanı azaltmak ve modelleme görevleri gerçekleştirmek ihtiyaç duydukları.Having a preinstalled image can reduce the time data scientists spend troubleshooting environment issues, allowing them to focus on the data exploration and modeling tasks they need to perform.

Başlıca yararları:Key benefits:

  • Veri bilimi araçları ve çerçeveleri sorun giderme yüklemek ve yönetmek için gereken süre azaltıldı.Reduced time to install, manage, and troubleshoot data science tools and frameworks.
  • Tüm son sürümlerini yaygın olarak kullanılan araçlar ve çerçeveler dahil edilir.The latest versions of all commonly used tools and frameworks are included.
  • Sanal makine seçenekleri yoğun veri modelleme için GPU özelliklerine sahip yüksek düzeyde ölçeklenebilir görüntüleri içerir.Virtual machine options include highly scalable images with GPU capabilities for intensive data modeling.

Dikkat edilmesi gerekenler:Considerations:

  • Sanal makineyi çevrimdışı durumdayken erişilemez.The virtual machine cannot be accessed when offline.
  • Yalnızca gerekli olduğunda çalışmasını sağlamak dikkatli olmanız gerekir, böylece Azure ücretleri, bir sanal makinede çalışan artmasına neden olur.Running a virtual machine incurs Azure charges, so you must be careful to have it running only when required.

Azure Machine LearningAzure Machine Learning

Azure Machine Learning makine öğrenimi denemeleri ve modelleri yönetmek için bir bulut tabanlı bir hizmettir.Azure Machine Learning is a cloud-based service for managing machine learning experiments and models. Bu veri hazırlama ve eğitim betikleriniz, yinelemeler arasında model performansını karşılaştırabilmeniz tüm yürütme geçmişini koruma modelleme izleyen bir deneme hizmeti içerir.It includes an experimentation service that tracks data preparation and modeling training scripts, maintaining a history of all executions so you can compare model performance across iterations. Veri bilimcileri Jupyter Not Defteri veya Visual Studio Code gibi tercih ettiğiniz kendi aracında betikleri oluşturabilir ve ardından çeşitli farklı dağıtma işlem kaynaklarını azure'da.Data scientists can create scripts in their tool of choice, such as Jupyter Notebooks or Visual Studio Code, and then deploy to a variety of different compute resources in Azure.

Modelleri, bir web hizmeti bir Docker kapsayıcı, Spark, Azure Hdınsight, Microsoft Machine Learning sunucusu veya SQL Server olarak dağıtılabilir.Models can be deployed as a web service to a Docker container, Spark on Azure HDinsight, Microsoft Machine Learning Server, or SQL Server. Azure Machine Learning Model Yönetimi hizmeti izlemek ve bulutta, uç cihazlarında veya kuruluş genelinde modeli dağıtımlarını yönetmek etkinleştirir.The Azure Machine Learning Model Management service then enables you to track and manage model deployments in the cloud, on edge devices, or across the enterprise.

Başlıca yararları:Key benefits:

  • Merkezi Yönetim betikleri ve çalıştırma geçmişi, model sürümleri Karşılaştır kolaylaştırır.Central management of scripts and run history, making it easy to compare model versions.
  • Bir görsel Düzenleyicisi ile etkileşimli veri dönüştürme.Interactive data transformation through a visual editor.
  • Kolay dağıtım ve Yönetimi bulutta veya uç cihazlara modelleri.Easy deployment and management of models to the cloud or edge devices.

Dikkat edilmesi gerekenler:Considerations:

  • Model yönetim modeliyle ilgili bilgi sahibi olmak gerekir.Requires some familiarity with the model management model.

Azure Batch AIAzure Batch AI

Azure Batch AI, makine öğrenimi denemeleri paralel çalıştırmak ve uygun ölçekte modeli eğitimi gpu'larla sanal makinelerin kümedeki gerçekleştirmek sağlar.Azure Batch AI enables you to run your machine learning experiments in parallel, and perform model training at scale across a cluster of virtual machines with GPUs. Batch AI eğitimi derin öğrenme işleri kümelenmiş Gpu'lar, Bilişsel araç seti, Caffe, Chainer ve TensorFlow gibi çerçeveleri kullanarak ölçeği sağlar.Batch AI training enables you to scale out deep learning jobs across clustered GPUs, using frameworks such as Cognitive Toolkit, Caffe, Chainer, and TensorFlow.

Azure Machine Learning Model yönetimi, Batch AI modelleri almak için kullanılabilir dağıtmak eğitim, yönetin ve bunları izleyin.Azure Machine Learning Model Management can be used to take models from Batch AI training to deploy, manage, and monitor them.

Azure Machine Learning StudioAzure Machine Learning Studio

Azure Machine Learning Studio, veri denemeleri oluşturmayı, makine öğrenimi modelleri eğitim ve bunları azure'da web Hizmetleri olarak yayımlamak için bir bulut tabanlı ve görsel bir geliştirme ortamıdır.Azure Machine Learning Studio is a cloud-based, visual development environment for creating data experiments, training machine learning models, and publishing them as web services in Azure. Veri bilimcileri, görsel sürükle ve bırak arabirimi sağlar ve ileri kullanıcılar görevleri modelleme, machine learning için R ve Python özel mantığı, çok çeşitli yerleşik istatistiksel algoritmalar ve teknikler desteklerken makine öğrenimi çözümleri hızlı bir şekilde oluşturun. , Jupyter not defterleri için yerleşik destek.Its visual drag-and-drop interface lets data scientists and power users create machine learning solutions quickly, while supporting custom R and Python logic, a wide range of established statistical algorithms and techniques for machine learning modeling tasks, and built-in support for Jupyter Notebooks.

Başlıca yararları:Key benefits:

  • En az kodla modelleme, makine öğrenimi etkileşimli görsel bir arabirim sağlar.Interactive visual interface enables machine learning modeling with minimal code.
  • Veri keşfi için yerleşik Jupyter not defterleri.Built-in Jupyter Notebooks for data exploration.
  • Azure web Hizmetleri olarak doğrudan dağıtım eğitilen modelleri.Direct deployment of trained models as Azure web services.

Dikkat edilmesi gerekenler:Considerations:

  • Sınırlı ölçeklenebilirlik.Limited scalability. Bir eğitim veri kümesi boyutu üst sınırı 10 GB'dir.The maximum size of a training dataset is 10 GB.
  • Yalnızca çevrimiçi.Online only. Çevrimdışı bir geliştirme ortamı yok.No offline development environment.

Araçlar ve hizmetler, makine öğrenimi modelleri dağıtmaTools and services for deploying machine learning models

Bir veri Bilimcisi machine learning modeli oluşturduktan sonra genellikle dağıtıp uygulamalarından veya diğer bir veri akışı kullanmak gerekir.After a data scientist has created a machine learning model, you will typically need to deploy it and consume it from applications or in other data flows. Olası dağıtım hedefleri için makine öğrenimi modellerini vardır.There are a number of potential deployment targets for machine learning models.

Azure HDInsight'ta SparkSpark on Azure HDInsight

Apache Spark, Spark MLlib, framework ve makine öğrenimi modellerini kitaplığı içerir.Apache Spark includes Spark MLlib, a framework and library for machine learning models. Spark (MMLSpark) için Microsoft Machine Learning kitaplığı da derin sağlar öğrenme algoritması Tahmine dayalı modelleri Spark desteği.The Microsoft Machine Learning library for Spark (MMLSpark) also provides deep learning algorithm support for predictive models in Spark.

Başlıca yararları:Key benefits:

  • Spark, yüksek hacimli makine öğrenimi işlemleri için daha yüksek ölçeklenebilirlik sunan dağıtılmış bir platformdur.Spark is a distributed platform that offers high scalability for high-volume machine learning processes.
  • Hdınsight'ta Spark için doğrudan modelleri dağıtma ve Azure Machine Learning Model Yönetimi hizmeti kullanarak bunları yönetin.You can deploy models directly to Spark in HDinsight and manage them using the Azure Machine Learning Model Management service.

Dikkat edilmesi gerekenler:Considerations:

  • Spark çalıştığı tam saat ücreti alınmaz bir budur kümesinde çalışır.Spark runs in an HDinsght cluster that incurs charges the whole time it is running. Machine learning hizmeti yalnızca zaman zaman kullanılacaksa, bu doğan gereksiz maliyetleri neden olabilir.If the machine learning service will only be used occasionally, this may result in unnecessary costs.

Azure DatabricksAzure Databricks

Azure Databricks bir Apache Spark temelli analiz platformudur.Azure Databricks is an Apache Spark-based analytics platform. Bunu "Hizmet olarak Spark." olarak düşünebilirsinizYou can think of it as "Spark as a service." Bu, Spark Azure platformunda kullanmak için en kolay yoludur.It's the easiest way to use Spark on the Azure platform. Machine learning için kullanabileceğiniz MLFlow, Databricks çalışma zamanı ML, Apache Spark MLlib ve diğerleri.For machine learning, you can use MLFlow, Databricks Runtime ML, Apache Spark MLlib, and others. Daha fazla bilgi için Azure Databricks: Makine öğrenimi.For more information, see Azure Databricks: Machine Learning.

Bir kapsayıcıda Web hizmetiWeb service in a container

Makine öğrenme modeli, bir Docker kapsayıcısında bir Python web hizmeti olarak dağıtabilirsiniz.You can deploy a machine learning model as a Python web service in a Docker container. Model, azure'a veya burada yerel olarak üzerinde çalıştığı verileriyle kullanılabilmesi için bir edge cihazının dağıtabilirsiniz.You can deploy the model to Azure or to an edge device, where it can be used locally with the data on which it operates.

Önemli Avantajları:Key Benefits:

  • Kapsayıcıları paketleme ve Hizmetleri dağıtmak için basit ve genellikle uygun maliyetli bir yoludur.Containers are a lightweight and generally cost effective way to package and deploy services.
  • Edge cihazına dağıtma olanağı, Tahmine dayalı mantığınızı yakın verilere taşımanızı sağlar.The ability to deploy to an edge device enables you to move your predictive logic closer to the data.

Dikkat edilmesi gerekenler:Considerations:

  • Bu dağıtım modeli Docker kapsayıcılarında dayalı, bu yüzden, bu şekilde bir web hizmetini dağıtmadan önce bu teknolojiyle ilgili bilgi sahibi olmalısınız.This deployment model is based on Docker containers, so you should be familiar with this technology before deploying a web service this way.

Microsoft Machine Learning SunucusuMicrosoft Machine Learning Server

Machine Learning sunucusu (eski adıyla Microsoft R Server), machine learning senaryoları için özel olarak tasarlanan, R ve Python kodu için ölçeklenebilir bir platformdur.Machine Learning Server (formerly Microsoft R Server) is a scalable platform for R and Python code, specifically designed for machine learning scenarios.

Başlıca yararları:Key benefits:

  • Yüksek ölçeklenebilirlik.High scalability.

Dikkat edilmesi gerekenler:Considerations:

  • Dağıtmak ve Machine Learning sunucusu, kuruluşunuzda yönetmek gerekir.You need to deploy and manage Machine Learning Server in your enterprise.

Microsoft SQL ServerMicrosoft SQL Server

Makine öğrenimi modelleri yalıtılacak sağlayarak bu dillerde bir veritabanında Transact-SQL işlevleri olarak oluşturulmuş, Microsoft SQL Server R ve Python yerel olarak destekler.Microsoft SQL Server supports R and Python natively, enabling you to encapsulate machine learning models built in these languages as Transact-SQL functions in a database.

Başlıca yararları:Key benefits:

  • Tahmine dayalı bir mantıksal veri katmanı mantığı eklemeyi kolaylaştıran bir veritabanı işlevindeki kapsüller.Encapsulate predictive logic in a database function, making it easy to include in data-tier logic.

Dikkat edilmesi gerekenler:Considerations:

  • Uygulamanız için veri katmanı SQL Server veritabanı varsayar.Assumes a SQL Server database as the data tier for your application.

Azure Machine Learning web hizmetiAzure Machine Learning web service

Bir machine learning modeli Azure Machine Learning Studio'yu kullanarak oluşturduğunuzda, bir web hizmeti olarak dağıtabilirsiniz.When you create a machine learning model using Azure Machine Learning Studio, you can deploy it as a web service. Bunun ardından bir HTTP ile iletişim kurabilen tüm istemci uygulamalarından REST arabirimi aracılığıyla tüketilebilir.This can then be consumed through a REST interface from any client applications capable of communicating by HTTP.

Başlıca yararları:Key benefits:

  • Geliştirme ve dağıtım kolaylığı.Ease of development and deployment.
  • Web Hizmeti Yönetim Portalı'yla temel izleme ölçümleri.Web service management portal with basic monitoring metrics.
  • Azure Data Lake Analytics, Azure Data Factory ve Azure Stream Analytics Azure Machine Learning web hizmetlerini çağırmak için yerleşik destek içerir.Built-in support for calling Azure Machine Learning web services from Azure Data Lake Analytics, Azure Data Factory, and Azure Stream Analytics.

Dikkat edilmesi gerekenler:Considerations:

  • Yalnızca, Azure Machine Learning Studio'yu kullanarak oluşturulmuş modelleri için de kullanılabilir.Only available for models built using Azure Machine Learning Studio.
  • Web tabanlı erişim yalnızca, eğitilen modeller, şirket içi çalıştırılamaz veya çevrimdışı.Web-based access only, trained models cannot run on-premises or offline.