Escolher um de machine learning tecnologia no AzureChoosing a machine learning technology in Azure

Ciência de dados e o machine learning é uma carga de trabalho que, normalmente, é realizada por cientistas de dados.Data science and machine learning is a workload that is usually undertaken by data scientists. Ele requer ferramentas especialista, muitos dos quais foram concebidos especificamente para o tipo de exploração de dados interativos e tarefas que tem de efetuar um cientista de dados de modelagem.It requires specialist tools, many of which are designed specifically for the type of interactive data exploration and modeling tasks that a data scientist must perform.

Soluções de aprendizagem automática são criadas de maneira iterativa e tem duas fases distintas:Machine learning solutions are built iteratively, and have two distinct phases:

  • Preparação de dados e modelação.Data preparation and modeling.
  • Implementação e consumo dos serviços de previsão.Deployment and consumption of predictive services.

Ferramentas e serviços para preparação de dados e modelaçãoTools and services for data preparation and modeling

Os cientistas de dados, normalmente, preferem trabalhar com dados com o código personalizado escrito em Python ou R. Este código é geralmente executado interativamente, com os cientistas de dados usando-o para consultar e explorar os dados, geração de visualizações e estatísticas para ajudar a determinar as relações com ela.Data scientists typically prefer to work with data using custom code written in Python or R. This code is generally run interactively, with the data scientists using it to query and explore the data, generating visualizations and statistics to help determine the relationships with it. Existem muitos ambientes interativos para R e Python que podem utilizar os cientistas de dados.There are many interactive environments for R and Python that data scientists can use. É de um determinado favorito blocos de notas do Jupyter que fornece uma shell baseada no browser que permite que os cientistas de dados criar bloco de notas ficheiros que contêm o texto de código e de markdown de R ou Python.A particular favorite is Jupyter Notebooks that provides a browser-based shell that enables data scientists to create notebook files that contain R or Python code and markdown text. Esta é uma forma eficaz de colaborar ao compartilhamento e documentar o código e resulta num único documento.This is an effective way to collaborate by sharing and documenting code and results in a single document.

Outras ferramentas usadas incluem:Other commonly used tools include:

  • Spyder: O ambiente de desenvolvimento interativo (IDE) do Python fornecidas com a distribuição de Anaconda Python.Spyder: The interactive development environment (IDE) for Python provided with the Anaconda Python distribution.
  • R Studio: Um IDE para a linguagem de programação R.R Studio: An IDE for the R programming language.
  • Visual Studio Code: Ambiente de codificação de leve e multiplataformas que suporta o Python, bem como as estruturas comumente usadas para aprendizagem e desenvolvimento de IA.Visual Studio Code: A lightweight, cross-platform coding environment that supports Python as well as commonly used frameworks for machine learning and AI development.

Além dessas ferramentas, os cientistas de dados podem tirar partido dos serviços do Azure para simplificar a gestão de código e o modelo.In addition to these tools, data scientists can leverage Azure services to simplify code and model management.

Azure NotebooksAzure Notebooks

Blocos de notas do Azure é um serviço de blocos de notas do Jupyter online que permite que os cientistas de dados criar, executar e partilhar os blocos de notas do Jupyter nas bibliotecas com base na cloud.Azure Notebooks is an online Jupyter Notebooks service that enables data scientists to create, run, and share Jupyter Notebooks in cloud-based libraries.

Principais benefícios:Key benefits:

  • Gratuito serviço—não é necessária uma subscrição do Azure.Free service—no Azure subscription required.
  • Não é necessário para instalar o Jupyter e os suporte R ou Python distribuições localmente—apenas utilize um browser.No need to install Jupyter and the supporting R or Python distributions locally—just use a browser.
  • Gerir as suas próprias bibliotecas online e acessá-los a partir de qualquer dispositivo.Manage your own online libraries and access them from any device.
  • Partilhe os seus blocos de notas com os colaboradores.Share your notebooks with collaborators.

Considerações:Considerations:

  • Não será possível aceder aos seus blocos de notas quando estiver offline.You will be unable to access your notebooks when offline.
  • Recursos de processamento limitado do serviço gratuito de bloco de notas podem não ser suficiente para preparar modelos grandes ou complexos.Limited processing capabilities of the free notebook service may not be enough to train large or complex models.

Máquina de virtual de ciência de dadosData science virtual machine

A máquina de virtual de ciência de dados é uma imagem de máquina virtual do Azure, que inclui as ferramentas e estruturas utilizadas frequentemente pelos cientistas de dados, incluindo o R, Python, blocos de notas do Jupyter, Visual Studio Code e bibliotecas para aprendizagem automática como modelar o Microsoft Cognitive Toolkit.The data science virtual machine is an Azure virtual machine image that includes the tools and frameworks commonly used by data scientists, including R, Python, Jupyter Notebooks, Visual Studio Code, and libraries for machine learning modeling such as the Microsoft Cognitive Toolkit. Essas ferramentas podem ser complexa e demorada para instalar e contêm muitas interdependências que freqüentemente levam a problemas de gerenciamento de versão.These tools can be complex and time consuming to install, and contain many interdependencies that often lead to version management issues. Ter uma imagem pré-instalada pode reduzir o tempo de cientistas de dados gastar problemas de ambiente de resolução de problemas, permitindo-lhes concentrar-se na exploração de dados e modelagem de tarefas que precisam para realizar.Having a preinstalled image can reduce the time data scientists spend troubleshooting environment issues, allowing them to focus on the data exploration and modeling tasks they need to perform.

Principais benefícios:Key benefits:

  • Tempo para instalar, gerir e resolver problemas de estruturas e ferramentas de ciência de dados reduzido.Reduced time to install, manage, and troubleshoot data science tools and frameworks.
  • As versões mais recentes de todos os utilizadas frequentemente ferramentas e estruturas são incluídas.The latest versions of all commonly used tools and frameworks are included.
  • Opções de máquina virtual incluem imagens altamente dimensionáveis com capacidades GPU para modelação de dados com utilização intensiva.Virtual machine options include highly scalable images with GPU capabilities for intensive data modeling.

Considerações:Considerations:

  • A máquina virtual não é possível aceder quando estiver offline.The virtual machine cannot be accessed when offline.
  • Executar uma máquina virtual incorre em encargos do Azure, para que precisa ter cuidado para a aplicação funcionar apenas quando necessário.Running a virtual machine incurs Azure charges, so you must be careful to have it running only when required.

Azure Machine LearningAzure Machine Learning

O Azure Machine Learning é um serviço baseado na nuvem para gerir modelos e experiências de machine learning.Azure Machine Learning is a cloud-based service for managing machine learning experiments and models. Ele inclui um serviço de experimentação de preparação de dados e scripts de preparação, manter um histórico de todas as execuções, para que pode comparar o desempenho de modelo em iterações de modelagem.It includes an experimentation service that tracks data preparation and modeling training scripts, maintaining a history of all executions so you can compare model performance across iterations. Os cientistas de dados podem criar scripts na ferramenta de sua escolha, como o Jupyter Notebooks ou o Visual Studio Code e, em seguida, implementar a uma variedade de diferentes recursos de computação no Azure.Data scientists can create scripts in their tool of choice, such as Jupyter Notebooks or Visual Studio Code, and then deploy to a variety of different compute resources in Azure.

Os modelos podem ser implementados como um serviço web para um contentor de Docker, o Spark no Azure HDinsight, o Microsoft Machine Learning Server ou o SQL Server.Models can be deployed as a web service to a Docker container, Spark on Azure HDinsight, Microsoft Machine Learning Server, or SQL Server. O serviço de gestão de modelos do Azure Machine Learning, em seguida, permite-lhe controlar e gerir implementações de modelo na cloud, em dispositivos periféricos, ou em toda a empresa.The Azure Machine Learning Model Management service then enables you to track and manage model deployments in the cloud, on edge devices, or across the enterprise.

Principais benefícios:Key benefits:

  • Gerenciamento central de scripts e histórico de execuções, facilitando a comparar versões de modelo.Central management of scripts and run history, making it easy to compare model versions.
  • Transformação de dados interativa por meio de um editor de visual.Interactive data transformation through a visual editor.
  • Facilitar a implementação e gestão de modelos para os dispositivos na cloud ou de extremidade.Easy deployment and management of models to the cloud or edge devices.

Considerações:Considerations:

  • Requer um pouco familiarizado com o modelo de gestão de modelo.Requires some familiarity with the model management model.

IA do Azure BatchAzure Batch AI

O Azure Batch AI permite-lhe executar o experimentações em paralelo da aprendizagem automática e executar a preparação de modelos à escala num cluster de máquinas virtuais com GPUs.Azure Batch AI enables you to run your machine learning experiments in parallel, and perform model training at scale across a cluster of virtual machines with GPUs. O batch AI training permite-lhe aumentar horizontalmente profunda trabalhos de aprendizagem em GPUs em clusters, usando estruturas, como o Cognitive Toolkit, Caffe, Chainer e TensorFlow.Batch AI training enables you to scale out deep learning jobs across clustered GPUs, using frameworks such as Cognitive Toolkit, Caffe, Chainer, and TensorFlow.

Gestão de modelo do Azure Machine Learning pode ser utilizado para pegar em modelos do Batch AI treinamento para implementar, gerir e monitorizá-las.Azure Machine Learning Model Management can be used to take models from Batch AI training to deploy, manage, and monitor them.

Azure Machine Learning StudioAzure Machine Learning Studio

O Azure Machine Learning Studio é um ambiente de desenvolvimento de visual, baseados na nuvem para criar experiências de dados, preparar modelos de aprendizagem automática e publicá-los como serviços da web no Azure.Azure Machine Learning Studio is a cloud-based, visual development environment for creating data experiments, training machine learning models, and publishing them as web services in Azure. Sua interface de arrastar e soltar visual permite que os cientistas de dados e usuários avançados criar rapidamente, soluções de aprendizagem automática, dar suporte a lógica personalizada de R e Python, uma grande variedade de técnicas e algoritmos de estatísticos estabelecidos para tarefas de modelagem do machine learning e suporte incorporado para blocos de notas do Jupyter.Its visual drag-and-drop interface lets data scientists and power users create machine learning solutions quickly, while supporting custom R and Python logic, a wide range of established statistical algorithms and techniques for machine learning modeling tasks, and built-in support for Jupyter Notebooks.

Principais benefícios:Key benefits:

  • Interface visual interativo permite que a aprendizagem de modelagem com pouco código.Interactive visual interface enables machine learning modeling with minimal code.
  • Incorporado blocos de notas Jupyter para exploração de dados.Built-in Jupyter Notebooks for data exploration.
  • Implementação direta de modelos de formação como serviços da web do Azure.Direct deployment of trained models as Azure web services.

Considerações:Considerations:

  • Escalabilidade limitada.Limited scalability. O tamanho máximo de um conjunto de dados de treinamento é de 10 GB.The maximum size of a training dataset is 10 GB.
  • Apenas online.Online only. Nenhum ambiente de desenvolvimento offline.No offline development environment.

Ferramentas e serviços para a implementação de modelos de machine learningTools and services for deploying machine learning models

Depois de um cientista de dados tenha criado um modelo de machine learning, normalmente, terá de implementá-lo e consumi-las a partir de aplicações ou em outros fluxos de dados.After a data scientist has created a machine learning model, you will typically need to deploy it and consume it from applications or in other data flows. Há uma série de possíveis destinos de implementação de modelos de machine learning.There are a number of potential deployment targets for machine learning models.

Spark no Azure HDInsightSpark on Azure HDInsight

Apache Spark inclui o Spark MLlib, uma estrutura e a biblioteca de modelos de machine learning.Apache Spark includes Spark MLlib, a framework and library for machine learning models. A biblioteca Microsoft Machine Learning para o Spark (MMLSpark) também oferece mais aprofundada de aprendizagem suporte de algoritmo para modelos preditivos no Spark.The Microsoft Machine Learning library for Spark (MMLSpark) also provides deep learning algorithm support for predictive models in Spark.

Principais benefícios:Key benefits:

  • O Spark é uma plataforma distribuída que oferece alta escalabilidade para processos de aprendizagem de elevado volume.Spark is a distributed platform that offers high scalability for high-volume machine learning processes.
  • Pode implementar modelos diretamente para o Spark no HDinsight e geri-los com o serviço de gestão de modelos do Azure Machine Learning.You can deploy models directly to Spark in HDinsight and manage them using the Azure Machine Learning Model Management service.

Considerações:Considerations:

  • Spark é executado num cluster do Hdinsight que incorre em encargos de todo o tempo está em execução.Spark runs in an HDinsght cluster that incurs charges the whole time it is running. Se o serviço machine learning só será utilizado ocasionalmente, isso pode resultar em custos desnecessários.If the machine learning service will only be used occasionally, this may result in unnecessary costs.

Azure DatabricksAzure Databricks

O Azure Databricks é uma plataforma de análise baseada no Apache Spark.Azure Databricks is an Apache Spark-based analytics platform. Pode considerá-lo como "Spark como um serviço".You can think of it as "Spark as a service." É a maneira mais fácil de utilizar o Spark na plataforma do Azure.It's the easiest way to use Spark on the Azure platform. Para o machine learning, pode usar MLFlow, ML de Runtime do Databricks, Apache Spark MLlib e outros.For machine learning, you can use MLFlow, Databricks Runtime ML, Apache Spark MLlib, and others. Para obter mais informações, consulte Azure Databricks: Machine Learning.For more information, see Azure Databricks: Machine Learning.

Serviço Web num contentorWeb service in a container

Pode implementar um modelo de aprendizagem automática como um serviço da web de Python num contentor do Docker.You can deploy a machine learning model as a Python web service in a Docker container. Pode implementar o modelo para o Azure ou para um dispositivo de limite, em que podem ser utilizados localmente com os dados em que ele funciona.You can deploy the model to Azure or to an edge device, where it can be used locally with the data on which it operates.

Principais Vantagens:Key Benefits:

  • Os contentores são uma forma simples e geralmente rentável para empacotar e implantar serviços.Containers are a lightweight and generally cost effective way to package and deploy services.
  • A capacidade de implementar para um dispositivo do edge permite-lhe mover a sua lógica preditiva mais perto dos dados.The ability to deploy to an edge device enables you to move your predictive logic closer to the data.

Considerações:Considerations:

  • Este modelo de implementação baseia-se a contentores do Docker, para que deve estar familiarizado com essa tecnologia antes de implementar um serviço web desta forma.This deployment model is based on Docker containers, so you should be familiar with this technology before deploying a web service this way.

Microsoft Machine Learning ServerMicrosoft Machine Learning Server

Machine Learning Server (anteriormente conhecido como o Microsoft R Server) é uma plataforma escalonável para o código de R e Python, concebida especificamente para cenários de aprendizado de máquina.Machine Learning Server (formerly Microsoft R Server) is a scalable platform for R and Python code, specifically designed for machine learning scenarios.

Principais benefícios:Key benefits:

  • Alta escalabilidade.High scalability.

Considerações:Considerations:

  • Terá de implementar e gerir a Machine Learning Server na sua empresa.You need to deploy and manage Machine Learning Server in your enterprise.

Microsoft SQL ServerMicrosoft SQL Server

Microsoft SQL Server suporta o R e Python nativamente, permitindo-lhe encapsular os modelos de machine learning criados nestes idiomas, como as funções do Transact-SQL numa base de dados.Microsoft SQL Server supports R and Python natively, enabling you to encapsulate machine learning models built in these languages as Transact-SQL functions in a database.

Principais benefícios:Key benefits:

  • Encapsula a lógica de previsão numa função de base de dados, facilitando a incluir na lógica da camada de dados.Encapsulate predictive logic in a database function, making it easy to include in data-tier logic.

Considerações:Considerations:

  • Assume um banco de dados do SQL Server como a camada de dados para a sua aplicação.Assumes a SQL Server database as the data tier for your application.

Serviço web do Azure Machine LearningAzure Machine Learning web service

Quando cria um modelo de machine learning com o Azure Machine Learning Studio, pode implementá-la como um serviço web.When you create a machine learning model using Azure Machine Learning Studio, you can deploy it as a web service. Em seguida, podem ser consumido através de uma interface REST quaisquer aplicações de cliente capazes de comunicar por HTTP.This can then be consumed through a REST interface from any client applications capable of communicating by HTTP.

Principais benefícios:Key benefits:

  • Facilidade de desenvolvimento e implementação.Ease of development and deployment.
  • Portal de gestão do serviço Web com métricas de monitorização básicas.Web service management portal with basic monitoring metrics.
  • Suporte interno para chamar serviços web Azure Machine Learning a partir do Azure Data Lake Analytics e Azure Stream Analytics do Azure Data Factory.Built-in support for calling Azure Machine Learning web services from Azure Data Lake Analytics, Azure Data Factory, and Azure Stream Analytics.

Considerações:Considerations:

  • Apenas disponível para modelos criados com o Azure Machine Learning Studio.Only available for models built using Azure Machine Learning Studio.
  • Modelos treinados e apenas de acesso baseado na Web não podem ser executado no local ou offline.Web-based access only, trained models cannot run on-premises or offline.