O que é o Azure Machine Learning Studio?What is Azure Machine Learning Studio?

O Microsoft Azure Machine Learning Studio é uma ferramenta colaborativa do tipo "arrastar e soltar", que você pode usar para criar, testar e implantar soluções de análise preditiva em seus dados.Microsoft Azure Machine Learning Studio is a collaborative, drag-and-drop tool you can use to build, test, and deploy predictive analytics solutions on your data. O Machine Learning Studio publica modelos como serviços Web que podem ser facilmente consumidos por aplicativos personalizados ou ferramentas de BI como o Excel.Machine Learning Studio publishes models as web services that can easily be consumed by custom apps or BI tools such as Excel.

O Machine Learning Studio é onde a ciência de dados, as análises preditivas, os recursos de nuvem e seus dados se encontram!Machine Learning Studio is where data science, predictive analytics, cloud resources, and your data meet.

Observação

Você pode experimentar o Azure Machine Learning gratuitamente.You can try Azure Machine Learning for free. Não é necessário nenhum cartão de crédito ou assinatura do Azure.No credit card or Azure subscription is required. Comece agora mesmo.Get started now.

O espaço de trabalho interativo do Machine Learning StudioThe Machine Learning Studio interactive workspace

Para desenvolver um modelo de análise preditiva, normalmente você usa dados de uma ou mais fontes, transforma e analisa esses dados com várias funções de manipulação de dados e estatísticas e gera um conjunto de resultados.To develop a predictive analysis model, you typically use data from one or more sources, transform and analyze that data through various data manipulation and statistical functions, and generate a set of results. Desenvolver um modelo como este é um processo iterativo.Developing a model like this is an iterative process. À medida que você modifica as diversas funções e seus parâmetros, seus resultados convergem até que você esteja satisfeito, com um modelo treinado e eficiente.As you modify the various functions and their parameters, your results converge until you are satisfied that you have a trained, effective model.

Azure Machine Learning Studio oferece um espaço de trabalho visual e interativo para compilar, testar e iterar em um modelo de análise preditivo.Azure Machine Learning Studio gives you an interactive, visual workspace to easily build, test, and iterate on a predictive analysis model. Você arrasta e solta conjuntos de dados e módulos de análise em telas interativas conectando-as para formar um teste, o qual você executa no Azure Machine Learning Studio.You drag-and-drop datasets and analysis modules onto an interactive canvas, connecting them together to form an experiment, which you run in Machine Learning Studio. Para iterar em seu design de modelo, você edita o teste, salva uma cópia, se desejado, e executa-o novamente.To iterate on your model design, you edit the experiment, save a copy if desired, and run it again. Quando você estiver pronto, você poderá converter seu teste de treinamento em uma experiência preditiva e, em seguida, publicá-la como um serviço Web para que seu modelo possa ser acessado por outras pessoas.When you're ready, you can convert your training experiment to a predictive experiment, and then publish it as a web service so that your model can be accessed by others.

Não há necessidade de programação, basta conectar visualmente os conjuntos de dados e módulos para construir seu modelo de análise preditivo.There is no programming required, just visually connecting datasets and modules to construct your predictive analysis model.

Dica

Para baixar e imprimir um diagrama que fornece uma visão geral dos recursos do Machine Learning Studio, consulte Diagrama de visão geral dos recursos do Azure Machine Learning Studio.To download and print a diagram that gives an overview of the capabilities of Machine Learning Studio, see Overview diagram of Azure Machine Learning Studio capabilities.

Diagrama do Azure ML Studio: criar testes, ler dados de várias fontes, gravar dados de pontuação, escrever modelos.

Introdução ao Machine Learning StudioGet started with Machine Learning Studio

Ao entrar pela primeira vez no Machine Learning Studio, você verá a página Inicial .When you first enter Machine Learning Studio you see the Home page. Aqui você pode exibir a documentação, vídeos, seminários na Web e obter outros recursos valiosos.From here you can view documentation, videos, webinars, and find other valuable resources.

Clique no menu superior esquerdoClick the upper-left menu Menu e você verá várias opções.and you'll see several options.

Cortana IntelligenceCortana Intelligence

Clique em Cortana Intelligence e você será levado para a página inicial do Cortana Intelligence Suite.Click Cortana Intelligence and you'll be taken to the home page of the Cortana Intelligence Suite. O Cortana Intelligence Suite é um pacote de análise avançada e de big data totalmente gerenciado que permite transformar seus dados em ação inteligente.The Cortana Intelligence Suite is a fully managed big data and advanced analytics suite to transform your data into intelligent action. Consulte a página do Suite para obter a documentação completa, inclusive histórias de clientes.See the Suite home page for full documentation, including customer stories.

Azure Machine Learning StudioAzure Machine Learning Studio

Há duas opções aqui, Home, a página onde você começou, e Studio.There are two options here, Home, the page where you started, and Studio.

Clique em Studio e você será levado para o Azure Machine Learning Studio.Click Studio and you'll be taken to the Azure Machine Learning Studio. Em primeiro lugar, será solicitado que você entre usando a conta da Microsoft, ou sua conta de trabalho ou escola.First you'll be asked to sign in using your Microsoft account, or your work or school account. Depois de conectado, você verá as seguintes guias à esquerda:Once signed in, you'll see the following tabs on the left:

  • PROJETOS - coleções de testes, conjuntos de dados, blocos de anotações e outros recursos que representam um único projetoPROJECTS - Collections of experiments, datasets, notebooks, and other resources representing a single project
  • TESTES – Testes que você criou e executou ou salvou como rascunhosEXPERIMENTS - Experiments that you have created and run or saved as drafts
  • SERVIÇOS WEB -serviços Web que você implantou dos testesWEB SERVICES - Web services that you have deployed from your experiments
  • NOTEBOOKS - Notebooks Jupyter que você criouNOTEBOOKS - Jupyter notebooks that you have created
  • CONJUNTOS DE DADOS - Conjuntos de dados que você carregou no EstúdioDATASETS - Datasets that you have uploaded into Studio
  • MODELOS TREINADOS - Modelos que você treinou em testes e salvos no EstúdioTRAINED MODELS - Models that you have trained in experiments and saved in Studio
  • CONFIGURAÇÕES – Uma coleção das configurações que você pode usar para configurar sua conta e recursos.SETTINGS - A collection of settings that you can use to configure your account and resources.

Clique em Galeria e você será levado para a Galeria de IA do Azure.Click Gallery and you'll be taken to the Azure AI Gallery. A Galeria é um lugar no qual uma comunidade de desenvolvedores e cientistas de dados podem compartilhar soluções criadas usando os componentes do Cortana Intelligence Suite.The Gallery is a place where a community of data scientists and developers share solutions created using components of the Cortana Intelligence Suite.

Para saber mais sobre a Galeria, veja as Soluções de compartilhamento e descoberta na Galeria de IA do Azure.For more information about the Gallery, see Share and discover solutions in the Azure AI Gallery.

Componentes de um testeComponents of an experiment

Um teste consiste em conjuntos de dados que fornecem dados para módulos analíticos, os quais você conecta para construir um modelo de análise preditiva.An experiment consists of datasets that provide data to analytical modules, which you connect together to construct a predictive analysis model. Especificamente, um teste válido possui três características:Specifically, a valid experiment has these characteristics:

  • O teste tem no mínimo um conjunto de dados e um módulo.The experiment has at least one dataset and one module
  • Os conjuntos de dados podem ser conectados somente aos módulos.Datasets may be connected only to modules
  • Os módulos podem ser conectados a conjuntos de dados ou a outros módulos.Modules may be connected to either datasets or other modules
  • Todas as portas de entrada dos módulos devem ter uma conexão com o fluxo de dados.All input ports for modules must have some connection to the data flow
  • Todos os parâmetros necessários para cada módulo devem estar configurados.All required parameters for each module must be set

Você pode criar uma experiência do zero, ou você pode usar uma experiência de exemplo existente como um modelo.You can create an experiment from scratch, or you can use an existing sample experiment as a template. Para saber mais, confira Copiar os testes de amostra para criar novos experimentos do aprendizado de máquina.For more information, see Copy example experiments to create new machine learning experiments.

Para obter um exemplo de criação de um teste simples, consulte Criar um teste simples no Azure Machine Learning Studio.For an example of creating a simple experiment, see Create a simple experiment in Azure Machine Learning Studio.

Para obter uma explicação mais completa da criação de uma solução de análise preditiva, consulte Desenvolver uma solução preditiva com o Azure Machine Learning.For a more complete walkthrough of creating a predictive analytics solution, see Develop a predictive solution with Azure Machine Learning.

Conjunto de dadosDatasets

Um conjunto de dados inclui dados que foram atualizados no Machine Learning Studio, de forma que possam ser usados no processo de modelagem.A dataset is data that has been uploaded to Machine Learning Studio so that it can be used in the modeling process. Alguns conjuntos de dados de amostra estão incluídos no Machine Learning Studio, com os quais você pode testar, além de ser possível também carregar mais conjuntos de dados, caso necessário.A number of sample datasets are included with Machine Learning Studio for you to experiment with, and you can upload more datasets as you need them. Aqui estão alguns exemplos dos conjuntos de dados incluídos:Here are some examples of included datasets:

  • Dados MPG para vários automóveis – valores MPG (milhas por galão) para automóveis identificados por número de cilindros, cavalo-vapor, etc.MPG data for various automobiles - Miles per gallon (MPG) values for automobiles identified by number of cylinders, horsepower, etc.
  • Dados de câncer de mama – dados de diagnósticos de câncer de mamaBreast cancer data - Breast cancer diagnosis data.
  • Dados de incêndios em florestas – tamanhos dos incêndios em floresta na região nordeste de PortugalForest fires data - Forest fire sizes in northeast Portugal.

À medida que você compila um teste, você pode escolher na lista de conjuntos de dados à esquerda das telas.As you build an experiment you can choose from the list of datasets available to the left of the canvas.

Para obter uma lista de conjuntos de dados de exemplo incluídos no Machine Learning Studio, consulte Usar os conjuntos de dados de exemplo no Azure Machine Learning Studio.For a list of sample datasets included in Machine Learning Studio, see Use the sample data sets in Azure Machine Learning Studio.

MódulosModules

Um módulo é um algoritmo que você pode executar em seus dados.A module is an algorithm that you can perform on your data. O Machine Learning Studio tem uma série de módulos, desde funções de ingresso até treinamento, pontuação e processos de validação.Machine Learning Studio has a number of modules ranging from data ingress functions to training, scoring, and validation processes. Aqui estão alguns exemplos dos módulos incluídos:Here are some examples of included modules:

À medida que você compila um teste, você pode escolher a partir da lista de módulos à esquerda das telas.As you build an experiment you can choose from the list of modules available to the left of the canvas.

Um módulo pode ter um conjunto de parâmetros que você pode usar para configurar os algoritmos internos do módulo.A module may have a set of parameters that you can use to configure the module's internal algorithms. Ao selecionar um módulo nas telas, os parâmetros do módulo são exibidos no painel Propriedades à direita das telas.When you select a module on the canvas, the module's parameters are displayed in the Properties pane to the right of the canvas. Você pode modificar os parâmetros nesse painel para ajustar seu modelo.You can modify the parameters in that pane to tune your model.

Para obter ajuda sobre navegação através da biblioteca grande dos algoritmos de aprendizado de máquina disponíveis, consulte Como escolher algoritmos para o Microsoft Azure Machine Learning.For some help navigating through the large library of machine learning algorithms available, see How to choose algorithms for Microsoft Azure Machine Learning.

Implantando um serviço Web de análise preditivaDeploying a predictive analytics web service

Quando seu modelo de análise preditiva estiver pronto, você pode implantá-lo como um serviço Web diretamente no Machine Learning Studio.Once your predictive analytics model is ready, you can deploy it as a web service right from Machine Learning Studio. Para obter mais detalhes sobre esse processo, consulte Implantar um serviço Web do Azure Machine Learning.For more details on this process, see Deploy an Azure Machine Learning web service.

Principais termos e conceitos do aprendizado de máquinaKey machine learning terms and concepts

Termos do aprendizado de máquina podem ser confusos.Machine learning terms can be confusing. Aqui estão as definições dos principais termos para ajudá-lo.Here are definitions of key terms to help you. Use comentários para nos dizer sobre qualquer outro termo que gostaria de ver definido.Use comments following to tell us about any other term you'd like defined.

Exploração de dados, análise descritiva e análise preditivaData exploration, descriptive analytics, and predictive analytics

Exploração de dados é o processo de coleta de informações sobre um conjunto de dados grande e geralmente não estruturado para encontrar características para uma análise focada.Data exploration is the process of gathering information about a large and often unstructured data set in order to find characteristics for focused analysis.

Mineração de dados refere-se à mineração de dados automatizada.Data mining refers to automated data exploration.

Análise descritiva é o processo de análise de um conjunto de dados para gerar um resumo do que aconteceu.Descriptive analytics is the process of analyzing a data set in order to summarize what happened. A grande maioria da análise de negócios - como relatórios de vendas, métricas de Web e análises de redes sociais - são descritivas.The vast majority of business analytics - such as sales reports, web metrics, and social networks analysis - are descriptive.

Análise preditiva é o processo de criação de modelos por meio de dados atuais ou históricos para prever resultados futuros.Predictive analytics is the process of building models from historical or current data in order to forecast future outcomes.

Aprendizado supervisionado e não supervisionadoSupervised and unsupervised learning

aprendizado supervisionado são treinados com dados rotulados – em outras palavras, dados compostos de exemplos das respostas desejadas.Supervised learning algorithms are trained with labeled data - in other words, data comprised of examples of the answers wanted. Por exemplo, um modelo que identifica o uso fraudulento do cartão de crédito seria treinado por meio de um conjunto de dados com pontos de dados rotulados de cobranças fraudulentas e válidas conhecidas.For instance, a model that identifies fraudulent credit card use would be trained from a data set with labeled data points of known fraudulent and valid charges. Na maioria das vezes, o aprendizado de máquina é supervisionado.Most machine learning is supervised.

aprendizado não supervisionado é usado em dados sem rótulos e o objetivo é localizar relações existentes nos dados.Unsupervised learning is used on data with no labels, and the goal is to find relationships in the data. Por exemplo, você talvez queira localizar agrupamentos de dados demográficos de clientes com hábitos de compra semelhantes.For instance, you might want to find groupings of customer demographics with similar buying habits.

Treinamento e avaliação de modeloModel training and evaluation

Um modelo de aprendizado de máquina é uma abstração da pergunta que você está tentando responder ou o resultado que você deseja prever.A machine learning model is an abstraction of the question you are trying to answer or the outcome you want to predict. Os modelos são treinados e avaliados por meio de dados existentes.Models are trained and evaluated from existing data.

Dados de treinamentoTraining data

Quando você treina um modelo a partir de dados, usa um conjunto de dados conhecido e faz ajustes no modelo com base nas características dos dados para obter a resposta mais precisa.When you train a model from data, you use a known data set and make adjustments to the model based on the data characteristics to get the most accurate answer. No Azure Machine Learning, um modelo é criado por meio de um módulo de algoritmos que processa os dados de treinamento e módulos funcionais, por exemplo, um módulo de pontuação.In Azure Machine Learning, a model is built from an algorithm module that processes training data and functional modules, such as a scoring module.

No aprendizado supervisionado, se você estiver treinando um modelo de detecção de fraudes, usará um conjunto de transações rotuladas como fraudulentas ou válidas.In supervised learning, if you're training a fraud detection model, you use a set of transactions that are labeled as either fraudulent or valid. Você dividirá seu conjunto de dados aleatoriamente e usará uma parte para treinar o modelo e outra para testar ou avaliar o modelo.You split your data set randomly, and use part to train the model and part to test or evaluate the model.

Dados de avaliaçãoEvaluation data

A partir do momento em que você tem um modelo treinado, avalie esse modelo usando os dados de teste restantes.Once you have a trained model, evaluate the model using the remaining test data. Você utiliza os dados cujos resultados você já conhece, para que você possa determinar se o seu modelo prevê com precisão.You use data you already know the outcomes for, so that you can tell whether your model predicts accurately.

Outros termos comuns de aprendizado de máquinaOther common machine learning terms

  • algoritmo: Um conjunto independente de regras usadas para resolver problemas por meio do processamento de dados, cálculo ou raciocínio automatizado.algorithm: A self-contained set of rules used to solve problems through data processing, math, or automated reasoning.
  • detecção de anomalias: um modelo que marca os eventos ou valores incomuns e ajuda a descobrir problemas.anomaly detection: A model that flags unusual events or values and helps you discover problems. Por exemplo, a detecção de fraudes de cartão de crédito procura compras incomuns.For example, credit card fraud detection looks for unusual purchases.
  • dados categóricos: Dados organizados em categorias e que podem ser divididos em grupos.categorical data: Data that is organized by categories and that can be divided into groups. Por exemplo, um conjunto de dados categórico para carros poderia especificar ano, marca, modelo e preço.For example a categorical data set for autos could specify year, make, model, and price.
  • classificação: Um modelo para organizar os pontos de dados em categorias com base em um conjunto de dados para o qual os agrupamentos de categorias já são conhecidos.classification: A model for organizing data points into categories based on a data set for which category groupings are already known.
  • engenharia de recursos: O processo de extração ou seleção de recursos relacionados a um conjunto de dados, para otimizar o conjunto de dados e aprimorar os resultados.feature engineering: The process of extracting or selecting features related to a data set in order to enhance the data set and improve outcomes. Por exemplo, dados de passagens aéreas poderiam ser otimizados classificando-os em dias de semana e feriados.For instance, airfare data could be enhanced by days of the week and holidays. Consulte Engenharia e seleção de recursos no Azure Machine Learning.See Feature selection and engineering in Azure Machine Learning.
  • módulo: uma parte funcional em um modelo do Machine Learning Studio, como, por exemplo, o módulo Inserir Dados, que permite inserir e editar pequenos conjuntos de dados.module: A functional part in a Machine Learning Studio model, such as the Enter Data module that enables entering and editing small data sets. Um algoritmo também é um tipo de módulo no Machine Learning Studio.An algorithm is also a type of module in Machine Learning Studio.
  • modelo: um modelo de aprendizado supervisionado é o produto de um experimento do aprendizado de máquina composto de dados de treinamento, módulo de algoritmo e módulos funcionais, como um módulo do Modelo de Pontuação.model: A supervised learning model is the product of a machine learning experiment comprised of training data, an algorithm module, and functional modules, such as a Score Model module.
  • dados numéricos: Dados que têm significado, como medidas (dados contínuos) ou contagens (dados discretos).numerical data: Data that has meaning as measurements (continuous data) or counts (discrete data). Também conhecidos como dados quantitativos.Also referred to as quantitative data.
  • partição: O método pelo qual você divide dados em exemplos.partition: The method by which you divide data into samples. Consulte Partição e Exemplo para obter mais informações.See Partition and Sample for more information.
  • previsão: Uma previsão é uma estimativa de valor ou valores a partir de um modelo de aprendizado de máquina.prediction: A prediction is a forecast of a value or values from a machine learning model. Você também pode ver o termo "pontuação prevista."You might also see the term "predicted score." No entanto, as pontuações previstas não são a saída final de um modelo.However, predicted scores are not the final output of a model. Uma avaliação do modelo vem a seguir da pontuação.An evaluation of the model follows the score.
  • regressão: um modelo para prever um valor com base em variáveis independentes, como prever o preço de um carro com base em seu ano e marca.regression: A model for predicting a value based on independent variables, such as predicting the price of a car based on its year and make.
  • pontuação: um valor previsto gerado por meio de uma classificação treinada ou um modelo de regressão, usando o módulo Modelo de Pontuação no Machine Learning Studio.score: A predicted value generated from a trained classification or regression model, using the Score Model module in Machine Learning Studio. Os modelos de classificação também retornam uma pontuação para a probabilidade do valor previsto.Classification models also return a score for the probability of the predicted value. Depois de ter gerado pontuações por meio de um modelo, você pode avaliar a precisão desse modelo usando o módulo Avaliar modelo.Once you've generated scores from a model, you can evaluate the model's accuracy using the Evaluate Model module.
  • exemplo: uma parte de um conjunto de dados deve ser representativa do todo.sample: A part of a data set intended to be representative of the whole. Exemplos podem ser selecionados aleatoriamente ou com base em recursos específicos do conjunto de dados.Samples can be selected randomly or based on specific features of the data set.

Próximas etapasNext steps

Você pode aprender os fundamentos da análise preditiva e aprendizado de máquina usando um tutorial passo a passo e aproveitando os exemplos.You can learn the basics of predictive analytics and machine learning using a step-by-step tutorial and by building on samples.