Pontuação de Machine Learning

Esta seção lista os módulos fornecidos no Azure Machine Learning Studio (clássico) para Pontuação.

Observação

Aplica-se a: Machine Learning Studio (clássico)

Esse conteúdo pertence apenas ao estúdio (clássico). Módulos de arrastar e soltar semelhantes foram adicionados ao designer de Azure Machine Learning. Saiba mais neste artigo comparando as duas versões.

A pontuação também é chamada de previsão e é o processo de geração de valores com base em um modelo de aprendizado de máquina treinado, dado novos dados de entrada. Os valores ou as pontuações que são criadas podem representar previsões de valores futuros, mas também podem representar uma categoria ou resultado provável. O significado da Pontuação depende do tipo de dados que você fornece e do tipo de modelo que você criou.

Criar e usar modelos no Machine Learning Studio (clássico)

O fluxo de trabalho típico para Machine Learning inclui estas fases:

  • Escolher um algoritmo adequado e definir opções iniciais.
  • Treinando o modelo em dados compatíveis.
  • Criação de previsões usando novos dados, com base nos padrões no modelo.
  • Avaliar o modelo para determinar se as previsões são precisas, quanto de erro há e se há algum superajuste.

Machine Learning Studio (clássico) dá suporte a uma estrutura flexível e personalizável para o aprendizado de máquina. Cada tarefa nesse processo é executada por um tipo específico de módulo, que pode ser modificado, adicionado ou removido, sem interromper o restante do experimento.

Os módulos nesta seção incluem ferramentas para pontuação. Nesta fase do Machine Learning, você aplica um modelo treinado a novos dados para gerar previsões. Você pode enviar essas previsões para um aplicativo que consome os resultados do Machine Learning ou usar os resultados da pontuação para avaliar a exatidão e a utilidade do modelo.

Mais sobre Pontuação

A pontuação é amplamente usada no aprendizado de máquina para significar o processo de geração de novos valores, dado um modelo e alguma nova entrada. O termo genérico "Score" é usado, em vez de "previsão", porque o processo de Pontuação pode gerar tantos tipos diferentes de valores:

  • Uma lista de itens recomendados e uma pontuação de similaridade.
  • Valores numéricos, para modelos de série temporal e modelos de regressão.
  • Um valor de probabilidade, que indica a probabilidade de uma nova entrada pertencer a alguma categoria existente.
  • O nome de uma categoria ou cluster para o qual um novo item é mais semelhante.
  • Uma classe ou resultado previsto para modelos de classificação.

Observação

Você também pode ter ouvido a Pontuação de palavras usada para significar um peso ou valor atribuído como resultado da análise de dados. No entanto, em Machine Learning Studio (clássico), a pontuação geralmente denota o processo de geração de valores previstos a partir de novos dados.

Ao adicionar um desses módulos em seu experimento, você deve anexar um modelo de aprendizado de máquina já treinado e alguns dados novos. Quando você executa o experimento ou o módulo selecionado, o módulo de Pontuação ingeri os novos dados, computa pontuações com base no modelo e retorna as pontuações em uma tabela.

Dados usados para Pontuação

Os novos dados que você fornece como entrada geralmente precisam ter as mesmas colunas que foram usadas para treinar o modelo, menos o rótulo ou a coluna de resultado.

As colunas que são usadas exclusivamente como identificadores geralmente são excluídas ao treinar um modelo e, portanto, devem ser excluídas também na pontuação. No entanto, identificadores como chaves primárias podem ser facilmente recombinados com o conjunto de linhas de pontuação mais tarde, usando o módulo adicionar colunas . Esse módulo funciona sem a necessidade de especificar uma chave de junção, desde que o tamanho do conjunto de caracteres não tenha sido alterado.

Antes de executar a pontuação no conjunto de seus conjuntos de seus, sempre verifique se há valores ausentes e nulos. Quando os dados usados como entrada para Pontuação têm valores ausentes, os valores ausentes são usados como entradas. Como os nulos são propagados, o resultado geralmente é um valor ausente.

Lista de módulos de Pontuação

Machine Learning Studio (clássico) fornece muitos módulos de Pontuação diferentes. Você seleciona um dependendo do tipo de modelo que está usando ou do tipo de tarefa de pontuação que está executando:

  • Aplicar transformação: aplica uma transformação de dados bem especificada a um DataSet.

    Use este módulo para aplicar um processo salvo a um conjunto de dados.

  • Atribuir dados a clusters: atribui dados a clusters usando um modelo de clustering treinado existente.

    Use este módulo se desejar agrupar novos dados com base em um modelo de clustering K-means existente.

    Esse módulo substitui o módulo atribuir a clusters (preterido), que foi preterido, mas ainda está disponível para uso em experimentos existentes.

  • Classificar recomendador Matchbox: pontuações de Pontuação para um conjunto de um DataSet usando o recomendador Matchbox.

    Use este módulo se você quiser gerar recomendações, localizar itens ou usuários relacionados ou prever classificações.

  • Modelo de Pontuação: Previsões de Pontuação para um modelo de classificação ou regressão treinado.

    Use este módulo para todos os outros modelos de regressão e classificação, bem como alguns modelos de detecção de anomalias.

Exemplos

Esses exemplos no Galeria de ia do Azure demonstram o processo de pontuação, dos cenários básico a avançado:

Os artigos a seguir fornecem exemplos do mundo real de como você pode usar um modelo de aprendizado de máquina para Pontuação:

Consulte também