Machine Learning - Pontuação

Esta secção lista os módulos fornecidos no Azure Machine Learning Studio (clássico) para pontuação.

Nota

Aplica-se a: Machine Learning Studio (clássico)

Este conteúdo diz respeito apenas ao Studio (clássico). Módulos semelhantes de arrasto e queda foram adicionados ao designer de Aprendizagem automática Azure. Saiba mais neste artigo comparando as duas versões.

A pontuação também é chamada de previsão, e é o processo de geração de valores baseados num modelo de aprendizagem de máquinas treinado, dado alguns novos dados de entrada. Os valores ou pontuações que são criados podem representar previsões de valores futuros, mas também podem representar uma categoria ou resultado provável. O significado da pontuação depende do tipo de dados que fornece e do tipo de modelo que criou.

Criar e utilizar modelos no Machine Learning Studio (clássico)

O fluxo de trabalho típico para machine learning inclui estas fases:

  • Escolher um algoritmo adequado e definir opções iniciais.
  • Treinar o modelo em dados compatíveis.
  • Criar previsões usando novos dados, com base nos padrões do modelo.
  • Avaliando o modelo para determinar se as previsões são precisas, quanto erro existe e se há alguma sobremontagem.

O Machine Learning Studio (clássico) suporta uma estrutura flexível e personalizável para a aprendizagem automática. Cada tarefa neste processo é realizada por um tipo específico de módulo, que pode ser modificado, adicionado ou removido, sem quebrar o resto da sua experiência.

Os módulos desta secção incluem ferramentas para pontuação. Nesta fase de machine learning, aplica-se um modelo treinado a novos dados, para gerar previsões. Pode enviar essas previsões para uma aplicação que consome resultados de machine learning ou usar os resultados da pontuação para avaliar a precisão e utilidade do modelo.

Mais sobre pontuação

A pontuação é amplamente utilizada na aprendizagem automática para significar o processo de geração de novos valores, dado um modelo e alguma nova entrada. O termo genérico "pontuação" é usado, em vez de "previsão", porque o processo de pontuação pode gerar tantos tipos diferentes de valores:

  • Uma lista de itens recomendados e uma pontuação de semelhança.
  • Valores numéricos, para modelos de séries temporais e modelos de regressão.
  • Um valor de probabilidade, indicando a probabilidade de uma nova entrada pertencer a alguma categoria existente.
  • O nome de uma categoria ou cluster ao qual um novo item é mais semelhante.
  • Uma classe ou resultado previsto, para modelos de classificação.

Nota

Também pode ter ouvido a pontuação de palavra usada para significar um peso ou valor atribuído como resultado da análise de dados. No entanto, no Machine Learning Studio (clássico), a pontuação geralmente denota o processo de geração de valores previstos a partir de novos dados.

Ao adicionar um destes módulos na sua experiência, deve anexar um modelo de aprendizagem automática já treinado e alguns novos dados. Quando executam a experiência ou o módulo selecionado, o módulo de pontuação ingere os novos dados, calcula as pontuações com base no modelo e devolve as pontuações numa tabela.

Dados utilizados para a pontuação

Os novos dados que fornece como entrada geralmente precisam de ter as mesmas colunas que foram usadas para treinar o modelo, menos a etiqueta ou coluna de resultados.

As colunas que são utilizadas exclusivamente como identificadores são geralmente excluídas quando treinam um modelo, pelo que devem ser excluídas na pontuação também. No entanto, identificadores como as teclas primárias podem ser facilmente combinados com o conjunto de dados de pontuação mais tarde, utilizando o módulo Add Columns. Este módulo funciona sem ter de especificar uma chave de união, desde que o tamanho do conjunto de dados não tenha mudado.

Antes de efetuar a pontuação no seu conjunto de dados, verifique sempre se há valores e nulos em falta. Quando os dados utilizados como entrada para a pontuação têm valores em falta, os valores em falta são utilizados como entradas. Como os nulos são propagados, o resultado é geralmente um valor em falta.

Lista de módulos de pontuação

O Machine Learning Studio (clássico) fornece muitos módulos de pontuação diferentes. Selecione um dependendo do tipo de modelo que está a usar ou do tipo de tarefa de pontuação que está a realizar:

  • Apply Transformation: Aplica uma transformação de dados bem especificada a um conjunto de dados.

    Utilize este módulo para aplicar um processo guardado num conjunto de dados.

  • Atribuir Dados a Clusters: Atribui dados a clusters utilizando um modelo de agrupamento treinado existente.

    Utilize este módulo se pretender agrupar novos dados com base num modelo de agrupamento K-Means existente.

    Este módulo substitui o módulo Atribua a Clusters (precotado), que foi depreciado mas ainda está disponível para utilização em experiências existentes.

  • Pontuar Matchbox Recomendador: Previsões de pontuação para um conjunto de dados utilizando o recomendador Matchbox.

    Utilize este módulo se pretender gerar recomendações, encontrar itens ou utilizadores relacionados ou prever classificações.

  • Modelo de pontuação: Previsões de pontuação para um modelo de classificação ou regressão treinado.

    Utilize este módulo para todos os outros modelos de regressão e classificação, bem como alguns modelos de deteção de anomalias.

Exemplos

Estes exemplos na Galeria Azure AI demonstram o processo de pontuação, desde cenários básicos a avançados:

Os seguintes artigos fornecem exemplos do mundo real de como pode usar um modelo de aprendizagem automática para pontuar:

Ver também