Regressão ordinal

Importante

O suporte para o Machine Learning Studio (clássico) terminará em 31 de agosto de 2024. É recomendável fazer a transição para o Azure Machine Learning até essa data.

A partir de 1º de dezembro de 2021, você não poderá criar recursos do Machine Learning Studio (clássico). Até 31 de agosto de 2024, você pode continuar usando os recursos existentes do Machine Learning Studio (clássico).

A documentação do ML Studio (clássico) está sendo desativada e pode não ser atualizada no futuro.

Cria um modelo de regressão ordinal

categoria: Machine Learning/inicializar modelo/regressão

Observação

aplica-se a: somente Machine Learning Studio (clássico)

Módulos semelhantes do tipo "arrastar e soltar" estão disponíveis no designer do Azure Machine Learning.

Visão geral do módulo

este artigo descreve como usar o módulo de regressão Ordinal no Machine Learning Studio (clássico) para criar um modelo de regressão que pode ser usado para prever valores classificados.

Alguns exemplos de valores classificados:

  • Respostas de pesquisa que capturam marcas preferenciais do usuário em uma escala de 1 a 5
  • A ordem dos terminadores em uma corrida
  • URLs em resultados de pesquisa classificados

Mais sobre a regressão ordinal

A regressão ordinal é usada quando o rótulo ou a coluna de destino contém números, mas os números representam uma classificação ou ordem em vez de uma medida numérica.

A previsão de números ordinais exige um algoritmo diferente do que prever os valores de números em uma escala contínua, pois os números atribuídos para representar a ordem de classificação não têm escala intrínseca.

Por exemplo, para prever as pontuações de teste dos alunos, você usaria um modelo de regressão padrão, pois as pontuações de teste dos alunos variam em uma escala contínua e podem ser medidos. No entanto, para prever sua classificação de classe, você deve usar um modelo de regressão ordinal.

Para obter mais informações sobre a pesquisa por trás desse algoritmo, consulte este documento (PDF para download): https://papers.nips.cc/paper/3125-ordinal-regression-by-extended-binary-classification.pdf

Como configurar a regressão ordinal

Esse módulo resolve um problema de classificação como uma série de problemas de classificação relacionados. Portanto, o algoritmo cria uma série de exemplos de treinamento estendidos usando um modelo binário para cada classificação e treina em relação a esse conjunto estendido. Essa operação pode ser computacionalmente dispendiosa.

  1. Adicione o módulo modelo de regressão ordinal ao seu experimento no estúdio (clássico). você pode encontrar esse módulo em Machine Learning-Initialize, na categoria regressão .

  2. Adicione um módulo que ofereça suporte à classificação binária e configure o modelo. Há vários módulos de duas classes na categoria classificação .

  3. Conexão o modelo de classificação binária como uma entrada para o módulo do modelo de regressão Ordinal .

  4. Parâmetros adicionais não são necessários no modelo de regressão ordinal; o algoritmo foi pré-configurado com os parâmetros mais eficientes para resolver um problema de classificação.

  5. Conexão um conjunto de módulos de treinamento e o módulo treinar modelo .

  6. No módulo modelo de treinamento , selecione a coluna que contém os valores de classificação.

    Os valores de classificação devem ser valores numéricos, mas eles não precisam ser números inteiros ou positivos, desde que representem uma sequência.

    Para fins de processamento, supõe-se que as classificações tenham a ordem de 1 a K, em que 1 é a classificação mais baixa e K é a classificação mais alta. No entanto, o módulo modelo de treinamento pode funcionar mesmo se a semântica de sua escala for revertida.

    Por exemplo, se em sua pesquisa original, 1 for a pontuação mais alta e 5 for a mais baixa, isso não afetará o processamento do modelo.

  7. Execute o experimento.

Resultados

Após a conclusão do treinamento:

  • Para fazer previsões, conecte o modelo treinado, junto com os novos dados, ao módulo modelo de Pontuação .

  • Para executar a validação cruzada em relação a um conjunto de dados rotulado, conecte o modelo não treinado ao modelo de validação cruzada.

Exemplos

Para obter exemplos de como a regressão ordinal é usada no aprendizado de máquina, consulte a Galeria de ia do Azure.

  • Manutenção preditiva – etapa C: neste exemplo, a regressão ordinal é usada para classificar valores de saída por um modelo de classificação, na pressuposição de que o valor reflete a severidade da classificação de falha.

Observações técnicas

O algoritmo de regressão ordinal usado neste aprendiz é implementado pela classificação binária estendida, conforme descrito pelo artigo chamado Ordinal Regression by Extended Binary Classification, de Ling Li e Hsuan-Tien Lin, no NIPS 2006.

Restrições em dados de entrada

Você pode usar qualquer coluna numérica como o destino de um modelo de regressão ordinal, mas na prática, você deve usar apenas dados que representem algum tipo de ordem ou classificação.

Os intervalos entre as classificações são considerados desconhecidos e o tamanho do intervalo não importa para o modelo; no entanto, o modelo pressupõe que a sequência de classificações segue a ordem natural dos números.

O próprio modelo não atribui qualquer significado a uma escala específica. Em outras palavras, você pode criar um modelo no qual 1 é uma boa classificação e 10 é o pior e, em outro modelo, pressupõe que 10 é a classificação desejada e 1 é o pior.

Algoritmo de classificação

O conjunto de treinamento (X, Y) consiste em vetores de entrada X e rótulos Y. Os rótulos representam as classificações que variam de 1 a k na sequência: 1, 2,... , K. Presume-se que as classificações sejam ordenadas de modo que 1 seja a menor ou a pior classificação, e K seja a melhor ou mais alta classificação.

O crux do algoritmo está em modificar os recursos de entrada X e rótulos Y para usar exemplos estendidos e, em seguida, usar um classificador binário para resolver o problema de regressão ordinal. O classificador binário é treinado para dar uma resposta Sim/não para a pergunta "é a classificação maior que r?"

Por exemplo, para cada caso no conjunto de treinamento, há exemplos estendidos de k-1 e a classificação máxima observada é k. Os recursos estendidos são formados acrescentando-sea linha i de uma matriz de identidade k-1 x k-1 aos recursos de entrada de todos. Os rótulos são fornecidos + 1 para as primeiras linhas r-1 se sua classificação for r e-1 para o restante.

Cálculos de exemplo

Para ilustrar como funciona, deixe que x1 seja o recurso de treinamento cuja classificação é 3, em que a classificação máxima observada é 5. Os exemplos estendidos correspondentes a esse recurso são os seguintes:

Caixa Teste Rótulo resultante
X11000 A classificação é maior que 1? Ok Portanto, + 1
X10100 A classificação é maior que 2? Ok Portanto, + 1
X10010 A classificação é maior que 3? Foi Portanto, nenhum recurso adicional
X10001 A classificação é maior que 4? Foi Portanto, nenhum recurso adicional

Entradas esperadas

Nome Tipo Descrição
Modelo de classificação binária não treinado Interface ILearner Um modelo de classificação binária não treinado

Saídas

Nome Tipo Descrição
Modelo não treinado Interface ILearner Um modelo de regressão ordinal não treinado

Confira também

Regressão