Máquina de Vetor de Suporte de Duas Classes: referência de Componente

Este artigo descreve o componente no Azure Machine Learning Designer.

Use este componente para criar um modelo baseado no algoritmo da máquina de vetor de suporte.

As máquinas de vetor de suporte (SVMs) são uma classe amplamente pesquisada de métodos de aprendizado supervisionado. Essa implementação específica é adequada à previsão de dois resultados possíveis, com base em variáveis contínuas ou categóricas.

Depois de definir os parâmetros do modelo, treine o modelo usando os componentes de treinamento e fornecendo um conjunto de dados marcado que inclua um rótulo ou uma coluna de resultado.

Sobre as máquinas de vetor de suporte

O suporte às máquinas de vetor estão entre os mais recentes dos algoritmos de aprendizado da máquina e modelos SVM e tem sido usado em muitos aplicativos, da recuperação de informações até a classificação de texto e imagem. As SVMs podem ser usadas para tarefas de classificação e de regressão.

Essa SVM é um modelo de aprendizado supervisionado que requer dados rotulados. No processo de treinamento, o algoritmo analisa os dados de entrada e reconhece padrões em um espaço de recursos multidimensionais chamado de hiperplano. Todos os exemplos de entrada são representados como pontos neste espaço e são mapeados em categorias de saída, de modo que as categorias sejam divididas pela maior e mais limpa lacuna possível.

Para fazer previsões, o algoritmo da SVM atribui novos exemplos em uma categoria ou em outra, mapeando-os nesse mesmo espaço.

Como configurar

Para este tipo de modelo, é recomendável que você normalize o conjunto de dados antes de usá-lo para treinamento do classificador.

  1. Adicione o componente Máquina de Vetor de Suporte de Duas Classes ao seu pipeline.

  2. Especifique de que modo você quer que o modelo seja treinado ao definir a opção Criar modo de treinador.

    • Parâmetro Único: se você sabe como deseja configurar o modelo, é possível fornecer um conjunto específico de valores como argumentos.

    • Intervalo de Parâmetros: caso não tenha certeza de quais são os melhores parâmetros, você pode encontrar os parâmetros ideais usando o componente Ajustar Hiperparâmetros do Modelo. Você fornece algum intervalo de valores, e o instrutor itera em várias combinações de configurações para determinar a combinação de valores que produz o melhor resultado.

  3. Para número de iterações, digite um número que denota o número de iterações usadas durante a criação do modelo.

    Este parâmetro pode ser usado para controlar o compromisso entre a precisão e a velocidade de treinamento.

  4. Para Lambda, digite um valor para usar como peso na regularização L1.

    Esse coeficiente de regularização pode ser usado para ajustar o modelo. Valores maiores penalizam modelos mais complexos.

  5. Selecione a opção Normalizar recursos se deseja normalizar os recursos antes do treinamento.

    Caso aplique a normalização, antes do treinamento, os pontos de dados são centralizados na média e escalados para conter uma unidade de desvio padrão.

  6. Selecione a opção Projetar para a esfera de unidade para normalizar os coeficientes.

    A projeção de valores para o espaço da unidade significa que, antes do treinamento, os pontos de dados são centralizados em zero e escalados para conter uma unidade de desvio padrão.

  7. Em Seed numérico aleatório, insira um valor inteiro se deseja garantir a reprodutibilidade nas execução. Caso contrário, um valor de relógio do sistema é usado como um seed, o que pode resultar em resultados ligeiramente distintos nas execuções.

  8. Conecte um conjunto de dados rotulado e treine o modelo:

    • Se você definir Criar modo treinador como Parâmetro Único, conecte um conjunto de dados marcado e o componente Treinar Modelo.

    • Se definir Criar modo de aprendizagem como Intervalo de parâmetros, conecte um conjunto de dados marcado e treine o modelo usando Ajustar hiperparâmetros do modelo.

    Observação

    Se você passar um intervalo de parâmetros para Treinar modelo, ele usará apenas o valor padrão na lista de parâmetros únicos.

    Se você passar apenas um conjunto de valores de parâmetro para o componente Ajustar Hiperparâmetros do Modelo, quando ele espera receber um intervalo de configurações para cada parâmetro, ele ignorará os valores e usará os valores padrão para o aprendiz.

    Se escolher a opção Intervalo de Parâmetros e inserir um único valor para um parâmetro, esse valor único especificado será usado em toda a varredura, mesmo que outros parâmetros sejam alterados em um intervalo de valores.

  9. Enviar o pipeline.

Resultados

Após a conclusão do treinamento:

  • Para salvar um instantâneo do modelo treinado, escolha a guia Saídas no painel direito do componente Treinar modelo. Escolha o ícone Registrar conjunto de dados para salvá-lo como um componente reutilizável.

  • Para usar o modelo para pontuação, adicione o componente Pontuação de Modelo a um pipeline.

Próximas etapas

Confira o conjunto de componentes disponíveis no Azure Machine Learning.