Perceptron Médio de Duas Classes

Cria um modelo de classificação binária perceptron média

Categoria: Machine Learning/inicializar modelo/classificação

Observação

Aplica-se a: Machine Learning Studio (clássico)

Esse conteúdo pertence apenas ao estúdio (clássico). Módulos de arrastar e soltar semelhantes foram adicionados ao designer de Azure Machine Learning. Saiba mais neste artigo comparando as duas versões.

Visão geral do módulo

Este artigo descreve como usar o módulo perceptron médio de duas classes no Azure Machine Learning Studio (clássico) para criar um modelo de aprendizado de máquina com base no algoritmo de média de perceptron.

Esse algoritmo de classificação é um método de aprendizado supervisionado e requer um conjunto de informações marcado, que inclui uma coluna de rótulo. Você pode treinar o modelo fornecendo o modelo e o conjunto de dados marcado como uma entrada para treinar modelo ou ajustar hiperparâmetros de modelo. O modelo treinado pode então ser usado para prever valores para os novos exemplos de entrada.

Mais sobre os modelos de perceptron médios

O Método Average perceptron é uma versão inicial e muito simples de uma rede neural. Nessa abordagem, as entradas são classificadas em várias saídas possíveis com base em uma função linear e, em seguida, combinadas com um conjunto de pesos que são derivados do vetor de recurso — por isso o nome "perceptron".

Os modelos perceptron mais simples são adequados ao aprendizado de padrões separáveis linearmente, enquanto as redes neurais (especialmente redes neurais profundas) podem modelar limites de classe mais complexos. No entanto, os perceptrons são mais rápidos e conforme eles processem casos em série, podem ser usados com treinamento contínuo.

Como configurar Two-Class médias de perceptron

  1. Adicione o módulo perceptron médio de duas classes ao seu experimento no estúdio (clássico).

  2. Especifique como você deseja que o modelo seja treinado, definindo a opção criar modo de instrutor .

    • Parâmetro único: se você souber como deseja configurar o modelo, forneça um conjunto específico de valores como argumentos.

    • Intervalo de parâmetros: se você não tiver certeza dos melhores parâmetros, localize os parâmetros ideais especificando vários valores e usando o módulo ajustar hiperparâmetros de modelo para localizar a configuração ideal. O instrutor itera em várias combinações das configurações fornecidas e determina a combinação de valores que produz o melhor modelo.

  3. Para taxa de aprendizagem, especifique um valor para a taxa de aprendizado. Os valores da taxa de aprendizado controlam o tamanho da etapa usada na descendente de gradiente estocástico cada vez que o modelo é testado e corrigido.

    Ao tornar a taxa menor, você testa o modelo com mais frequência, com o risco que você pode ficar preso em um limite local. Aumentando a etapa, você pode convergir mais rapidamente, com o risco mínimo de errar o alvo verdadeiro.

  4. Para número máximo de iterações, digite o número de vezes que você deseja que o algoritmo examine os dados de treinamento.

    Parando no início geralmente fornece melhor generalização. Aumentar o número de iterações melhora o ajuste, com o risco de superajuste.

  5. Para semente de número aleatório, opcionalmente, digite um valor inteiro para usar como a semente. Usar uma semente é recomendado se você quiser garantir reprodução do experimento entre execuções.

  6. Selecione a opção permitir níveis categóricos desconhecidos para criar um grupo de valores desconhecidos nos conjuntos de treinamento e validação. O modelo pode ser menos preciso para valores conhecidos, mas pode fornecer previsões melhores para valores novos (desconhecidos).

    Se você desmarcar essa opção, o modelo poderá aceitar somente os valores contidos nos dados de treinamento.

  7. Conecte um conjunto de e um dos módulos de treinamento:

    Observação

    Se você passar um intervalo de parâmetros para treinar o modelo, ele usará apenas o primeiro valor na lista intervalo de parâmetros.

    Se você passar um único conjunto de valores de parâmetro para o módulo ajustar hiperparâmetros de modelo , quando ele esperar um intervalo de configurações para cada parâmetro, ele ignorará os valores e usará os valores padrão para o aprendiz.

    Se você selecionar a opção intervalo de parâmetros e inserir um único valor para qualquer parâmetro, esse valor único especificado será usado em toda a varredura, mesmo que outros parâmetros sejam alterados em um intervalo de valores.

Resultados

Após a conclusão do treinamento:

  • Para ver um resumo dos parâmetros do modelo, junto com os pesos de recursos aprendidos no treinamento, clique com o botão direito do mouse na saída do modelo de treinamento ou ajuste hiperparâmetros de modelo.

Exemplos

Para obter exemplos de como esse algoritmo de aprendizado é usado, consulte o Galeria de ia do Azure:

Observações técnicas

Esta seção contém detalhes de implementação, dicas e respostas para perguntas frequentes.

Dicas de uso

Para este tipo de modelo é uma prática recomendada normalizar os conjuntos de dados antes de usá-los para treinar o classificador. Para opções de normalização, consulte normalizar dados.

O modelo de média perceptron é uma versão inicial e simplificada de redes neurais. Como tal, ele funciona bem em conjuntos de dados simples quando seu objetivo for velocidade acima da precisão. No entanto, se você não estiver obtendo os resultados desejados, tente um destes modelos:

Parâmetros do módulo

Name Intervalo Type Padrão Descrição
Taxa de aprendizado >= double.Épsilon Float 1.0 A taxa de aprendizagem inicial do otimizador Descendente do gradiente estocástico.
Número máximo de iterações >= 1 Integer 10 O número de iterações Descente de gradiente estocástico a serem executadas sobre o conjunto de dados de treinamento.
Propagação de número aleatório Qualquer Integer A propagação para o gerador de número aleatório usado pelo modelo. Deixe em branco para o padrão.
Permitir níveis categóricos desconhecidos Qualquer Booliano verdadeiro Se True, cria um nível adicional para cada coluna categórica. Quaisquer níveis no conjunto de dados teste que não estão disponíveis no conjunto de dados de treinamento são mapeados para este nível adicional.

Saída

Nome Tipo Descrição
Modelo não treinado Interface ILearner Um modelo de classificação binária não treinado que pode ser conectado aos módulos multiclasse um contra todos, treinar modeloou modelo de validação cruzada .

Consulte também

Classificação
Lista de Módulo A-Z