Árvore de Decisão Aumentada Multiclasse

Este artigo descreve o componente no Azure Machine Learning Designer.

Use este componente para criar um modelo de machine learning baseado no algoritmo de árvores de decisão aumentada.

Uma árvore de decisão aumentada é um método de aprendizado conjunto no qual a segunda árvore corrige os erros da primeira árvore, a terceira árvore corrige os erros da primeira e segunda árvores e assim por diante. As previsões se baseiam no conjunto de árvores reunidas.

Como configurar

Este componente cria um modelo de classificação não treinado. Como a classificação é um método de aprendizado supervisionado, para treinar o modelo, você precisa de um conjuntos de dados rotulados que inclua uma coluna de rótulo com um valor para todas as linhas.

Você pode treinar esse tipo de modelo usando o Modelo de treinamento.

  1. Adicione o componente Árvore de Decisão Aumentada ao seu pipeline.

  2. Especifique como você deseja que o modelo seja treinado definindo a opção Criar modo de aprendizagem.

    • Parâmetro único: se você sabe como deseja configurar o modelo, forneça um conjunto específico de valores como argumentos.

    • Intervalo de parâmetros: selecione essa opção se não tiver certeza dos parâmetros a serem usados e quiser executar uma varredura de parâmetros. Selecione um intervalo de valores para iteração. O Ajustar os Hiperparâmetros do Modelo itera todas as combinações possíveis das configurações fornecidas para determinar os hiperparâmetros que produzem os resultados ideais.

  3. O número máximo de folhas por árvore limita o número máximo de nós de terminal (folhas) que podem ser criados em qualquer árvore.

    Aumentando este valor, você aumenta potencialmente o tamanho da árvore e obtém maior precisão, com o risco de causar sobreajuste e aumentar o tempo de treinamento.

  4. O número mínimo de amostras por nó folha indica o número de casos necessários para criar um nó de terminal (folha) em uma árvore.

    Aumentando esse valor, você aumenta o limite para a criação de novas regras. Por exemplo, com o valor padrão de 1, um único caso pode causar uma nova regra a ser criada. Se você aumentar o valor para 5, os dados de treinamento precisam conter pelo menos cinco casos que atendem as mesmas condições.

  5. A taxa de aprendizagem define o tamanho da etapa durante o aprendizado. Insira um número entre 0 e 1.

    A taxa de aprendizagem determina a velocidade com que o aprendiz converge para a solução ideal. Se o tamanho da etapa for muito grande, você poderá exceder a solução ideal. Se for muito pequeno, o treinamento levará mais tempo para convergir para a melhor solução.

  6. O número de árvores construídas indica o número total de árvores de decisão a serem criadas no conjunto. Criando mais árvores de decisão, você pode potencialmente obter melhor cobertura, mas aumentará o tempo de treinamento.

  7. A semente de número aleatório é uma opção para definir um inteiro não negativo para usar como o valor de semente aleatória. A especificação de uma semente assegura a capacidade de reprodução entre execuções que usam os mesmos dados e parâmetros.

    A semente aleatória é definida por padrão como 42. As execuções sucessivas usando sementes aleatórias diferentes podem causar resultados diferentes.

  8. Treinar o modelo:

    • Se você definir Criar modo treinador como Parâmetro Único, conecte um conjunto de dados marcado e o componente Treinar Modelo.

    • Se definir Criar modo de aprendizagem como Intervalo de parâmetros, conecte um conjunto de dados marcado e treine o modelo usando Ajustar hiperparâmetros do modelo.

    Observação

    Se você passar um intervalo de parâmetros para Treinar modelo, ele usará apenas o valor padrão na lista de parâmetros únicos.

    Se você passar apenas um conjunto de valores de parâmetro para o componente Ajustar Hiperparâmetros do Modelo, quando ele espera receber um intervalo de configurações para cada parâmetro, ele ignorará os valores e usará os valores padrão para o aprendiz.

    Se você selecionar a opção Intervalo de parâmetros e inserir um único valor para qualquer parâmetro, esse valor único especificado será usado em toda a varredura, mesmo que outros parâmetros sejam alterados em um intervalo de valores.

Próximas etapas

Confira o conjunto de componentes disponíveis no Azure Machine Learning.