Regressão de Poisson
Este artigo descreve um componente no estruturador do Azure Machine Learning.
Utilize este componente para criar um modelo de regressão Poisson num pipeline. A regressão de Poisson destina-se a prever valores numéricos, normalmente conta. Por conseguinte, deve utilizar este componente para criar o modelo de regressão apenas se os valores que está a tentar prever se ajustarem às seguintes condições:
A variável de resposta tem uma distribuição Poisson.
As contagens não podem ser negativas. O método falhará totalmente se tentar utilizá-lo com etiquetas negativas.
Uma distribuição Poisson é uma distribuição discreta; portanto, não é significativo utilizar este método com números não inteiros.
Dica
Se o seu destino não for uma contagem, a regressão de Poisson provavelmente não é um método adequado. Experimente outros componentes de regressão no estruturador.
Depois de configurar o método de regressão, tem de preparar o modelo com um conjunto de dados que contenha exemplos do valor que pretende prever. Em seguida, o modelo preparado pode ser utilizado para fazer predições.
Mais informações sobre a regressão de Poisson
A regressão de Poisson é um tipo especial de análise de regressão que é normalmente utilizada para contagens de modelos. Por exemplo, a regressão de Poisson seria útil nestes cenários:
Modelar o número de constipações associadas a voos de avião
Estimar o número de chamadas do serviço de emergência durante um evento
Projetar o número de inquéritos dos clientes subsequentes a uma promoção
Criar tabelas de contingência
Uma vez que a variável de resposta tem uma distribuição Poisson, o modelo faz suposições diferentes sobre os dados e a sua distribuição de probabilidade do que, digamos, a regressão de menos quadrados. Por conseguinte, os modelos Poisson devem ser interpretados de forma diferente dos outros modelos de regressão.
Como configurar a Regressão de Poisson
Adicione o componente Poisson Regression ao pipeline no estruturador. Pode encontrar este componente em Algoritmos de Machine Learning, na categoria Regressão .
Adicione um conjunto de dados que contenha dados de preparação do tipo correto.
Recomendamos que utilize Normalizar Dados para normalizar o conjunto de dados de entrada antes de o utilizar para preparar o regressor.
No painel direito do componente Poisson Regression , especifique como pretende que o modelo seja preparado ao definir a opção Criar modo de formador .
Parâmetro Único: se souber como pretende configurar o modelo, forneça um conjunto específico de valores como argumentos.
Intervalo de Parâmetros: se não tiver a certeza dos melhores parâmetros, faça uma análise de parâmetros com o componente Otimizar Hiperparâmetros do Modelo . O formador itera vários valores que especificar para encontrar a configuração ideal.
Tolerância de otimização: escreva um valor que defina o intervalo de tolerância durante a otimização. Quanto mais baixo for o valor, mais lento e preciso será o ajuste.
Peso da regularização L1 e peso da regularização L2: escreva os valores a utilizar para regularização L1 e L2. A regularização adiciona restrições ao algoritmo relativamente a aspetos do modelo que são independentes dos dados de preparação. A regularização é geralmente utilizada para evitar o sobreajuste.
A regularização L1 é útil se o objetivo for ter um modelo tão disperso quanto possível.
A regularização L1 é feita ao subtrair o peso L1 do vetor de peso da expressão de perda que o formando está a tentar minimizar. A norma L1 é uma boa aproximação à norma L0, que é o número de coordenadas não zero.
A regularização L2 impede que qualquer coordenada única no vetor de peso cresça demasiado em magnitude. A regularização L2 é útil se o objetivo for ter um modelo com pesos gerais pequenos.
Neste componente, pode aplicar uma combinação de regularizações L1 e L2. Ao combinar a regularização L1 e L2, pode impor uma penalização à magnitude dos valores dos parâmetros. O formando tenta minimizar a penalidade, numa troca com a minimização da perda.
Para uma boa discussão sobre a regularização L1 e L2, veja Regularização L1 e L2 para Machine Learning.
Tamanho da memória para L-BFGS: especifique a quantidade de memória a reservar para ajuste e otimização de modelos.
O L-BFGS é um método específico de otimização, baseado no algoritmo Broyden-Fletcher–Goldfarb-Shanno (BFGS). O método utiliza uma quantidade limitada de memória (L) para calcular a direção do próximo passo.
Ao alterar este parâmetro, pode afetar o número de posições e gradações anteriores armazenadas para computação do próximo passo.
Ligue o conjunto de dados de preparação e o modelo não preparado a um dos componentes de preparação:
Se definir Criar modo de formador como Parâmetro Único, utilize o componente Preparar Modelo .
Se definir Criar modo de formador como Intervalo de Parâmetros, utilize o componente Otimizar Hiperparâmetros do Modelo .
Aviso
Se passar um intervalo de parâmetros para Preparar Modelo, este utiliza apenas o primeiro valor na lista de intervalo de parâmetros.
Se transmitir um único conjunto de valores de parâmetros para o componente Otimizar Hiperparâmetros do Modelo , quando espera um intervalo de definições para cada parâmetro, ignora os valores e utiliza os valores predefinidos para o formando.
Se selecionar a opção Intervalo de Parâmetros e introduzir um único valor para qualquer parâmetro, esse valor único que especificou é utilizado ao longo da pesquisa, mesmo que outros parâmetros sejam alterados num intervalo de valores.
Submeta o pipeline.
Resultados
Após a conclusão da preparação:
- Para guardar um instantâneo do modelo preparado, selecione o componente de preparação e, em seguida, mude para o separador Saídas+registos no painel direito. Clique no ícone Registar conjunto de dados. Pode encontrar o modelo guardado como um componente na árvore de componentes.
Passos seguintes
Veja o conjunto de componentes disponíveis para o Azure Machine Learning.