Personalizando e processando o modelo de previsão (Tutorial de mineração de dados intermediário)

O algoritmo Microsoft Time Series oferece vários parâmetros que afetam o modo como um modelo é criado e como os dados de tempo são analisados. Você pode alterar essas propriedades para controlar a forma como o modelo de mineração faz previsões.

Para esta tarefa do tutorial, você fará a seguinte alteração nos parâmetros:

  • Você ajustará o valor do parâmetro PERIODICITY_HINT para o modelo Previsão. Esse parâmetro fornece informações do algoritmo sobre a freqüência de repetição do padrão nos dados. Os dados do AdventureWorks DW2008 seguem o padrão mensal, com periodicidade anual. Portanto, você definirá o parâmetro PERIODICITY_HINT como 12 para indicar que um padrão se repete a cada 12 valores.

Você também revisará as configurações de dois parâmetros importantes introduzidos no SQL Server 2008 como parte dos aprimoramentos feitos no algoritmo MTS.

  • O parâmetro FORECAST_METHOD controla se o algoritmo de série temporal está otimizado para previsões a curto ou a longo prazo. Por padrão, o parâmetro FORECAST_METHOD é definido como MIXED, o que significa que dois algoritmos de previsão diferentes são combinados e equilibrados para a execução de previsões a curto e a longo prazo.

  • O parâmetro PREDICTION_SMOOTHING controla a mistura de previsões de longo e curto prazo. Por padrão, esse parâmetro é definido como 0,5, o que geralmente oferece o melhor equilíbrio para a precisão geral.

Depois de fazer as alterações, você processará o modelo.

Para alterar parâmetros do algoritmo

  1. Na guia Modelos de Mineração, clique com o botão direito do mouse em Previsão e selecione Definir Parâmetros do Algoritmo.

  2. Na linha PERIODICITY_HINT da caixa de diálogo Parâmetros de Algoritmo, clique na coluna Valor e digite {12}, incluindo as chaves.

  3. Na linha FORECAST_METHOD, verifique se a caixa de texto Valor está em branco ou se foi definida como MIXED. Caso tenha sido inserido um valor diferente, digite MIXED para retornar o parâmetro ao valor padrão.

  4. Na linha PREDICTION_SMOOTHING, verifique se a caixa de texto Valor está em branco ou se foi definida como 0,5. Caso tenha sido inserido um valor diferente, clique em Valor e digite 0,5 para retornar o parâmetro ao valor padrão.

    ObservaçãoObservação

    O parâmetro PREDICTION_SMOOTHING só está disponível no SQL Server Enterprise. Dessa forma, não é possível exibir ou alterar o valor do parâmetro PREDICTION_SMOOTHING no SQL Server Standard. Entretanto, o comportamento padrão é o mesmo.

  5. Clique em OK.

Para processar o modelo de previsão

  1. No menu Modelo de Mineração do BI Development Studio, selecione Estrutura de Mineração do Processo e Todos os Modelos.

  2. No aviso que pergunta se você deseja construir e implantar o projeto, clique em Sim.

  3. Na caixa de diálogo Processar Estrutura de Mineração - Previsão, clique em Executar.

    A caixa de diálogo Andamento do Processo é aberta para exibir informações sobre o processamento do modelo. O processamento do modelo pode demorar algum tempo.

  4. Depois que o processamento estiver completo, clique em Fechar para sair da caixa de diálogo Progresso do Processo.

  5. Clique em Fechar novamente para sair da caixa de diálogo Processar Estrutura de Mineração.

Manipulando dados ausentes (opcional)

Na maioria dos casos, seus dados de venda poderão ter lacunas preenchidas por nulos, ou uma loja pode não ter conseguido cumprir o prazo da emissão de relatórios, deixando uma célula vazia no final da série. Nesses cenários, o Analysis Services gera o erro a seguir e não processa o modelo.

"Erro (Mineração de dados): Carimbos de horas não sincronizados, começando com a série <nome da série> do modelo de mineração <nome do modelo>. Todas as séries temporais devem terminar na mesma marca de tempo e não podem ter pontos de dados ausentes arbitrariamente. A definição do parâmetro MISSING_VALUE_SUBSTITUTION como Previous ou como uma constante numérica corrigirá automaticamente pontos de dados ausentes, onde possível."

Para impedir esse erro, você pode especificar que o Analysis Services forneça automaticamente novos valores para preencher as lacunas usando os métodos a seguir:

  • Usando um valor médio. Essa média é calculada usando todos os valores válidos da mesma série de dados.

  • Usando o valor anterior. Você pode substituir valores anteriores por várias células ausentes, mas não pode preencher os valores iniciais.

  • Usando um valor constante fornecido por você.

Para especificar que as lacunas sejam preenchidas por valores médios

  1. Na guia Modelos de Mineração, clique com o botão direito do mouse na coluna Previsão e selecione Definir Parâmetros do Algoritmo.

  2. Na caixa de diálogo Parâmetros de Algoritmo, na linha MISSING_VALUE_SUBSTITUTION, clique na coluna Valor e digite Médio.