Adicionando um modelo de previsão agregado (Tutorial de mineração de dados intermediário)

Você viu na exploração do modelo de previsão que embora as vendas na maioria das regiões siga um padrão, algumas regiões e alguns modelos, como o M200 na região do Pacífico, exibem tendências muito diferentes. As diferenças entre as regiões são comuns e podem ser causadas por muitos fatores, incluindo promoções de marketing, geração de relatórios imprecisos ou eventos geopolíticos.

Para minimizar o efeito desses fatores sobre as projeções, você decide criar um modelo de mineração generalizado baseado em medidas agregadas de vendas mundiais. Assim, você poderá fazer previsões com esse modelo e aplicá-las a regiões individuais. Por fim, você vai comparar as previsões criadas pelos diversos produtos.

Criando os dados para o modelo geral

A primeira etapa na criação do modelo generalizado é agregar os dados de vendas mundiais. Isso é feito pela criação de uma exibição da fonte de dados especial, que usa uma fonte de dados existente mas que executa cálculos como somas ou médias.

Para criar uma exibição da fonte de dados usando uma consulta ou um cálculo personalizado.

  1. No Gerenciador de Soluções, clique com o botão direito do mouse em Exibições da Fonte de Dados e selecione Nova Exibição da Fonte de Dados.

  2. Na página de boas-vindas do assistente, clique em Avançar.

  3. Na página Selecionar Fonte de Dados, selecione Adventure Works DW2008 e clique em Avançar.

  4. Na página Selecionar Tabelas e Exibições, clique em Avançar.

  5. Na página Concluindo o Assistente, digite o nome AllRegions e clique em Concluir.

  6. Em seguida, clique com o botão direito do mouse na superfície de design da exibição da fonte de dados em branco e selecione Nova Consulta Nomeada.

  7. Na caixa de diálogo Criar Consulta Nomeada, em Nome, digite AllRegions e em Descrição, digite Soma e média de vendas para todos os modelos e regiões.

  8. No painel de texto SQL, digite a instrução a seguir:

    SELECT ReportingDate, 
    SUM([Quantity]) as SumQty, AVG([Quantity]) as AvgQty,
    SUM([Amount]) AS SumAmt, AVG([Amount]) AS AvgAmt,
    'All Regions' as [Region]
    FROM dbo.vTimeSeries 
    GROUP BY ReportingDate
    
  9. Clique em OK.

  10. Clique com o botão direito do mouse na tabela AllRegions e selecione Explorar Dados.

    A nova exibição da fonte de dados contém uma soma e uma média de vendas mundiais de todos os produtos. Você também poderia agrupar e agregar vendas por modelo, mas para fins deste tutorial, criará um único modelo de série temporal que poderá ser usado para previsão com qualquer combinação de região ou produto.

Depois de ter criado a nova exibição dos dados, crie uma nova estrutura de mineração e um modelo de mineração baseado nessa estrutura. Agora você já deve saber como criar uma estrutura de mineração. Dessa forma, as instruções a seguir foram simplificadas.

Para criar uma estrutura de mineração e um modelo de mineração usando os dados agregados

  1. No Gerenciador de Soluções, clique com o botão direito do mouse em Estruturas de Mineração e selecione Nova Estrutura de Mineração para iniciar o Assistente de Mineração de Dados.

  2. No Assistente de Mineração de Dados, faça as seguintes seleções:

    • Algoritmo: Microsoft Time Series

    • Exibição da fonte de dados: AllRegions

    • Chave: ReportingDate (Key Time) e Region (Key)

    • Input e Predict: AvgAmt, AvgQty, SumAmt, SumQty,

    • Nome da estrutura de mineração: All Regions

    • Nome do modelo de mineração: All Regions

  3. Processar a estrutura e o modelo.

Exibindo os resultados

Antes de decidir que modelo aplicar como o modelo geral para fazer projeções mundiais, você deve compreender melhor as previsões. Quando você examina os modelos e previsões de mineração para as várias séries agregadas no Visualizador do MTS, diversas perguntas vêm à tona:

  • Até junho de 2002, cada uma das linhas de tendência segue praticamente o mesmo padrão. Nesse ponto, as linhas de quantidade e de valor divergem. O que causou a mudança?

  • Em julho de 2004, as linhas divergem novamente. O que aconteceu?

  • Lembre-se de que as previsões para a série M200 América do Norte eram muito maiores do que para outros produtos e regiões. Você está preocupado, achando que essas projeções podem estar incorretas e que a incorporação dessa série pode afetar o modelo geral que criou.

Na próxima tarefa, você irá comparar as linhas de tendência e as previsões de modelos de séries individuais com o modelo baseado em dados agregados, para ver como os dados subjacentes afetam o modelo.

Se estiver satisfeito com o modelo e não precisar compreender melhor os resultados, pule para a tarefa Prevendo com o modelo de previsão médio (Tutorial de mineração de dados intermediário).