Tutorial DMX Comprador de bicicleta

Nesse tutorial, você aprenderá a criar, treinar e explorar modelos de mineração de dados, utilizando a linguagem de consulta DMX (Extensões de Mineração de Dados). Você então utilizará esses modelos de mineração de dados para criar previsões que determinem se um cliente comprará uma bicicleta.

Os modelos de mineração serão criados a partir dos dados contidos no banco de dados de amostra AdventureWorksDW, que armazena dados para a empresa fictícia Adventure Works Cycles. Adventure Works Cycles é uma grande empresa multinacional de manufatura. A empresa fabrica e vende bicicletas de metal e compostas para os mercados norte-americano, europeu e asiático. Sua central de operações está situada em Bothell, Washington, com 290 funcionários, e possui várias equipes regionais de vendas distribuídas por toda a sua base de mercado internacional. Para obter mais informações sobre o banco de dados de amostra AdventureWorksDW, consulte Data Warehouse de exemplo AdventureWorks.

Cenário do tutorial

A Adventure Works Cycles decidiu estender sua análise de dados criando um aplicativo personalizado que usa a funcionalidade de mineração de dados. Sua meta para o aplicativo personalizado é ser capaz de:

  • Usar como entrada as características específicas sobre um cliente potencial e prever se eles comprarão uma bicicleta.

  • Usar como entrada uma lista de cliente potenciais, assim como características sobre clientes e prever quais comprarão uma bicicleta.

No primeiro caso, os dados de cliente são fornecidos por uma página de registro de cliente e, no segundo caso, uma lista de clientes potenciais é fornecida pelo departamento de marketing da Adventure Works Cycles.

Além disso, o departamento de marketing solicitou a capacidade de agrupar clientes existentes em categorias com base em características como onde eles vivem, o número de filhos que possuem e a distância do trabalho. Eles querem consultar se esses agrupamentos podem ser usados para ajudar a estabelecer como meta tipos específicos de clientes. Isso irá requerer um modelo de mineração adicional.

MicrosoftSQL Server O Analysis Services fornece várias ferramentas que podem ser usadas para executar essas tarefas:

DMX (Extensões de Mineração de Dados) é uma linguagem de consulta fornecida por Analysis Services que pode ser usada para criar e trabalhar com modelos de mineração. O algoritmo Árvores de Decisão da Microsoft cria modelos que podem ser usados para prever se alguém comprará uma bicicleta. O modelo resultante pode usar cliente individual ou uma tabela de clientes como uma entrada. O algoritmo Microsoft Clustering pode criar agrupamentos de clientes com base em características compartilhadas. O objetivo deste tutorial é fornecer os scripts DMX que serão usados no aplicativo personalizado.

Para obter mais informações:Projetos de mineração de dados (Analysis Services – Mineração de Dados)

Estrutura de mineração e modelos de mineração

Antes de começar a criar instruções DMX, é importante compreender os objetos principais que o Analysis Services usa para criar modelos de mineração. A estrutura de mineração é uma estrutura de dados que define o domínio de dados do qual modelos de mineração são criados. Uma única estrutura de mineração pode conter vários modelos de mineração que compartilham o mesmo domínio. Um modelo de mineração aplica um algoritmo de modelo de mineração aos dados que são representados por uma estrutura de mineração.

Os blocos de construção da estrutura de mineração são as colunas da estrutura de mineração, que descrevem os dados que a fonte de dados contém. Essas colunas contêm informações como tipo de dados, tipo de conteúdo e como os dados são distribuídos.

Os modelos de mineração devem conter a coluna chave descrita na estrutura de mineração, bem como um subconjunto das colunas restantes. O modelo de mineração define o uso para cada coluna e define o algoritmo que é utilizado para criar o modelo de mineração. Por exemplo, em DMX você pode especificar que uma coluna é uma coluna Chave ou uma coluna PREDICT. Se uma coluna não for especificada, será assumido que é uma coluna de entrada.

Em DMX, há dois modos para criar modelos de mineração. Você pode criar a estrutura de mineração e o modelo de mineração associado juntos utilizando a instrução CREATE MINING MODEL, ou pode criar primeiro uma estrutura de mineração utilizando a instrução CREATE MINING STRUCTURE e, em seguida, adicionar um modelo de mineração à estrutura utilizando a instrução ALTER STRUCTURE. Esses métodos são descritos na tabela a seguir.

  • CREATE MINING MODEL
    Use essa instrução para criar juntos uma estrutura de mineração e modelo de mineração associado usando o mesmo nome. O nome de modelo de mineração é acrescentado com "Structure" para diferenciá-lo da estrutura de mineração. Essa instrução será útil se você estiver criando uma estrutura de mineração que contenha um único modelo de mineração.

    Para obter mais informações, consulte CRIAR UM MODELO DE MINERAÇÃO (DMX).

  • ALTER MINING STRUCTURE
    Use essa instrução para acrescentar um modelo de mineração a uma estrutura de mineração que já existe no servidor. Essa instrução será útil se você quiser criar uma estrutura de mineração que contenha vários modelos de mineração diferentes. Há várias razões pelas quais você pode desejar adicionar mais de um modelo de mineração em uma única estrutura de mineração. Por exemplo, é possível criar vários modelos de mineração que usam algoritmos diferentes para verificar qual algoritmo funciona melhor. Você pode criar vários modelos de mineração que usam o mesmo algoritmo, mas com um parâmetro definido de modo diferente para cada modelo de mineração a fim de encontrar a melhor definição para o parâmetro.

    Para obter mais informações, consulte ALTER MINING STRUCTURE (DMX).

Como criará uma estrutura que contém vários modelos de mineração, você utilizará o método secundário neste tutorial.

Para obter mais informações

Referência DMX (Data Mining Extensions), Compreendendo a instrução Select (DMX), Consultas de previsão (DMX)

O que você aprenderá

Este tutorial se divide nas lições a seguir:

Requisitos

Antes de executar este tutorial, verifique se os seguintes itens estão instalados:

  • MicrosoftSQL Server

  • MicrosoftSQL Server 2005 Analysis Services (SSAS) ou SQL Server 2008 Analysis Services (SSAS)

  • O banco de dados AdventureWorks incluído no SQL Server. Por padrão, e para reforçar a segurança, os bancos de dados de exemplo não são instalados. Para instalar um banco de dados de exemplo no MicrosoftSQL Server, visite a página Banco de dados de exemplo Microsoft SQL e selecione os bancos de dados que deseja instalar. Para obter mais informações sobre como instalar o banco de dados de exemplo, consulte Instalação inicial (Analysis Services).

ObservaçãoObservação

Ao examinar os tutoriais, recomendamos que você adicione os botões Próximo Tópico e Tópico Anterior à barra de ferramentas do visualizador de documentos. Para obter mais informações, consulte Adicionando os botões Próximo e Anterior à Ajuda.