Karar ağaçlar modeli sorgulama (- Analysis Services veri madenciliği)

Bir veri karşı bir sorgu oluşturduğunuzda, araştırma modeli, analizinde keşfedilen desenleri hakkında ayrıntılı bilgi sağlayan içerik bir sorgu oluşturabilir veya yeni veri için Öngörüler yapmak modelinde desenleri kullanır tahmin sorgu oluşturabilirsiniz.Örneğin, her servis talebi sayısı hakkındaki istatistikleri için karar ağaçları modeli içerik sorgu sağlayabilir düzey ağaç veya servis talepleri arasında ayırt kuralları.Alternatif olarak, bir tahmin sorgu önerileri, sınıflandırmaları ve benzeri oluşturmak için yeni veri modeli eşleştirir.Bir sorgu kullanarak modeli hakkında meta veriler de alabilirsiniz.

Bu bölümde dayalı modelleri için sorgular oluşturmak açıklar Microsoft karar ağaçlar algoritması.

İçerik sorguları

Veri madenciliği şeması satır kümesi modeli Parametreler alınıyor

Ağaçlar hakkında ayrıntılar modelde dmx kullanarak alma

Alt ağaçlar modelinden alınıyor

Tahmin sorgular

Öngörüler ile olasılıklar döndürme

Karar ağaçları modeli bu ilişkileri tahmin etmek

Karar ağaçları modeli regresyon formül alınıyor

Karar ağaçları modeli hakkında bilgi bulma

Karar ağaçları modeli içeriği üzerinde anlamlı sorguları oluşturmak için içerik modeli yapısını anlamanız gerekir ve hangi düğüm türü ne tür bilgiler depolar.Daha fazla bilgi için bkz: Karar ağacı modeller için içerik modeli mining (Analysis Services - veri madenciliği).

Örnek sorgu 1: Veri madenciliği şeması satır kümesi modeli Parametreler alınıyor

Veri madenciliği şema satır kümesi sorgulayarak, ne zaman oluşturulduğunu, ne zaman modeli son işlendiği, modelin temel araştırma yapısı adını ve öngörülebilir bir öznitelik olarak kullanılan sütun adı gibi modeli hakkında meta veriler bulabilirsiniz.Model oluşturulduğunda kullanılan parametreleri de döndürebilir.

select MINING_PARAMETERS 
from $system.DMSCHEMA_MINING_MODELS
WHERE MODEL_NAME = 'TM_Decision Tree'

Örnek sonuçlar:

MINING_PARAMETERS

COMPLEXITY_PENALTY = 0,5, MAXIMUM_INPUT_ATTRIBUTES 255 MAXIMUM_OUTPUT_ATTRIBUTES = 255 MINIMUM_SUPPORT = = 10, SCORE_METHOD = 4, SPLIT_METHOD = 3, FORCE_REGRESSOR =

Başa dön

Örnek sorgu 2: dmx kullanarak modeli içeriği hakkında bilgi döndüren

Karar ağaçları modeli yerleşik olduğunda, oluşturulan ilgili temel bazı bilgileri aşağıdaki sorgu döndürür Temel veri madenciliği öğreticisi.Her ağaç yapısı içinde kendi düğüm depolanır.Bu model tek bir öngörülebilir öznitelik içerdiğinden, tek bir ağaç düğümü vardır.Ancak, ilişkilendirme modelini karar ağaçlar algoritma kullanarak oluşturursanız, olabilir, ağaçları, her ürün için bir yüz.

Belirli bir tahmin edilebilir öznitelik temsil eden bir ağacın üst düzey düğümlerin tüm düðümleri olan tip 2, bu sorgu döndürür.

Not

Sütun CHILDREN_CARDINALITY, içine yerleştirilmesi gerekir karşı aynı adı. ayrılmış mdx anahtar sözcük ayırmak için ayraç içine

SELECT MODEL_NAME, NODE_NAME, NODE_CAPTION, 
NODE_SUPPORT, [CHILDREN_CARDINALITY]
FROM TM_DecisionTrees.CONTENT
WHERE NODE_TYPE = 2

Örnek sonuçlar:

MODEL_ADI

NODE_NAME

NODE_CAPTION

NODE_SUPPORT

CHILDREN_CARDINALITY

TM_DecisionTree

000000001

Tümü

12939

5

Ne bu sonuçlar, bildirin?Karar ağaçları modeli, belirli bir düğüm kardinalite, kaç anlık alt söyler bu düğümü vardır.Önem modeli hedef bölünmüş 5 bu düğüm için yani popülasyon potansiyel bisiklet alıcıların 5 alt gruplar halinde.

Çocuklar için öznitelikleri ve değerleri alt düğümlerdeki dağıtımı ile birlikte bu beş alt gruplara ilgili aşağıdaki sorgu döndürür.Destek ve olasılık farkı gibi istatistikleri iç içe geçmiş tablo içinde saklandığından NODE_DISTRIBUTION, bu örnek kullanır FLATTENED anahtar çıktı iç içe geçmiş tablo sütunları.

Not

İç içe geçmiş tablo sütun SUPPORT, içine yerleştirilmesi gerekir aynı adı. ayrılmış anahtar sözcüğü buradan ayırmak için ayraç içine

SELECT FLATTENED NODE_NAME, NODE_CAPTION,
(SELECT ATTRIBUTE_NAME, ATTRIBUTE_VALUE, [SUPPORT]
FROM NODE_DISTRIBUTION) AS t
FROM TM_DecisionTree.CONTENT
WHERE [PARENT_UNIQUE_NAME] = '000000001'

Örnek sonuçlar:

NODE_NAME

NODE_CAPTION

T.ATTRIBUTE_NAME

T.ATTRIBUTE_VALUE

DESTEK

00000000100

Otomobilleri ait numara = 0

Bisiklet alıcı

Eksik

0

00000000100

Otomobilleri ait numara = 0

Bisiklet alıcı

0

1067

00000000100

Otomobilleri ait numara = 0

Bisiklet alıcı

1

1875

00000000101

Otomobilleri ait numara = 3

Bisiklet alıcı

Eksik

0

00000000101

Otomobilleri ait numara = 3

Bisiklet alıcı

0

678

00000000101

Otomobilleri ait numara = 3

Bisiklet alıcı

1

473

Bu sonuçlar, müşterilerin, kim bir bisiklet satın söyleyebilir ([Bike Buyer] = 1), 1067 müşteriler 0 otomobilleri vardı ve 473 müşterileri var. 3 otomobilleri

Başa dön

Örnek sorgu 3: Alt ağaçlar modelinden alınıyor

Bir bisiklet satın müşteriler hakkında daha fazla keşfetmek istediğinizi varsayın.Kullanarak alt için ek ayrıntı görüntüleyebilirsiniz. IsDescendant (dmx) işlev sorguda gösterildiği gibi aşağıdaki örnek.Yaprak düğümlerin alarak bisiklet Satınalmacılar sayısı sorgu döndürür (node_type = 4) üzerinde 42 yaşının müşteriler içeren ağaç.Sorgu satır yuvalanmış sınırlar tablo bu yeri bisiklet alıcı = 1.

SELECT FLATTENED NODE_NAME, NODE_CAPTION,NODE_TYPE,
(
SELECT [SUPPORT] FROM NODE_DISTRIBUTION WHERE ATTRIBUTE_NAME = 'Bike Buyer' AND ATTRIBUTE_VALUE = '1'
) AS t
FROM TM_DecisionTree.CONTENT
WHERE ISDESCENDANT('0000000010001')
AND NODE_TYPE = 4

Örnek sonuçlar:

NODE_NAME

NODE_CAPTION

t.support

000000001000100

Yıllık gelir >= 26000 ve < 42000

266

00000000100010100

Çocuklar toplam = 3

75

0000000010001010100

Alt öğeler için numara Giriş = 1

75

Başa dön

Karar ağaçları modeli kullanılarak Öngörüler yapmak

Karar ağaçları bir karar ağacı modeli bir tahmin sorgu oluşturduğunuzda, sınıflandırma, regresyon ve hatta Birliği de dahil olmak üzere çeşitli görevler için kullanılan çünkü kullanabileceğiniz birçok seçenek vardır.Anlamak için modeli kendisi için oluşturulmuş amacı anlamak gerekir sonuçlar eğilimi.Üç farklı senaryo aşağıdaki sorgu örnekleri gösterilmiştir:

  • Döndürme olasılığını tahmin doğru ve sonra sonuçlar tarafından Olasılık Filtresi ile birlikte bir sınıflandırma modeli için bir öngörü;

  • İlişkileri tahmin etmek bir singleton sorgu oluşturma;

  • Giriş ve çıkışı arasındaki ilişki doğrusal olduğu bir karar ağacı parçası regresyon formülü alınıyor.

Örnek sorgu 4: Öngörüler ile olasılıklar döndürme

Aşağıdaki örnek sorgu oluşturulan karar ağacı modelini kullanır, Temel veri madenciliği öğreticisi.Gelen yeni bir örnek veri küme sorgu geçen tablo dbo.ProspectiveBuyers , AdventureWorks2008R2 tahmin etmek hangi müşterilerin yeni veri kümendeki satın için dwbisiklet.

Sorgu tahmin işlev kullanır PredictHistogram (dmx), tarafından keşfedilen olasılıklar hakkında yararlı bilgiler içeren iç içe geçmiş tablo işlevmodeli. Son where yan tümce tümce tümce sorgunun sonuçlar yalnızca % 0 ' büyük bir olasılık ile bir bisiklet satın almak büyük olasılıkla olarak öngörülen müşteriler döndürmek için filtre uygular.

SELECT
  [TM_DecisionTree].[Bike Buyer],
  PredictHistogram([Bike Buyer]) as Results
From
  [TM_DecisionTree]
PREDICTION JOIN
  OPENQUERY([Adventure Works DW],
    'SELECT
      [FirstName],
      [LastName],
      [MaritalStatus],
      [Gender],
      [YearlyIncome],
      [TotalChildren],
      [NumberChildrenAtHome],
      [HouseOwnerFlag],
      [NumberCarsOwned]
    FROM
      [dbo].[ProspectiveBuyer]
    ') AS t
ON
  [TM_DecisionTree].[First Name] = t.[FirstName] AND
  [TM_DecisionTree].[Last Name] = t.[LastName] AND
  [TM_DecisionTree].[Marital Status] = t.[MaritalStatus] AND
  [TM_DecisionTree].[Gender] = t.[Gender] AND
  [TM_DecisionTree].[Yearly Income] = t.[YearlyIncome] AND
  [TM_DecisionTree].[Total Children] = t.[TotalChildren] AND
  [TM_DecisionTree].[Number Children At Home] = t.[NumberChildrenAtHome] AND
  [TM_DecisionTree].[House Owner Flag] = t.[HouseOwnerFlag] AND
  [TM_DecisionTree].[Number Cars Owned] = t.[NumberCarsOwned]
WHERE [Bike Buyer] = 1
AND PredictProbability([Bike Buyer]) >'.05'

Varsayılan olarak, Analysis Services sütun etiketi ile iç içe geçmiş tablo döndüren ifade.Bu etiket yumuşatma tarafından döndürülen sütun değiştirebilirsiniz.Böylece, diğer ad ad (Bu durum, sonuçları) iç içe geçmiş tablo değeri olarak her iki sütun başlığı olarak kullanılır.sonuçlar görmek için iç içe geçmiş tablo genişletmeniz gerekir.

Örnek sonuçlar:

Bisiklet alıcı

Sonuçlar

1

Sonuçlar

Bisiklet alıcı$DESTEK$OLASILIK$ADJUSTEDPROBABILITY$SAPMA$STDSAPMA
125400.6348492420456440.01356216828156200
014600.3649841745793770.0066133693255091500
00.0001665833749791770.00016658337497917700

Yoksa sizin sağlayıcı olanlar nulls yerine yinelenen sütun değerlerini içeren bir tablo olarak sonuçlar döndüren sorguda flattened anahtar sözcüğünü kullanabilirsiniz burada gösterildiği gibi hiyerarşik satır kümeleri desteklemez.Daha fazla bilgi için bkz: İç içe tablolar (Analysis Services - veri madenciliği) veya Select deyimi (dmx) Anlama.

Başa dön

Örnek sorgu 5: Karar ağaçları modeli bu ilişkileri tahmin etmek

Aşağıdaki örnek sorgu dayandığı Association Araştırma yapısı.Bu örnek ile birlikte izlemek için yeni bir model için ekleyebileceğiniz araştırma yapısı, Microsoft karar ağaçlar algoritması seçin.Oluşturma hakkında daha fazla bilgi için Association araştırma yapısı, bkz: Ders 3: Pazar sepeti senaryo (Ara veri madenciliği Öğreticisi) oluşturma.

Aşağıdaki örnek sorgu da kolayca oluşturabilirsiniz bir singleton sorgu ise Business Intelligence Development Studio alanları seçerek ve sonra da değerleri için bu alanlardan'ı seçerekbir kapalı açılan liste.

SELECT PredictAssociation([DT_Association].[v Assoc Seq Line Items],3)
FROM
  [DT_Association]
NATURAL PREDICTION JOIN
(SELECT (SELECT 'Patch kit' AS [Model]) AS [v Assoc Seq Line Items]) AS t

Beklenen sonuçlar:

Model

Dağ-200

Dağ Tekeri Borusu

Yarış lastiği iç lastik

sonuçlar düzeltme eki Kit ürünü satın almış olan müşteriler için önermek için üç en iyi ürünlere söyleyin.Öneriler, değerler yazarak, veya kullanarak yaptığınızda de birden fazla ürünü giriş sağlayabilirsiniz Singleton sorgu giriş iletişim kutusu ve ekleme veya değerleri kaldırılıyor.Aşağıdaki örnek sorgu nasıl birden çok değer, bağlı bir tahmin yapmak sağlanan gösterir.Giriş değerleri tanımlayan deyim içinde bir birleşim yan tümce tümce tümce tarafından değerlere bağlı.

SELECT PredictAssociation([DT_Association].[v Assoc Seq Line Items],3)
From
  [DT_Association]
NATURAL PREDICTION JOIN
(SELECT (SELECT 'Racing Socks' AS [Model]
  UNION SELECT 'Women''s Mountain Shorts' AS [Model]) AS [v Assoc Seq Line Items]) AS t

Beklenen sonuçlar:

Model

Uzun kabında Logo Jersey

Dağ-400-W

Klasik Vest

Başa dön

Örnek sorgu 6: Karar ağaçları modeli regresyon formül alınıyor

Sürekli öznitelik üzerinde bir gerileme içeren bir karar ağacı model oluşturmak, Öngörüler yapmak için regresyon formülü kullanabilirsiniz ya da yapabilirsiniz ayıklamak regresyon formül hakkında bilgi.Regresyon modelleri sorgular hakkında daha fazla bilgi için bkz: Doğrusal regresyon modeli sorgulama (- Analysis Services veri madenciliği).

Karar ağaçları modeli regresyon düğümleri ve kesikli öznitelikleri veya aralıklara bölme düğümleri bir karışımını içeriyorsa, yalnızca regresyon düğümü döndüren bir sorgu oluşturabilirsiniz.NODE_DISTRIBUTION tablo regresyon formül ayrıntılarını içerir.Bu örnekte, sütunları düzleştirilir ve rahat NODE_DISTRIBUTION tablo bilinir.Ancak, bu modelde, hiçbir regressors arasında ilişki bulundu Income ile sürekli diğer öznitelikleri.Bu gibi durumlarda Analysis Services ortalama değerini öznitelik ve toplam sapma modelinde bu öznitelik.

SELECT FLATTENED NODE_DISTRIBUTION AS t
FROM DT_Predict. CONTENT
WHERE NODE_TYPE = 25

Örnek sonuçlar:

t.ATTRIBUTE_NAME

t.ATTRIBUTE_VALUE

t.support

t.PROBABILITY

t.VARIANCE

t.VALUETYPE

Yıllık gelir

Eksik

0

0.000457142857142857

0

1

Yıllık gelir

57220.8876687257

17484

0.999542857142857

1041275619.52776

3

  

57220.8876687257

0

0

1041216662.54387

11

Değer türleri ve regresyon modellerinde kullanılan istatistikleri hakkında daha fazla bilgi için bkz: Doğrusal regresyon modeller için içerik modeli mining (Analysis Services - veri madenciliği).

Başa dön

Tahmin işlevlerin listesi

Tüm Microsoft algoritmaları desteği ortak küme işlevleri.Ancak, Microsoft karar ağaçlar algoritması aşağıdaki tablo. listelenen ek işlevleri destekler

Tüm ortak işlevlerin listesi için Microsoft algoritmalar, bkz: Eşleştirme türleri (dmx) sorgu işlevler.Belirli işlevleri sözdizimini görmek Veri madenciliği Extensions (dmx) işlev başvurusu.