İçerik modeli mining (Analysis Services - veri madenciliği)

Tasarlanmış ve temel alınan verileri kullanarak bir araştırma modeli işlenen sonra araştırma yapısı, araştırma modeli tamamlandı ve içeren Araştırma modeli içeriği.Bu içerik, Öngörüler yapmak veya verilerinizi çözümlemek için kullanabilirsiniz.

İçerik modeli mining modeli hakkında meta veriler, veri ve araştırma algoritması tarafından keşfedilen desenleri ile ilgili istatistikleri içerir.Kullanılan algoritma bağlı modeli regresyon formül, kuralları ve itemsets veya ağırlıkları tanımları ve diğer İstatistikler içerik.

Kullanılan algoritma ne olursa olsun, araştırma modeli içeriği standart bir yapıda sunulmuştur.Microsoft Genel içerik ağacı sağlanan Görüntüleyicisi ' nde yapı göz atabilirsiniz Business Intelligence Development Studiove sonra nasıl bilgi yorumlanır ve her model türü için grafiksel olarak görüntülenen görmek için özel görüntüleyicilerden birini geçin. Ayrıca araştırma modeli karşı sorguları MINING_MODEL_CONTENT destekleyen herhangi bir istemci kullanarak içerik oluşturabilirsiniz şema satır kümesi.Daha fazla bilgi için bkz: Veri madenciliği modelleri sorgulama: Nasıl yapılır konuları (Analysis Services - veri madenciliği).

Bu bölümde her türlü veri madenciliği modelleri için sağlanan içeriğin temel yapısını açıklar.Tüm Araştırma modeli içeriği için ortak olan düğüm türlerini açıklar ve bilgileri yorumlamak rehberlik sağlar.

Yapı araştırma modeli içeriği

Düğümler

Mining modeli içeriği tarafından algoritma türü

Araştırma modeli içeriği görüntülemek için Araçlar

Araştırma modeli içeriğini sorgulamak için Araçlar

Yapı araştırma modeli içeriği

Bir dizi olarak sunulan her modeli içeriği düğümler.Nesne meta veriler ve modelinin bir bölümüyle ilgili bilgileri içeren bir araştırma modeli içinde bir düğümdür.Düğümler, hiyerarşik olarak düzenlenir.Düğümler hiyerarşisindeki tam düzenleme ve hiyerarşi anlamı, kullanılan algoritma bağlıdır.Örneğin, bir karar ağaçları modeli oluşturduğunuzda, model model köke bağlı tüm çoklu ağaçları içerebilir; neural ağ modeli oluşturduğunuzda, bir veya daha fazla ağ artı istatistikleri düğüm modeli içerebilir.

Her model ilk düğüm adı verilen kök düğümü, veya modeli üst düğüm.Her model bir kök düğüm vardır (node_type = 1).Kök düğüm genellikle bazı meta veriler modeli ve alt düğümlerin sayısı hakkında ancak modeli tarafından keşfedilen desenleri hakkında çok az ek bilgi içerir.

Hangi model oluşturmak için kullanılan algoritma bağlı kök düğümünün alt düğümlerinin değişen bir numarası vardır.Alt düğümler farklı anlamları vardır ve algoritma ve derinliği ve karmaşıklığı veri türüne göre farklı içeriğe sahip.

Başa Dön

Düğümler

İçinde bir araştırma modeli, tümü hakkında bir bilgi parçasını veya model parçasını saklayan bir genel amaçlı konteyner bir düğümdür.Her düğüm yapısını her zaman aynıdır ve veri madenciliği şema satır kümesi tarafından tanımlanan sütun içerir.Daha fazla bilgi için bkz: DMSCHEMA_MINING_MODEL_CONTENT satır kümesi.

Her düğüm, her modeli içinde parent node ve düğümün alt düğümlerin sayısı kimliği benzersiz bir tanımlayıcı içeren düğüm hakkındaki meta veriler içerir.Düğümün ait olduğu, modeli meta veriler tanımlar ve veritabanı kataloğu o belirli model depolandığı.Düğümü sağlanan ek içerik modeli oluşturmak için kullanılan ve aşağıdakiler bulunabilir algoritması türüne bağlı olarak farklılık gösterir:

  • Durumlarda, belirli bir tahmini değeri destekleyen eğitim veri sayısı.

  • İstatistikler, ortalama, standart sapma veya varyans gibi.

  • Katsayıları ve formülleri.

  • Kurallar ve lateral işaretçiler tanımı.

  • Model bir bölümünü tanımlayan xml parçaları.

Düğüm türleri listesi

Aşağıdaki tablo veri madenciliği modelleri çıkışı olan düğümler farklı türlerini listeler.Her algoritma bilgileri farklı şekilde işlediğinden, her modeli yalnızca birkaç belirli türdeki düðümleri oluşturur.Algoritma değiştirirseniz, düğüm türü değişebilir.Modeli yeniden işleme, ayrıca, her düğümün içeriğini değiştirebilir.

Not

Farklı veri madenciliği kullanırsanız, hizmet sql Server 2008 Analysis verilenlerden daha hizmets, veya kendi eklentisi algoritmaları oluşturursanız, ek özel düğüm tipleri kullanılabilir olabilir.

NODE_TYPE KİMLİĞİ

Düğüm etiket

Düğüm içeriği

1

Model

Meta veriler ve kök içerik düğümü.Tüm model türleri için geçerlidir.

2

Ağaç

Sınıflandırma ağacının kök düğüm.Karar ağacı modeller için geçerlidir.

3

İç kısım

İç düğüm ağacına bölün.Karar ağacı modeller için geçerlidir.

4

Dağıtım

Ağaç düğüm Terminal.Karar ağacı modeller için geçerlidir.

5

Küme

Küme algoritması tarafından algılanan.Kümeleme modelleri ve modelleri kümeleme sırası için geçerlidir.

6

Bilinmiyor

Bilinmeyen düğüm türü.

7

ItemSet

Algoritması tarafından algılanan Itemset.İlişki modeli veya modelleri kümeleme sırası uygulanır.

8

AssociationRule

Algoritması tarafından algılanan Birliği kural.İlişki modeli veya modelleri kümeleme sırası uygulanır.

9

PredictableAttribute

Öngörülebilir öznitelik.Tüm model türleri için geçerlidir.

10

InputAttribute

Giriş öznitelik.Karar ağaçları ve Naïve Bayes modeller için geçerlidir.

11

InputAttributeState

Giriş öznitelik durumları hakkındaki istatistiklerdir.Karar ağaçları ve Naïve Bayes modeller için geçerlidir.

13

Sıra

Üst düğüm bileşeni için bir Markov modeli sıra küme.Modelleri kümeleme sırası için geçerlidir.

14

Geçiş

Markov geçiş matrisi.Modelleri kümeleme sırası için geçerlidir.

15

Zaman serisi

saat serisi ağaç düğümü kök olmayan.Yalnızca saat serisi modeller için geçerlidir.

16

TsTree

Bir tahmin edilebilir saat serisi için karşılık gelen saat serisi ağaç kök düğüm.saat serisi modeller için geçerlidir ve yalnızca modeli, KARIŞIK parametresi kullanılarak oluşturulduysa.

17

NNetSubnetwork

Bir kullanıp kullanmayacaklarını.Neural ağ modeller için geçerlidir.

18

NNetInputLayer

Giriş katmanı düğümler içeren grubu.Neural ağ modeller için geçerlidir.

19

NNetHiddenLayer

Gizli katmanı açıklayan düğümlerini içeren grupları.Neural ağ modeller için geçerlidir.

21

NNetOutputLayer

Çıkış katmanı düğümler içeren grupları.Neural ağ modeller için geçerlidir.

21

NNetInputNode

Giriş öznitelik karşılık gelen durumları ile eşleşen giriş katmanı düğüm.Neural ağ modeller için geçerlidir.

22

NNetHiddenNode

Gizli katmanı düğüm.Neural ağ modeller için geçerlidir.

23

NNetOutputNode

Çıkış katmanı düğüm.Bu düğüm genellikle bir çıkış öznitelik ve ilgili durumları aynı.Neural ağ modeller için geçerlidir.

24

NNetMarginalNode

Marjinal istatistikleri hakkında eğitim küme.Neural ağ modeller için geçerlidir.

25

RegressionTreeRoot

Regresyon ağaç kök dizini.Doğrusal regresyon modeller ve sürekli giriş öznitelikleri içeren karar ağacı modelleri için geçerlidir.

26

NaiveBayesMarginalStatNode

Marjinal istatistikleri hakkında eğitim küme.Naïve Bayes modeller için geçerlidir.

27

ArimaRoot

ARIMA modelinin kök düğüm.ARIMA algoritmasını kullanmak yalnızca o saat serisi modelleri için geçerlidir.

28

ArimaPeriodicStructure

ARIMA modelinde dönemsel yapısı.ARIMA algoritmasını kullanmak yalnızca o saat serisi modelleri için geçerlidir.

29

ArimaAutoRegressive

ARIMA modelinde tek bir terim için Autoregressive katsayısı.

ARIMA algoritmasını kullanmak yalnızca o saat serisi modelleri için geçerlidir.

30

ArimaMovingAverage

ARIMA modelinde tek bir terim için hareketli ortalama katsayısı.ARIMA algoritmasını kullanmak yalnızca o saat serisi modelleri için geçerlidir.

1000

CustomBase

Özel düğüm türleri için başlangıç noktası.Özel düğüm türleri bu değerden değerinde büyük bir tamsayı olması gerekir sabit.Özel eklenti algoritmaları kullanılarak oluşturulan modelleri için geçerlidir.

Düğüm kimliği, adı, başlık ve açıklama

Herhangi bir modelinin kök düğümü benzersiz kimliği her zaman vardır (NODE_UNIQUE_NAME) 0.Tüm node ID'leri, Analysis Services tarafından otomatik olarak atanır ve değiştirilemez.

Her model için kök düğüm modeli hakkında bazı temel meta veriler de içerir.Bu meta veriler model depolandığı bir Analysis Services veritabanı içerir (model_catalog), şema (**model_schema)**ve model adını (model_adı).Ancak, bu meta veriler almak için kök düğüme sorgulama gerek yoktur bu bilgiler tüm düğümler modelinde yinelenir.

Her düğüm benzersiz tanımlayıcı olarak kullanılan bir ad yanında olan bir ad (node_name).Bu ad otomatik olarak görüntüleme amaçları için algoritması tarafından oluşturulan ve düzenlenemez.

Not

Microsoft Kümeleme algoritması her küme için kolay adlar atamak kullanıcılara izin verir.Ancak bu kolay adları sunucudaki kalıcı ve modeli yeniden işleme algoritması yeni küme adları oluşturur.

The caption and description for each node are automatically generated by the algorithm, and serve as labels to help you understand the content of the node.Her alan için oluşturulan metin model türüne göre değişir.Bazı durumlarda, adı, başlık ve açıklama tamamen aynı içerebilir dize, ancak bazı modeller, açıklama ek bilgiler içerebilir.Tek tek modeli tür hakkında ayrıntılı bilgi için uygulama konusuna bakın.

Not

Analysis Services sunucusuna yeniden yalnızca yeniden adlandırma uygulayan özel bir eklenti algoritmasını kullanarak modelleri oluşturmak, düğümleri adlandırma destekler.Yeniden etkinleştirmek için eklenti algoritması oluşturduğunuzda yöntemlerini geçersiz kılmanız gerekir.

Düğüm Ebeveynler ve düğümü alt düğümü önem

Ağaç yapısında, üst ve alt düğümler arasındaki ilişkiyi PARENT_UNIQUE_NAME sütun değeri tarafından belirlenir.Bu değer, alt düğümü depolanır ve üst düğüm kimliği bildirir.Nasıl bu bilgi kullanılabilir Aşağıda bazı örnekler verilmektedir:

  • Boş bir PARENT_UNIQUE_NAME düğümü modelinin üst düğüm olduğu anlamına gelir.

  • PARENT_UNIQUE_NAME değeri 0 ise, üst düğüm modeli, doğrudan bir alt düğümü olmalıdır.Nedeni, kök düğüm kimliği her zaman olduğu 0.

  • Bağımlıları veya belirli bir düğümün Anne bulmak için içinde bir veri Mining Extensions (dmx) sorgu işlevler kullanabilirsiniz.Sorgularda işlevleri kullanma hakkında daha fazla bilgi için bkz: Veri madenciliği modelleri sorgulama (- Analysis Services veri madenciliği).

Önem maddelerin sayısını gösterir bir küme.Bağlamında işlenen bir araştırma modeli, kardinalite bildirir, çocukların sayısı belirli bir düğüm.Karar ağacı modeli bir düğüm [yıllık gelir], ve o düğümün [yıllık gelir] koşul için bir iki alt düğümleri vardır, örneğin, yüksek ve koşulun [yıllık gelir] = düşük, CHILDREN_CARDINALITY değeri = [yıllık gelir] düğüm 2 olacaktır için.

Not

De Analysis Services, yalnızca anlık alt düğümlerin sayılan hesaplarken kardinalite düzeyini bir düğüm.Ancak, özel bir eklenti algoritması oluşturursanız, kardinalite farklı saymak için CHILDREN_CARDINALITY tekrar.Örneğin, bağımlıları, değil yalnızca anlık alt toplam sayısını saymak istediğinizde bu yararlı olabilir.

Tüm modeller için aynı şekilde kardinalite sayılan rağmen nasıl yorumlanacağı veya kardinalite değerini kullanın modeli türüne bağlı olarak farklılık gösterir.Örneğin, bir kümeleme modelinde, üst düğüm kardinalite, bulundu kümeler toplam sayısı söyler.kardinalite modellerini diğer türleri her zaman olabilir bir küme düğüm türüne göre değer.kardinalite yorumlama hakkında daha fazla bilgi için tek tek model türü hakkında konusuna bakın.

Not

Microsoft Neural ağ algoritması tarafından oluşturulanlar gibi bazı modelleri için tüm modeli hakkında eğitim veri tanımlayıcı istatistik sağlayan bir özel düğüm türü ek olarak bulunur.Tanım olarak, bu düğümler asla alt düğümleri vardır.

Düğüm dağıtım

NODE_DISTRIBUTION sütun birçok düğümlerin önemli ve ayrıntılı bilgi sağlayan algoritması tarafından keşfedilen desenleri hakkında iç içe geçmiş bir tablo içerir.Bu konuda sağlanan tam istatistik tablo türüne göre model, ağaç düğümü konumunu değiştirmek ve olup predictablo öznitelik, sürekli sayısal bir değer veya ayrı bir değer; Ancak, minimum ve maksimum değerleri içerebilir bir öznitelik, değerleri, bir düğüm durumlarda, regresyon formül ve standart sapma ve varyans gibi istatistiksel ölçümler kullanılan katsayıları sayısı atanan ağırlık.Düğüm dağıtım yorumlama hakkında daha fazla bilgi için çalıştığınız modeli türü belirli tür konusuna bakın.

Not

NODE_DISTRIBUTION tablo düğüm türüne bağlı olarak boş olabilir.Yalnızca düzenlemek için örneğin, bazı düğümler hizmet veren bir koleksiyon alt düğümlerinin ve ayrıntılı istatistikleri içeren alt düğümler.

İç içe geçmiş tablo, NODE_DISTRIBUTION, her zaman aşağıdaki sütunları içerir.Her içerik sütun modeli türüne bağlı olarak değişir.Belirli bir modeli türleri hakkında daha fazla bilgi için bkz: Mining modeli içerik algoritma türü tarafından.

  • ÖZNİTELİK_ADÝ
    Algoritması tarafından içeriği değişir.Öngörülebilir öznitelik, bir kural, bir itemset veya bilgi parçası gibi bir sütun adı iç formülün bir parçasını gibi algoritması için olabilir.

    Bu sütun, öznitelik-değer çifti de içerebilir.

  • ATTRIBUTE_VALUE
    İçinde öznitelik_adý adlı öznitelik değeri.

    Öznitelik adı, sonra da en basit bir sütun olup olmadığını durum, ATTRIBUTE_VALUE, o sütun için ayrı değerlerden birini içerir.

    Nasıl algoritma değerleri işleme bağlı olarak, ATTRIBUTE_VALUE de öznitelik için bir değer var olup bildiren bir bayrak içerebilir (Existing), veya değeri null olup olmadığını (Missing).

    Model ise, örneğin, küme bir maddeyi en az bir kez satın Bul müşteriler kadar gibi faiz, maddeyi tanımlayan öznitelik-değer çifti öznitelik_adý sütun içerebilir Model = 'Water bottle', ATTRIBUTE_VALUE sütun yalnızca anahtar sözcüğünü içerir ve Existing veya Missing.

  • DESTEK
    Bu öznitelik-değer çifti olan veya bu itemset veya kuralı içeren durumlarda sayısı.

    Genel olarak, her düğüm için destek değeri, kaç durumlarda Eğitim küme içinde geçerli düğümün içerdiği söyler.Birçok modeli türü desteği tam bir sayım taleplerinin temsil eder.Eğitim verileri sorgulamasına gerek kalmadan veri dağıtım eğitim taleplerinizi içinde görebilirsiniz çünkü destek yararlı değerlerdir.Analysis Services sunucusu bu depolanmış değerleri kesmesi güçlü ya da zayıf olup olmadığını belirlemek için önceki olasılık, ve saklı olasılığını hesaplamak için de kullanır.

    Örneğin, bir sınıflandırma ağacındaki destek değeri, nitelikleri açıklanan birleşimi olan servis taleplerinin sayısını gösterir.

    Karar ağacında, her destek toplamı düzey destek üst düğümünde, bir ağaç toplamaları.Örneğin, model içeren, 1200 durumlarda cinsiyet tarafından eşit olarak bölünür ve üç değerlere göre gelir eşit olarak bölünür — düşük, Orta ve yüksek — düğümü (4) (5) alt düðümleri olan düğüm (2) ve (6) (2) düğüm aynı sayıda servis talebi için her zaman Topla,.

    Düğüm kimliği ve düğümün öznitelikleri

    Destek sayısı

    (1) Modeli kök

    1200

    (2) Cinsiyet erkek =

    (3) Cinsiyet kadın =

    600

    600

    (4) Cinsiyet erkek ve geliri = yüksek =

    (5) Cinsiyet erkek ve geliri = Orta =

    (6) Cinsiyet erkek ve geliri = düşük =

    200

    200

    200

    (7) Cinsiyet kadın ve geliri = yüksek =

    (8) Cinsiyet kadın ve geliri = Orta =

    (9) Cinsiyet kadın ve geliri = düşük =

    200

    200

    200

    Bir kümeleme modeli için destek numarasını, birden çok kümeye ait değerler içerecek şekilde ağırlıklı.Birden çok küme üyeliği kümeleme yöntem varsayılandır.Bu senaryoda, çünkü her durum mutlaka ait değil yalnızca bir kümeye destek bu modeller içinde en fazla yüzde 100'e tüm kümeleri arasında ekleyebilirsiniz değil.

  • OLASILIK
    Tüm modeli içindeki belirli bu düğüm için olasılık gösterir.

    Genellikle, olasılık desteği toplam sayısı (node_support) düğümü içinde taleplerinin bölünen bu belirli bir değeri temsil eder.

    Ancak, olasılık biraz sapma değerleri veri eksik neden ortadan kaldırmak için ayarlanır.

    İçin geçerli değer, örneğin, [toplam Children] 'Bir' demektir ve 'İki' alt veya üç çocuklar için imkansız olduğunu öngörür bir model oluşturma, kaçınmak istiyor.Değerleri eksik olanak, ancak imkansız, algoritma her zaman 1 gerçek değerlerin herhangi bir öznitelik için sayım ekler emin olmak için.

    Örnek:

    Olasılığını [toplam çocuklar bir =] = [durumlarda yeri sayısı toplam çocuklar biri =] + 1 / saymak tüm taleplerinin] + 3

    Olasılığını [toplam çocuklar iki =] = [durumlarda yeri sayısı toplam çocuklar iki =] + 1 / saymak tüm taleplerinin] ile + 3 arası

    Not

    3 Düzeltilmesi için varolan değerleri toplam sayısı 1 ekleyerek hesaplanır n.

    Düzeltmeden sonra tüm değerler için olasılıklar hala en çok 1 ekleyin.Olasılık değeri veri içermeyen (Bu örnekte, [toplam çocuklar 'Sıfır', 'Üç' veya başka bir değer =]), başlar çok düşük sıfır olmayan düzeyve daha fazla servis taleplerini eklendikçe yavaş artar.

  • VARYANS
    Düğümü içindeki değerlerin değişimi gösterir.Tanım olarak, her zaman ayrık değerler için 0 TL'dir.Model sürekli değerleri destekliyorsa, farkı hesaplanır σ (sigma) kullanarak payda n, veya düğüm durumlarda sayısı.

    Genel kullanımda standart sapma temsil etmek için iki tanım vardır (StDev).Standart sapmayı hesaplamak için bir yöntem hesap sapma alır ve bias kullanmadan başka bir yöntemi standart sapmayı hesaplar.Genel olarak, Microsoft veri madenciliği algoritmaları sapma standart sapma hesaplarken kullanmayın.

    NODE_DISTRIBUTION içinde görüntülenen değeri tablo tüm kesikli ve discretized öznitelikleri için gerçek değeri ve sürekli değerlerin ortalaması.

  • VALUE_TYPE
    Veri türü değeri veya öznitelik ve değer kullanımını gösterir.Belirli değer türleri yalnızca belirli modeli türleri için geçerlidir:

    VALUE_TYPE KİMLİĞİ

    Değer etiketi

    Değer türü adı

    1

    Eksik

    durum verilerini bu öznitelik için bir değer içermediğini gösterir.The Missing state is calculated separately from attributes that have values.

    2

    Var olan

    durum verilerini bu öznitelik için bir değer içerdiğini gösterir.

    3

    Sürekli

    Belirten değeri öznitelik sürekli sayısal bir değerdir ve bu nedenle ortalaması, Varyans ve standart sapma tarafından temsil edilebilir.

    4

    Ayrık

    Bir değeri gösterir sayısal ya da ayrı olarak işlem görür, metin.

    Not ayrık değerler de olabilir eksik; ancak bunlar farklı hesaplamalar yaparken işlenir.Bilgi için bkz: Değerleri eksik (Analysis Services - veri madenciliği).

    5

    Discretized

    öznitelik discretized sayısal değerler içerdiğini gösterir.Discretization demetleri biçimlendirilmiş bir dize değeri olacaktır.

    6

    Var olan

    Indicates that the attribute has continuous numeric values and that values have been supplied in the data, vs.values that are missing or inferred.

    7

    Katsayısı

    Bir katsayısı gösteren sayısal bir değer gösterir.

    Bir katsayısı bağımlı değişkenin değeri hesaplanırken, uygulanan bir değerdir.Örneğin, model üzerinde yaş gelir dayalı öngörür bir regresyon formül oluşturursa, katsayısı yaş gelir için ilişkili olduğu formülü kullanılır.

    8

    Puan kazanç

    Bir öznitelik için puan kazanç gösteren sayısal bir değer gösterir.

    9

    İstatistikleri

    Bir istatistik için bir regresör gösteren sayısal bir değer gösterir.

    10

    Düğüm benzersiz adı

    Değer sayısal veya dize olarak değil, ancak başka bir içerik düğümün bir modelinde benzersiz tanımlayıcı olarak işleneceğini değil olduğunu gösterir.

    Örneğin, bir neural ağ modeli kimlikleri gizli katmanı düğümler için çıktı katmanı düğümler ve giriş katmanı düğümler için gizli katmandaki düğümlerin işaretçilerini.

    11

    Kesme noktası

    Regresyon formüldeki kesişim noktası gösteren sayısal bir değer gösterir.

    12

    Periodicity

    Değer modeli düzenli bir yapıda gösterir gösterir.

    ARIMA modeli içeren yalnızca saat serisi modelleri için geçerlidir.

    NotNot
    Microsoft Zaman Serisi algoritması Eğitim verilerine dayanan dönemsel yapıları otomatik olarak algılar.Sonuç olarak, periodicities son modelinde model oluştururken bir parametre olarak sağlamadı periodicity değerleri içerebilir.

    13

    Autoregressive sipariş

    Değeri autoregressive seri sayısını temsil ettiğini gösterir.

    ARIMA algoritmasını kullanmak saat serisi modeller için geçerlidir.

    14

    Ortalama sipariş taşıma

    Bir serideki hareketli ortalamalar sayısını gösteren bir değeri temsil eder.

    ARIMA algoritmasını kullanmak saat serisi modeller için geçerlidir.

    15

    Fark sipariş

    Bir dizinin kaç kez gösterir değer değeri temsil ayrıştırılan gösterir.

    ARIMA algoritmasını kullanmak saat serisi modeller için geçerlidir.

    16

    Boolean

    Boole türü temsil eder.

    17

    Diğer

    Algoritması tarafından tanımlanan özel bir değeri temsil eder.

    18

    Prerendered dize

    Algoritma bir dize olarak işleyen özel bir değeri temsil eder.Biçimlendirmesi içermeyen nesne modeli tarafından uygulandı.

    Değer türü admomd türetilmiştir.net numaralandırma.Daha fazla bilgi için bkz: MiningValueType.

Düğüm skoru

Düğüm skoru anlamını modeli türüne bağlı olarak farklılık gösterir ve belirli düğüm türü de olabilir.node_score her model ve düğüm türü için nasıl hesaplandığını hakkında daha fazla bilgi için bkz: Mining modeli içerik algoritma türü tarafından.

Düğümün olasılık ve Marjinal olasılık

Tüm model türleri için NODE_PROBABILITY ve MARGINAL_PROBABILITY sütunları araştırma modeli şema satır kümesi içerir.Bu sütun yalnızca bir olasılık değeri anlamlı olduğu düğümlerin değerlerini içerir.Örneğin, kök düğüm model hiçbir zaman bir olasılık puan var.

Olasılık skorları sağlayan bu düğümler, farklı hesaplamalar düğümün olasılık ve Marjinal olasılıklar temsil eder.

  • Marjinal olasılık , üst düğüm ulaşmasını olasılıktır.

  • Düğümün olasılık kök düğümden ulaşmasını olasılıktır.

  • Düğümün olasılık her zaman küçük veya buna eşit olan Marjinal olasılık.

Örneğin, popülasyon bir karar tüm müşterilerimiz, ağaç cinsiyet tarafından eşit olarak bölünür (ve hiçbir değer yok), alt düğümler olasılığını.5 olmalıdır.Ancak, cinsiyet için düğümlerin her birinde gelir düzeyleri tarafından eşit şekilde bölünür varsayalım — yüksek, Orta ve düşük.Bu durum MARGINAL_PROBABILITY puanı her alt düğüm için her zaman.33 olmalıdır ancak NODE_PROBABILTY değer o düğüm için önde gelen tüm olasılıklar ürünü olması ve bu nedenle her zaman MARGINAL_PROBABILITY daha az değer.

Düğüm/öznitelik ve değer düzeyi

Marjinal olasılık

Düğümün olasılık

Modeli kök

Tüm hedef müşteriler

1

1

Hedef müşterilere göre cinsiyet bölmek

.5

.5

Hedef müşteriler tarafından cinsiyet bölmek ve gelir tarafından yeniden üç yolu bölme

.33

.5 * .33 = .165

Düğüm kural ve Marjinal kuralı

Araştırma modeli şema satır kümesi sütunları node_rule ve MARGINAL_RULE tüm model türleri için de içerir.Bu sütunlar, bir model seri hale getirmek için ya da bazı parçaları modeli yapısını temsil etmek için kullanılan xml parçaları içerir.Bu sütunlar, bazı düğümler için bir değer anlamsız, boş olabilir.

İki tür xml kuralları belirtilmezse, olasılık değerleri iki tür benzer.xml parçası node_rule yol geçerli düğümün modeli kökünden açıklar oysa xml parçası MARGINAL_RULE öznitelik ve değeri geçerli düğümün tanımlar.

Başa Dön

Mining modeli içeriği tarafından algoritma türü

Algoritmalar birbirinden farklı türde bilgiler içerik şemasını bir parçası olarak depolar.Örneğin, Microsoft kümeleme algoritma oluşturur birçok alt düğümler, herbiri temsil eden olası bir küme.Her küme düğümü tarafından öğeleri kümede paylaşılan özelliklerini açıklamak kuralları içerir.Buna karşılık, Microsoft doğrusal regresyon algoritma içeren tüm alt düğümlerin; Bunun yerine, üst düğüm modeli için doğrusal ilişkiyi analiz tarafından keşfedilen açıklar denklem içeriyor.

Aşağıdaki tablo her algoritma türü için konulara bağlantılar sağlar.

  • İçerik modeli konular: Her düğüm türü her algoritma türü için ne anlama geldiğini açıklamak ve düğümler modeli belirli türde birçok ilgi olduğu konusunda rehberlik sağlar.

  • Konuları sorgulama: sonuçlar yorumlamak konusunda belirli bir modeli türü ve Kılavuzu karşı sorgu örnekleri sağlar.

Algoritma veya modeli türü

İçerik modeli

Veri madenciliği modelleri sorgulama

İlişkilendirme kuralları modelleri

Birliği modeller için içerik modeli mining (Analysis Services - veri madenciliği)

Bir ilişki modeli sorgulama (- Analysis Services veri madenciliği)

Modelleri kümeleme

Karar ağacı modeller için içerik modeli mining (Analysis Services - veri madenciliği)

Bir küme modeli sorgulama (- Analysis Services veri madenciliği)

Karar ağaçları modeli

Karar ağacı modeller için içerik modeli mining (Analysis Services - veri madenciliği)

Karar ağaçlar modeli sorgulama (- Analysis Services veri madenciliği)

Doğrusal regresyon modeller

Doğrusal regresyon modeller için içerik modeli mining (Analysis Services - veri madenciliği)

Doğrusal regresyon modeli sorgulama (- Analysis Services veri madenciliği)

Logistic regresyon modelleri

Logistic regresyon modeller için içerik modeli mining (Analysis Services - veri madenciliği)

Doğrusal regresyon modeli sorgulama (- Analysis Services veri madenciliği)

Naïve Bayes modelleri

Önbelleğin Bayes modeller için içerik modeli mining (Analysis Services - veri madenciliği)

Önbelleğin Bayes Model sorgulama (- Analysis Services veri madenciliği)

Neural ağ modeller

Neural ağ modeller için içerik modeli mining (Analysis Services - veri madenciliği)

Neural ağ modeli (Analysis Services - veri madenciliği) sorgulama

Kümeleme sırası

Sıra modeller kümeleme için içerik modeli mining (Analysis Services - veri madenciliği)

Modeli kümeleme bir sıra sorgulama (- Analysis Services veri madenciliği)

Zaman serisi modelleri

Zaman serisi modeller için içerik modeli mining (Analysis Services - veri madenciliği)

Bir zaman serisi modeli sorgulama (- Analysis Services veri madenciliği)

Araştırma modeli içeriği görüntülemek için Araçlar

Ne zaman göz atabilir veya bir modelinde keşfetmeye Business Intelligence Development Studio, bilgileri görüntüleyebilirsiniz Microsoft Genel içerik ağacı Görüntüleyici, her ikisini de kullanılabilen Business Intelligence Development Studio ve SQL Server Management Studio.

The Microsoft Generic Content Viewer displays the columns, rules, properties, attributes, nodes, and other content from the model by using the same information that is available in the content schema rowset of the mining model.İçerik şema satır kümesi veri içeriği hakkında ayrıntılı bilgi sunmak için genel bir çerçeve olan araştırma modeli. Hiyerarşik satır kümeleri destekleyen herhangi bir istemci modeli içeriği görüntüleyebilir.Görüntüleyici'de Business Intelligence Development Studio tüm modelleri, oluşturduğunuz modeli yapısını anlamak daha kolay hale getirme, tutarlı bir biçimde gösteren bir html tablo Görüntüleyicisi'nde bu bilgileri sunar.Daha fazla bilgi için bkz: Microsoft Genel içerik ağacı Görüntüleyici ile modeli ayrıntılarını görüntüleme.

Başa Dön

Araştırma modeli içeriğini sorgulamak için Araçlar

Araştırma modeli içeriği almak için veri madenciliği modeline yönelik bir sorgu oluşturmanız gerekir.

İçerik bir sorgu oluşturmak için en kolay yolu aşağıdaki dmx yürütecek olan deyim , SQL Server Management Studio:

SELECT * FROM [<mining model name>].CONTENT

Daha fazla bilgi için bkz: Veri madenciliği modelleri sorgulama (- Analysis Services veri madenciliği).

Veri madenciliği şema satır kümeleri kullanarak araştırma modeli içerik sorgu yürütebilir.Şema satır kümesi istemcilerinin keşfedin, göz ve araştırma yapıları ve modelleri hakkındaki bilgileri sorgulamak için kullandığı standart bir yapıdır.xmla, Transact-sql veya dmx deyimleri kullanarak şema satır kümeleri sorgulama yapabilirsiniz.

De SQL Server 2008, bilgiler, veri madenciliği şema satır kümeleri Analysis Services sunucusuna bağlantı açarak ve sorgulama de erişebilirsistem tabloları. Sorgu veri madenciliği şema satır kümeleri için select deyimleri kullanma hakkında daha fazla bilgi için bkz: Sorun giderme araçları (Analysis Services - veri madenciliği).

Başa Dön