CREATE MINING MODEL (DMX)CREATE MINING MODEL (DMX)

QUESTO ARGOMENTO SI APPLICA A:sìSQL Server (a partire dalla versione 2008)noDatabase SQL di AzurenoAzure SQL Data Warehouse noParallel Data Warehouse THIS TOPIC APPLIES TO:yesSQL Server (starting with 2008)noAzure SQL DatabasenoAzure SQL Data Warehouse noParallel Data Warehouse

Consente di creare sia un nuovo modello di data mining che una struttura di data mining nel database.Creates both a new mining model and a mining structure in the database. Per creare un modello è possibile definirlo nell'istruzione oppure utilizzare il linguaggio PMML (Predictive Model Markup Language).You can create a model either by defining the new model in the statement, or by using the Predictive Model Markup Language (PMML). La seconda soluzione è consigliata solo agli utenti esperti.This second option is for advanced users only.

Il nome della struttura di data mining viene creato aggiungendo il suffisso "_structure" al nome del modello, per assicurare l'utilizzo di un nome univoco derivato dal nome del modello.The mining structure is named by appending "_structure" to the model name, which ensures that the structure name is unique from the model name.

Per creare un modello di data mining per una struttura di data mining esistente, utilizzare il DMX ALTER MINING STRUCTURE ( ) istruzione.To create a mining model for an existing mining structure, use the ALTER MINING STRUCTURE (DMX) statement.

SintassiSyntax


CREATE [SESSION] MINING MODEL <model>  
(  
    [(<column definition list>)]  
)  
USING <algorithm> [(<parameter list>)] [WITH DRILLTHROUGH]  
CREATE MINING MODEL <model> FROM PMML <xml string>  

ArgomentiArguments

modelmodel
Nome univoco del modello.A unique name for the model.

elenco delle definizioni di colonnacolumn definition list
Elenco delimitato da virgole contenente le definizioni delle colonne.A comma-separated list of column definitions.

algoritmoalgorithm
Nome di un algoritmo di data mining, secondo quanto definito dal provider corrente.The name of a data mining algorithm, as defined by the current provider.

Nota

Un elenco degli algoritmi supportati dal provider corrente può essere recuperato tramite set di righe DMSCHEMA_MINING_SERVICES.A list of the algorithms supported by the current provider can be retrieved by using DMSCHEMA_MINING_SERVICES Rowset. Per visualizzare gli algoritmi supportati nell'istanza corrente di Analysis ServicesAnalysis Services, vedere proprietà di Data Mining.To view the algorithms supported in the current instance of Analysis ServicesAnalysis Services, see Data Mining Properties.

elenco di parametriparameter list
Facoltativa.Optional. Elenco delimitato da virgole dei parametri definiti dal provider per l'algoritmo.A comma-separated list of provider-defined parameters for the algorithm.

Stringa XMLXML string
(Riservato agli utenti esperti). Modello con codifica XML (PMML).(For advanced use only.) An XML-encoded model (PMML). La stringa deve essere racchiusa tra virgolette singole (').The string must be enclosed in single quotation marks (').

Il sessione clausola consente di creare un modello di data mining che viene rimosso automaticamente dal server quando si chiude la connessione o la sessione scade.The SESSION clause lets you create a mining model that is automatically removed from the server when the connection closes or the session times out. SESSIONE modelli di data mining sono utili perché non richiedono che l'utente sia un amministratore del database, e utilizzano solo lo spazio su disco per fino a quando la connessione è aperta.SESSION mining models are useful because they do not require the user to be a database administrator, and they only use disk space for as long as the connection is open.

Il WITH DRILLTHROUGH clausola consente il drill-through sul nuovo modello di data mining.The WITH DRILLTHROUGH clause enables drill through on the new mining model. È possibile attivare il drill-through solo al momento della creazione del modello.Drillthrough can only be enabled when you create the model. Per alcuni tipi di modello, il drill-through è necessario per esplorare il modello nel visualizzatore personalizzato.For some model types, drillthrough is required in order to browse the model in the custom viewer. Il drill-through non è richiesto per stima o per esplorare il modello tramite Microsoft Generic Content Tree Viewer.Drillthrough is not required for prediction or for browsing the model by using the Microsoft Generic Content Tree Viewer.

Il CREATE MINING MODEL istruzione crea un nuovo modello di data mining che si basa sull'elenco delle definizioni di colonna, l'algoritmo e nell'elenco di parametri di algoritmo.The CREATE MINING MODEL statement creates a new mining model that is based on the column definition list, the algorithm, and the algorithm parameter list.

Elenco delle definizioni di colonnaColumn Definition List

Per definire la struttura di un modello che utilizza l'elenco delle definizioni di colonna, è necessario includere le informazioni seguenti per ogni colonna:You define the structure of a model that uses the column definition list by including the following information for each column:

  • Nome (obbligatorio)Name (mandatory)

  • Tipo di dati (obbligatorio)Data type (mandatory)

  • DistribuzioneDistribution

  • Elenco dei flag di modellazioneList of modeling flags

  • Tipo di contenuto (obbligatorio)Content type (mandatory)

  • Richiesta di stima, che indica l'algoritmo per stimare la colonna, indicato dal PREDICT o PREDICT_ONLY clausolaPrediction request, which indicates to the algorithm to predict this column, indicated by the PREDICT or PREDICT_ONLY clause

  • Relazione con una colonna di attributo (obbligatoria solo se applicabile), indicata dal RELATED TO clausolaRelationship to an attribute column (mandatory only if it applies), indicated by the RELATED TO clause

    Per definire una singola colonna utilizzare la sintassi seguente nell'elenco delle definizioni di colonna:Use the following syntax for the column definition list, to define a single column:

<column name>    <data type>    [<Distribution>]    [<Modeling Flags>]    <Content Type>    [<prediction>]    [<column relationship>]   

Per definire una colonna di tabella nidificata utilizzare la sintassi seguente nell'elenco delle definizioni di colonna:Use the following syntax for the column definition list, to define a nested table column:

<column name>    TABLE    [<prediction>] ( <non-table column definition list> )  

Ad eccezione dei flag di modellazione, per definire una colonna non è possibile utilizzare più di una clausola di uno stesso gruppo.Except for modeling flags, you can use no more than one clause from a particular group to define a column. È invece possibile definire più flag di modellazione per una stessa colonna.You can define multiple modeling flags for a column.

Per un elenco dei tipi di dati, dei tipi di contenuto, delle distribuzioni di colonna e dei flag di modellazione che è possibile utilizzare per definire una colonna, vedere gli argomenti seguenti:For a list of the data types, content types, column distributions, and modeling flags that you can use to define a column, see the following topics:

  • Tipi di dati ( Data Mining )Data Types (Data Mining)

  • Contenuto di Data Mining tipi ( )Content Types (Data Mining)

  • Distribuzioni delle colonne ( Data Mining )Column Distributions (Data Mining)

  • Modello di Data Mining flag ( )Modeling Flags (Data Mining)

    Per descrivere la relazione tra due colonne, è possibile aggiungere una clausola alla descrizione.You can add a clause to the statement to describe the relationship between two columns. Analysis ServicesAnalysis Servicessupporta l'utilizzo delle operazioni seguenti <relazione della colonna > clausola. supports the use of the following <Column relationship> clause.

    CORRELATI ARELATED TO
    Questa forma indica una gerarchia di valori.This form indicates a value hierarchy. La destinazione di una colonna con clausola RELATED TO può essere una colonna chiave in una tabella nidificata, una colonna con valori discreti nella riga dei case oppure un'altra colonna con una clausola RELATED TO, che indica una gerarchia con più livelli.The target of a RELATED TO column can be a key column in a nested table, a discretely-valued column in the case row, or another column with a RELATED TO clause, which indicates a deeper hierarchy.

    Per descrivere la modalità di utilizzo della colonna di stima, utilizzare una clausola di stima.Use a prediction clause to describe how the prediction column is used. Nella tabella seguente vengono descritte le due clausole disponibili.The following table describes the two possible clauses.

<stima > clausola<prediction> clause DescriptionDescription
STIMAREPREDICT Questa colonna può essere stimata dal modello e può essere specificata nei case di input per stimare il valore di altre colonne stimabili.This column can be predicted by the model, and it can be supplied in input cases to predict the value of other predictable columns.
PREDICT_ONLYPREDICT_ONLY Questa colonna può essere stimata dal modello, ma i relativi valori non possono essere utilizzati nei case di input per stimare il valore di altre colonne stimabili.This column can be predicted by the model, but its values cannot be used in input cases to predict the value of other predictable columns.

Elenco delle definizioni di parametroParameter Definition List

È possibile utilizzare l'elenco dei parametri per regolare le prestazioni e le funzionalità di un modello di data mining.You can use the parameter list to adjust the performance and functionality of a mining model. La sintassi dell'elenco dei parametri è la seguente:The syntax of the parameter list is as follows:

[<parameter> = <value>, <parameter> = <value>,…]  

Per un elenco dei parametri associati a ogni algoritmo, vedere algoritmi di Data Mining ( Analysis Services - Data Mining ) .For a list of the parameters that are associated with each algorithm, see Data Mining Algorithms (Analysis Services - Data Mining).

OsservazioniRemarks

Per creare un modello che dispone di un set di dati di testing incorporati, è necessario utilizzare l'istruzione CREATE MINING STRUCTURE seguita da ALTER MINING STRUCTURE.If you want to create a model that has a built-in testing data set, you should use the statement CREATE MINING STRUCTURE followed by ALTER MINING STRUCTURE. Tuttavia, non tutti i tipi di modello supportano un set di dati di controllo.However, not all model types support a holdout data set. Per altre informazioni, vedere CREATE MINING STRUCTURE (DMX).For more information, see CREATE MINING STRUCTURE (DMX).

Per una procedura dettagliata di come creare un modello di data mining utilizzando l'istruzione CREATEMODEL, vedere esercitazione su DMX stima serie tempo.For a walkthrough of how to create a mining model by using the CREATEMODEL statement, see Time Series Prediction DMX Tutorial.

Esempio sull'algoritmo Naive BayesNaive Bayes Example

Nell'esempio seguente viene utilizzato l'algoritmo MicrosoftMicrosoft Naive Bayes per creare un nuovo modello di data mining.The following example uses the MicrosoftMicrosoft Naive Bayes algorithm to create a new mining model. La colonna Bike Buyer è definita come attributo stimabile.The Bike Buyer column is defined as the predictable attribute.

CREATE MINING MODEL [NBSample]  
(  
    CustomerKey LONG KEY,   
    Gender TEXT DISCRETE,  
    [Number Cars Owned] LONG DISCRETE,  
    [Bike Buyer] LONG DISCRETE PREDICT  
)  
USING Microsoft_Naive_Bayes  

Esempio sul modello Association RulesAssociation Model Example

Nell'esempio seguente viene utilizzato l'algoritmo MicrosoftMicrosoft Association Rules per creare un nuovo modello di data mining.The following example uses the MicrosoftMicrosoft Association algorithm to create a new mining model. L'istruzione sfrutta la possibilità di nidificare una tabella nella definizione del modello tramite una colonna di tabella.The statement takes advantage of the ability to nest a table inside the model definition by using a table column. Il modello viene modificato utilizzando il MINIMUM_PROBABILITY e MINIMUM_SUPPORT parametri.The model is modified by using the MINIMUM_PROBABILITY and MINIMUM_SUPPORT parameters.

CREATE MINING MODEL MyAssociationModel (  
    OrderNumber TEXT KEY,  
    [Products] TABLE PREDICT (  
        [Model] TEXT KEY  
    )  
)  
USING Microsoft_Association_Rules (Minimum_Probability = 0.1, MINIMUM_SUPPORT = 0.01)  

Esempio sull'algoritmo Sequence ClusteringSequence Clustering Example

Nell'esempio seguente viene utilizzato l'algoritmo MicrosoftMicrosoft Sequence Clustering per creare un nuovo modello di data mining.The following example uses the MicrosoftMicrosoft Sequence Clustering algorithm to create a new mining model. Per definire il modello vengono utilizzate due chiavi.Two keys are used to define the model. La colonna OrderNumber viene utilizzata come chiave del case e specifica singoli ordini.The OrderNumber column is used as the case key, and specifies individual orders. La colonna LineNumber viene utilizzata come chiave della tabella nidificata e specifica la sequenza nella quale gli elementi sono aggiunti a un ordine.The LineNumber column is used as the nested table key, and specifies the sequence in which items were added to an order.

CREATE MINING MODEL BuyingSequence (  
    [Order Number] TEXT KEY,  
    [Products] TABLE   
     (  
        [Line Number] LONG KEY SEQUENCE,  
        [Model] TEXT DISCRETE PREDICT  
    )  
)  
USING Microsoft_Sequence_Clustering  

Esempio sull'algoritmo Time SeriesTime Series Example

Nell'esempio seguente viene utilizzato l'algoritmo MicrosoftMicrosoft Times Series per creare un nuovo modello di data mining utilizzando l'algoritmo ARTxp.The following example uses the MicrosoftMicrosoft Times Series algorithm to create a new mining model by using the ARTxp algorithm. ReportingDate è la colonna chiave per la serie temporale e ModelRegion è la colonna chiave per la serie di dati.ReportingDate is the key column for the time series and ModelRegion is the key column for the data series. In questo esempio si presuppone che i dati abbiano una periodicità di 12 mesi.In this example, it is assumed that the periodicity of the data is every 12 months. Pertanto, il PERIODICITY_HINT parametro è impostato su 12.Therefore, the PERIODICITY_HINT parameter is set to 12.

Nota

È necessario specificare il PERIODICITY_HINT parametro utilizzando i caratteri parentesi graffa.You must specify the PERIODICITY_HINT parameter by using brace characters. Inoltre, poiché il valore è una stringa, è necessario racchiuderlo tra virgolette singole: "{<valore numerico >}".Moreover, because the value is a string, it must be enclosed in single quotation marks: "{<numeric value>}".

CREATE MINING MODEL SalesForecast (  
        ReportingDate DATE KEY TIME,  
        ModelRegion TEXT KEY,  
        Amount LONG CONTINUOUS PREDICT,  
        Quantity LONG CONTINUOUS PREDICT  
)  
USING Microsoft_Time_Series (PERIODICITY_HINT = '{12}', FORECAST_METHOD = 'ARTXP')  

Vedere ancheSee Also

Data Mining Extensions ( DMX ) Istruzioni di definizione dei dati Data Mining Extensions (DMX) Data Definition Statements
Data Mining Extensions ( DMX ) Istruzioni di manipolazione dei dati Data Mining Extensions (DMX) Data Manipulation Statements
Data Mining Extensions ( DMX ) Riferimento istruzioneData Mining Extensions (DMX) Statement Reference