Algoritmo Microsoft Linear RegressionMicrosoft Linear Regression Algorithm

Si applica a: yesSQL Server Analysis Services alcunAzure Analysis ServicesAPPLIES TO: yesSQL Server Analysis Services noAzure Analysis Services

L'algoritmo MicrosoftMicrosoft Linear Regression è una variante dell'algoritmo MicrosoftMicrosoft Decision Trees che consente di calcolare una relazione lineare tra una variabile dipendente e indipendente e quindi di usare tale relazione per la stima.The MicrosoftMicrosoft Linear Regression algorithm is a variation of the MicrosoftMicrosoft Decision Trees algorithm that helps you calculate a linear relationship between a dependent and independent variable, and then use that relationship for prediction.

La relazione assume la forma di un'equazione relativa alla linea che rappresenta meglio una serie di dati.The relationship takes the form of an equation for a line that best represents a series of data. Ad esempio, la linea contenuta nel diagramma seguente è la migliore rappresentazione lineare possibile dei dati.For example, the line in the following diagram is the best possible linear representation of the data.

Una riga che modella un set di datiA line that models a set of data

A ogni punto dati del diagramma corrisponde un errore associato alla relativa distanza dalla retta di regressione.Each data point in the diagram has an error associated with its distance from the regression line. I coefficienti a e b dell'equazione di regressione regolano l'angolo e la posizione della retta di regressione.The coefficients a and b in the regression equation adjust the angle and location of the regression line. È possibile ottenere l'equazione di regressione modificando i coefficienti a e b fino a quando la somma degli errori associati a tutti i punti raggiunge il minimo.You can obtain the regression equation by adjusting a and b until the sum of the errors that are associated with all the points reaches its minimum.

Sono disponibili altri tipi di regressione che utilizzano più variabili, nonché metodi di regressione non lineari,There are other kinds of regression that use multiple variables, and also nonlinear methods of regression. tuttavia la regressione lineare è un metodo utile e noto per la modellazione della risposta a una modifica in alcuni fattori sottostanti.However, linear regression is a useful and well-known method for modeling a response to a change in some underlying factor.

EsempioExample

Tale tipo di regressione consente di determinare una relazione tra due colonne continue.You can use linear regression to determine a relationship between two continuous columns. È possibile ad esempio utilizzare la regressione lineare per calcolare una linea di tendenza da dati di produzione o di vendita.For example, you can use linear regression to compute a trend line from manufacturing or sales data. La regressione lineare può inoltre essere utilizzata come precursore dello sviluppo di modelli di data mining più complessi, per valutare le relazioni tra colonne di dati.You could also use the linear regression as a precursor to development of more complex data mining models, to assess the relationships among data columns.

Sebbene diversi metodi disponibili per calcolare la regressione lineare non richiedano strumenti di data mining, il vantaggio garantito dall'uso dell'algoritmo MicrosoftMicrosoft Linear Regression per questa attività è rappresentato dal fatto che tutte le possibili relazioni tra le variabili vengono calcolate e testate automaticamente.Although there are many ways to compute linear regression that do not require data mining tools, the advantage of using the MicrosoftMicrosoft Linear Regression algorithm for this task is that all the possible relationships among the variables are automatically computed and tested. Non è necessario selezionare un metodo di calcolo, ad esempio la risoluzione per i minimi quadrati.You do not have to select a computation method, such as solving for least squares. La regressione lineare potrebbe tuttavia semplificare eccessivamente le relazioni in scenari in cui sul risultato influiscono più fattori.However, linear regression might oversimplify the relationships in scenarios where multiple factors affect the outcome.

Funzionamento dell'algoritmoHow the Algorithm Works

L'algoritmo MicrosoftMicrosoft Linear Regression è una variante dell'algoritmo MicrosoftMicrosoft Decision Trees.The MicrosoftMicrosoft Linear Regression algorithm is a variation of the MicrosoftMicrosoft Decision Trees algorithm. Quando si seleziona l'algoritmo MicrosoftMicrosoft Linear Regression, viene richiamato un tipo di algoritmo MicrosoftMicrosoft Decision Trees speciale, con parametri che vincolano il comportamento dell'algoritmo e richiedono determinati tipi di dati di input.When you select the MicrosoftMicrosoft Linear Regression algorithm, a special case of the MicrosoftMicrosoft Decision Trees algorithm is invoked, with parameters that constrain the behavior of the algorithm and require certain input data types. In un modello di regressione lineare, inoltre, per calcolare le relazioni nella sessione iniziale viene utilizzato tutto il set di dati, mentre con un modello di albero delle decisioni standard i dati vengono suddivisi ripetutamente in subset o alberi minori.Moreover, in a linear regression model, the whole data set is used for computing relationships in the initial pass, whereas a standard decision trees model splits the data repeatedly into smaller subsets or trees.

Dati necessari per i modelli di regressione lineareData Required for Linear Regression Models

Per preparare i dati da utilizzare in un modello di regressione lineare è necessario comprendere i requisiti dell'algoritmo,When you prepare data for use in a linear regression model, you should understand the requirements for the particular algorithm. tra cui la quantità di dati necessaria e la modalità di utilizzo dei dati.This includes how much data is needed, and how the data is used. I requisiti di questo tipo di modello sono i seguenti:The requirements for this model type are as follows:

  • Una colonna a chiave singola Ogni modello deve contenere una colonna numerica o di testo che identifichi in modo univoco ogni record.A single key column Each model must contain one numeric or text column that uniquely identifies each record. Le chiavi composte non sono consentite.Compound keys are not permitted.

  • Una colonna stimabile Richiede almeno una colonna stimabile.A predictable column Requires at least one predictable column. È possibile includere più attributi stimabili in un modello, ma tali attributi devono essere tipi di dati numerici continui.You can include multiple predictable attributes in a model, but the predictable attributes must be continuous numeric data types. Non è possibile utilizzare un tipo di dati datetime come attributo stimabile anche se l'archiviazione nativa dei dati è numerica.You cannot use a datetime data type as a predictable attribute even if the native storage for the data is numeric.

  • Colonne di input Le colonne di input devono contenere dati numerici continui ed essere associate al tipo di dati appropriato.Input columns Input columns must contain continuous numeric data and be assigned the appropriate data type.

    Per altre informazioni, vedere la sezione Requisiti in Riferimento tecnico per l'algoritmo Microsoft Linear Regression.For more information, see the Requirements section of Microsoft Linear Regression Algorithm Technical Reference.

Visualizzazione di un modello di regressione lineareViewing a Linear Regression Model

Per esplorare il modello, è possibile usare il Visualizzatore Microsoft Decision Trees.To explore the model, you use the Microsoft Tree Viewer. La struttura ad albero per un modello di regressione lineare è molto semplice, in quanto tutte le informazioni sull'equazione di regressione sono contenute in un solo nodo.The tree structure for a linear regression model is very simple, with all the information about the regression equation contained in a single node. Per altre informazioni, vedere Visualizzare un modello usando il Visualizzatore Microsoft Decision Trees.For more information, see Browse a Model Using the Microsoft Tree Viewer.

Per ulteriori dettagli sull'equazione, è anche possibile visualizzare i coefficienti e altri dettagli tramite Microsoft Generic Content Tree Viewer.If you want to know more detail about the equation, you can also view the coefficients and other details by using the Microsoft Generic Content Tree Viewer.

Per un modello di regressione lineare, il contenuto del modello include metadati, la formula di regressione e statistiche sulla distribuzione dei valori di input.For a linear regression model, the model content includes metadata, the regression formula, and statistics about the distribution of input values. Per altre informazioni, vedere Contenuto dei modelli di data mining per i modelli di regressione lineare (Analysis Services - Data mining).For more information, see Mining Model Content for Linear Regression Models (Analysis Services - Data Mining).

Creazione di stimeCreating Predictions

Dopo l'elaborazione del modello, i risultati vengono archiviati come set di statistiche con la formula di regressione lineare che è possibile utilizzare per calcolare tendenze future.After the model has been processed, the results are stored as a set of statistics together with the linear regression formula, which you can use to compute future trends. Per esempi di query da usare con un modello di regressione lineare, vedere Esempi di query sul modello di regressione lineare.For examples of queries to use with a linear regression model, see Linear Regression Model Query Examples.

Per informazioni generali sulla creazione di query in base ai modelli di data mining, vedere Query di data mining.For general information about how to create queries against mining models, see Data Mining Queries.

Selezionando l'algoritmo MicrosoftMicrosoft Linear Regression, se l'attributo stimabile è un tipo di dati numerico continuo, oltre a creare un modello di regressione lineare, è possibile creare un modello di albero delle decisioni che contenga regressioni.In addition to creating a linear regression model by selecting the MicrosoftMicrosoft Linear Regression algorithm, if the predictable attribute is a continuous numeric data type, you can create a decision tree model that contains regressions. In questo caso, l'algoritmo suddividerà i dati quando rileverà punti di separazione appropriati, ma per alcune aree di dati creerà una formula di regressione.In this case, the algorithm will split the data when it finds appropriate separation points, but for some regions of data, will create a regression formula instead. Per altre informazioni sugli alberi di regressione con un modello di albero delle decisioni, vedere Contenuto dei modelli di data mining per i modelli di albero delle decisioni (Analysis Services - Data mining).For more information about regression trees within a decision trees model, see Mining Model Content for Decision Tree Models (Analysis Services - Data Mining).

OsservazioniRemarks

  • Non supporta l'utilizzo del linguaggio PMML (Predictive Model Markup Language) per la creazione di modelli di data mining.Does not support the use of Predictive Model Markup Language (PMML) to create mining models.

  • Non supporta la creazione di dimensioni di data mining.Does not support the creation of data mining dimensions.

  • Supporta il drill-through.Supports drillthrough.

  • Supporta l'utilizzo di modelli di data mining OLAP.Supports the use of OLAP mining models.

Vedere ancheSee Also

Algoritmi di Data Mining & #40; Analysis Services - Data Mining & #41; Data Mining Algorithms (Analysis Services - Data Mining)
Riferimento tecnico l'algoritmo Microsoft Linear Regression Microsoft Linear Regression Algorithm Technical Reference
Esempi di Query del modello di regressione lineare Linear Regression Model Query Examples
Contenuto del modello di data mining per i modelli di regressione lineare & #40; Analysis Services - Data Mining & #41;Mining Model Content for Linear Regression Models (Analysis Services - Data Mining)