summary.mlModel: resumo de um modelo de Machine Learning do Microsoft R.

Resumo de um modelo de Machine Learning do Microsoft R.

Uso

 ## S3 method for class `mlModel':
summary  (object, top = 20, ...)

Argumentos

object

Um objeto de modelo retornado de uma análise do MicrosoftML.

top

Especifica a contagem de coeficientes principais a mostrar no resumo para modelos lineares, como rxLogisticRegression e rxFastLinear. O desvio aparece primeiro, seguido por outros pesos, classificado por seus valores absolutos em ordem decrescente. Se definido como NULL, todos os coeficientes diferentes de zero serão mostrados. Caso contrário, somente os top primeiros coeficientes serão mostrados.

...

Argumentos adicionais a serem transmitidos para o método de resumo.

Detalhes

Fornece informações resumidas sobre a chamada de função original, o
conjunto de dados usado para treinar o modelo e estatísticas para coeficientes no modelo.

Valor

O método summary dos objetos de análise do MicrosoftML retorna uma lista que inclui a chamada de função original e os parâmetros subjacentes usados. O método coef retorna um vetor de pesos nomeado, processando informações do objeto de modelo.

Para rxLogisticRegression, as estatísticas a seguir também podem estar presentes no resumo quando showTrainingStats é definido como TRUE.

training.size

O tamanho, em termos de contagem de linhas, do conjunto de dados usado para treinar o modelo.

deviance

O desvio de modelo é fornecido por -2 * ln(L) em que L é a probabilidade de obter as observações com todos os recursos incorporados no modelo.

null.deviance

O desvio nulo é fornecido por -2 * ln(L0) em que L0 é a probabilidade de obter as observações sem efeitos dos recursos. O modelo nulo incluirá o desvio se houver um no modelo.

aic

O AIC (critério de informações do Akaike) é definido como 2 * k ``+ deviance, em que k é o número de coeficientes do modelo. O desvio conta como um dos coeficientes. O AIC é uma medida da qualidade relativa do modelo. Ele lida com a compensação entre a qualidade de adequação do modelo (medida por desvio) e a complexidade do modelo (medida pelo número de coeficientes).

coefficients.stats

Essa é uma estrutura de dados que contém as estatísticas de cada coeficiente no modelo. Para cada coeficiente, as estatísticas a seguir são mostradas. O desvio aparece na primeira linha, e os coeficientes restantes na ordem crescente de valor-P.

  • Estimate O valor estimado do coeficiente do modelo.
  • Std Error A raiz quadrada da variação de amostra grande da estimativa do coeficiente.
  • z-Score Podemos testar em relação à hipótese nula, que declara que o coeficiente deve ser zero, com relação à significância do coeficiente calculando a proporção de sua estimativa e seu erro padrão. Sob a hipótese nula, se não houver nenhuma regularização aplicada, a estimativa do coeficiente relacionado seguirá uma distribuição normal com média 0 e um desvio padrão igual ao erro padrão calculado acima. A pontuação z gera a proporção entre a estimativa de um coeficiente e o erro padrão do coeficiente.
  • Pr(>|z|) Esse é o valor-P correspondente para o teste de dois lados da pontuação z. Com base no nível de significância, um indicador de significância é anexado ao valor-P. Se F(x) for o CDF da distribuição normal padrão N(0, 1), então P(>|z|) = 2 - ``2 * F(|z|).

Autor(es)

Microsoft Corporation Microsoft Technical Support

Confira também

rxFastTrees, rxFastForest, rxFastLinear, rxOneClassSvm, rxNeuralNet, rxLogisticRegression.

Exemplos


 # Estimate a logistic regression model
 logitModel <- rxLogisticRegression(isCase ~ age + parity + education + spontaneous + induced,
                   transforms = list(isCase = case == 1),
                   data = infert)
 # Print a summary of the model
 summary(logitModel)

 # Score to a data frame
 scoreDF <- rxPredict(logitModel, data = infert, 
     extraVarsToWrite = "isCase")

 # Compute and plot the Radio Operator Curve and AUC
 roc1 <- rxRoc(actualVarName = "isCase", predVarNames = "Probability", data = scoreDF) 
 plot(roc1)
 rxAuc(roc1)

 #######################################################################################
 # Multi-class logistic regression  
 testObs <- rnorm(nrow(iris)) > 0
 testIris <- iris[testObs,]
 trainIris <- iris[!testObs,]
 multiLogit <- rxLogisticRegression(
     formula = Species~Sepal.Length + Sepal.Width + Petal.Length + Petal.Width,
     type = "multiClass", data = trainIris)

 # Score the model
 scoreMultiDF <- rxPredict(multiLogit, data = testIris, 
     extraVarsToWrite = "Species")    
 # Print the first rows of the data frame with scores
 head(scoreMultiDF)
 # Look at confusion matrix
 table(scoreMultiDF$Species, scoreMultiDF$PredictedLabel)

 # Look at the observations with incorrect predictions
 badPrediction = scoreMultiDF$Species != scoreMultiDF$PredictedLabel
 scoreMultiDF[badPrediction,]