fastLinear: fastLinear

Cria uma lista que contém o nome e os argumentos da função para treinar um modelo Linear Rápido com rxEnsemble.

Uso

  fastLinear(lossFunction = NULL, l2Weight = NULL, l1Weight = NULL,
    trainThreads = NULL, convergenceTolerance = 0.1, maxIterations = NULL,
    shuffle = TRUE, checkFrequency = NULL, ...)
 

Argumentos

lossFunction

Especifica a função de perda empírica a ser otimizada. Para classificação binária, as seguintes opções estão disponíveis:

  • logLoss: a perda de log. Esse é o padrão.
  • hingeLoss: a perda de dobradiça do SVM. O respectivo parâmetro representa o tamanho da margem.
  • smoothHingeLoss: a perda de dobradiça suavizada. O respectivo parâmetro representa a constante de suavização.
    Para a regressão linear, no momento há suporte para a perda quadrática squaredLoss. Quando esse parâmetro é definido como NULL, o valor padrão depende do tipo de aprendizado:
  • logLoss para classificação binária.
  • squaredLoss para regressão linear.

l2Weight

Especifica o peso de regularização de L2. O valor precisa ser não negativo ou NULL. Se NULL for especificado, o valor real será computado automaticamente com base no conjunto de dados. NULL é o valor padrão.

l1Weight

Especifica o peso de regularização de L1. O valor precisa ser não negativo ou NULL. Se NULL for especificado, o valor real será computado automaticamente com base no conjunto de dados. NULL é o valor padrão.

trainThreads

Especifica quantos threads simultâneos podem ser usados para executar o algoritmo. Quando esse parâmetro é definido como NULL, o número de threads usados é determinado com base no número de processadores lógicos disponíveis para o processo, bem como pela dispersão de dados. Defina-o como 1 para executar o algoritmo em um só thread.

convergenceTolerance

Especifica o limite de tolerância usado como um critério de convergência. Ele precisa estar entre 0 e 1. O valor padrão é 0.1. O algoritmo é considerado convergido quando a lacuna de dualidade relativa, que é a proporção entre a lacuna de dualidade e a perda primária, cai abaixo da tolerância de convergência especificada.

maxIterations

Especifica um limite superior no número de iterações de treinamento. Esse parâmetro precisa ser positivo ou NULL. Se NULL for especificado, o valor real será computado automaticamente com base no conjunto de dados. Cada iteração exige uma passagem completa nos dados de treinamento. O treinamento é encerrado depois que ocorre uma das duas opções: o número total de iterações atinge o limite superior especificado ou a função de perda é convergida.

shuffle

Especifica se os dados de treinamento devem ser embaralhados. Defina TRUE para embaralhar os dados e FALSE para não os embaralhar. O valor padrão é TRUE. O SDCA é um algoritmo estocástico de otimização. Quando o embaralhamento está ativado, os dados de treinamento são embaralhados em cada iteração.

checkFrequency

O número de iterações após o qual a função de perda é computada e verificada para determinar se ela foi convergida. O valor especificado precisa ser um inteiro positivo ou NULL. Se for NULL, o valor real será computado automaticamente com base no conjunto de dados. Caso contrário, por exemplo, se checkFrequency = 5 for especificado, a função de perda será computada e a convergência será verificada a cada cinco iterações. A computação da função de perda exige uma passagem completa separada nos dados de treinamento.

...

Argumentos adicionais.