fastTrees: fastTrees

Artículo
05/23/2023

Crea una lista que contiene el nombre de la función y los argumentos para entrenar un modelo FastTree con rxEnsemble.

Uso

  fastTrees(numTrees = 100, numLeaves = 20, learningRate = 0.2,
    minSplit = 10, exampleFraction = 0.7, featureFraction = 1,
    splitFraction = 1, numBins = 255, firstUsePenalty = 0,
    gainConfLevel = 0, unbalancedSets = FALSE, trainThreads = 8,
    randomSeed = NULL, ...)

Argumentos

`numTrees`

Especifica el número total de árboles de decisión que se va a crear en el conjunto. Al crear más árboles de decisión, puede obtener una mejor cobertura, pero el tiempo de entrenamiento aumenta. El valor predeterminado es 100.

`numLeaves`

Número máximo de hojas (nodos terminales) que se pueden crear en un árbol. Valores más altos pueden aumentar el tamaño del árbol y mejorar la precisión, pero corre el riesgo de sobreajuste y de necesitar tiempos de entrenamiento más prolongados. El valor predeterminado es 20.

`learningRate`

Determina el tamaño del paso realizado en la dirección del gradiente en cada paso del proceso de aprendizaje. Esto determina la rapidez o lentitud con la que el aprendiz encuentra la solución óptima. Si el tamaño del paso es demasiado grande, puede pasar por alto la solución óptima. Si el tamaño del paso es demasiado pequeño, el entrenamiento tarda más tiempo en conseguir la mejor solución.

`minSplit`

Número mínimo de instancias de entrenamiento necesarias para formar una hoja. Es decir, el número mínimo de documentos permitidos en una hoja de un árbol de regresión, de los datos de submuestreo. Una división (split) significa que las características de cada nivel del árbol (nodo) se dividen de forma aleatoria. El valor predeterminado es 10. Solo se cuenta el número de instancias, incluso si están ponderadas.

`exampleFraction`

Fracción de instancias elegidas aleatoriamente que se usarán para cada árbol. El valor predeterminado es 0,7.

`featureFraction`

Fracción de características elegidas aleatoriamente que se usarán para cada árbol. El valor predeterminado es 1.

`splitFraction`

Fracción de características elegidas aleatoriamente que se usarán en cada división. El valor predeterminado es 1.

`numBins`

Número máximo de valores distintos (intervalos) por característica. Si la característica tiene menos valores que el número indicado, cada valor se pone en su propio rango. Si hay más valores, el algoritmo crea numBins intervalos.

`firstUsePenalty`

Coeficiente de penalización del primer uso de una característica. Es una forma de regularización que genera una penalización por usar una nueva característica al crear el árbol. Aumente este valor para crear árboles que no usen muchas características. El valor predeterminado es 0.

`gainConfLevel`

Requisito de confianza de la ganancia de ajuste del árbol (debe estar en el intervalo [0,1)). El valor predeterminado es 0.

`unbalancedSets`

Si es TRUE, se usan derivadas optimizadas para conjuntos desequilibrados. Solo es aplicable cuando type es igual a "binary". El valor predeterminado es FALSE.

`trainThreads`

Número de subprocesos que se usan en el entrenamiento. El valor predeterminado es 8.

`randomSeed`

Especifica la inicialización aleatoria. El valor predeterminado es NULL.

`...`

Argumentos adicionales.