logisticRegression: logisticRegression

Создает список, содержащий имя функции и аргументы, для обучения модели логистической регрессии с rxEnsemble.

Использование

  logisticRegression(l2Weight = 1, l1Weight = 1, optTol = 1e-07,
    memorySize = 20, initWtsScale = 0, maxIterations = 2147483647,
    showTrainingStats = FALSE, sgdInitTol = 0, trainThreads = NULL,
    denseOptimizer = FALSE, ...)
 

Аргументы

l2Weight

Весовой коэффициент регуляризации L2. Его значение должно быть больше или равно 0, а по умолчанию задано значение 1.

l1Weight

Весовой коэффициент регуляризации L1. Его значение должно быть больше или равно 0, а по умолчанию задано значение 1.

optTol

Пороговое значение для схождения оптимизатора. Если улучшение между итерациями меньше, чем пороговое значение, алгоритм прекращает работу и возвращает текущую модель. Чем меньше значение, тем алгоритм медленнее, но точнее. Значение по умолчанию — 1e-07.

memorySize

Размер памяти для алгоритма L-BFGS, указывающий число сохраняемых последних позиций и градиентов для вычисления следующего шага. Этот параметр оптимизации ограничивает объем памяти, используемый для вычисления величины и направления следующего шага. Если указано меньшее количество памяти, обучение проходит быстрее, но является менее точным. Значение должно быть больше или равно 1. Значение по умолчанию — 20.

initWtsScale

Задает диаметр начальных весовых коэффициентов, который определяет диапазон, из которого берутся значения для первоначальных весовых коэффициентов. Такие весовые коэффициенты инициализируются случайным образом из этого диапазона. Например, если задан диаметр d, весовые коэффициенты равномерно распределяются между -d/2 и d/2. По умолчанию ему задано значение 0. Это значит, что все весовые коэффициенты инициализируются со значением 0.

maxIterations

Задает максимальное число итераций. После этого числа шагов алгоритм останавливает работу, даже если критерии схождения не выполнены.

showTrainingStats

Укажите TRUE, чтобы отображать статистику по данным обучения и обученной модели. Если это не нужно, задайте FALSE. Значение по умолчанию — FALSE. Дополнительные сведения о статистике модели см. в статье, посвященной summary.mlModel.

sgdInitTol

Задайте число больше 0, чтобы использовать стохастический градиентный спуск (SGD) для поиска первоначальных параметров. Ненулевое значение указывает допуск, который используется SGD для определения схождения. Значение по умолчанию — 0 (указывает, что SGD не используется).

trainThreads

Число потоков для использования при обучении модели. Должно быть равно числу ядер на компьютере. Обратите внимание, что многопоточный алгоритм L-BFGS пытается загрузить набор данных в память. При возникновении проблем с нехваткой памяти задайте для trainThreads значение 1, чтобы отключить многопоточность. Если указано значение NULL, число используемых потоков будет определяться внутренне. По умолчанию используется значение NULL.

denseOptimizer

Если значение равно TRUE, включается принудительное уплотнение внутренних векторов оптимизации. Если значение равно FALSE, оптимизатор логистической регрессии может при необходимости использовать разреженные или уплотненные внутренние состояния. Если для denseOptimizer задать значение TRUE, внутреннему оптимизатору потребуется использовать уплотненное внутреннее состояние, что может снизить нагрузку на сборщик мусора при решении более крупных проблем.

...

Дополнительные аргументы.