logisticRegression: logisticRegression

Статья
05/23/2023

Создает список, содержащий имя функции и аргументы, для обучения модели логистической регрессии с rxEnsemble.

Использование

  logisticRegression(l2Weight = 1, l1Weight = 1, optTol = 1e-07,
    memorySize = 20, initWtsScale = 0, maxIterations = 2147483647,
    showTrainingStats = FALSE, sgdInitTol = 0, trainThreads = NULL,
    denseOptimizer = FALSE, ...)

Аргументы

`l2Weight`

Весовой коэффициент регуляризации L2. Его значение должно быть больше или равно 0, а по умолчанию задано значение 1.

`l1Weight`

Весовой коэффициент регуляризации L1. Его значение должно быть больше или равно 0, а по умолчанию задано значение 1.

`optTol`

Пороговое значение для схождения оптимизатора. Если улучшение между итерациями меньше, чем пороговое значение, алгоритм прекращает работу и возвращает текущую модель. Чем меньше значение, тем алгоритм медленнее, но точнее. Значение по умолчанию — 1e-07.

`memorySize`

Размер памяти для алгоритма L-BFGS, указывающий число сохраняемых последних позиций и градиентов для вычисления следующего шага. Этот параметр оптимизации ограничивает объем памяти, используемый для вычисления величины и направления следующего шага. Если указано меньшее количество памяти, обучение проходит быстрее, но является менее точным. Значение должно быть больше или равно 1. Значение по умолчанию — 20.

`initWtsScale`

Задает диаметр начальных весовых коэффициентов, который определяет диапазон, из которого берутся значения для первоначальных весовых коэффициентов. Такие весовые коэффициенты инициализируются случайным образом из этого диапазона. Например, если задан диаметр d, весовые коэффициенты равномерно распределяются между -d/2 и d/2. По умолчанию ему задано значение 0. Это значит, что все весовые коэффициенты инициализируются со значением 0.

`maxIterations`

Задает максимальное число итераций. После этого числа шагов алгоритм останавливает работу, даже если критерии схождения не выполнены.

`showTrainingStats`

Укажите TRUE, чтобы отображать статистику по данным обучения и обученной модели. Если это не нужно, задайте FALSE. Значение по умолчанию — FALSE. Дополнительные сведения о статистике модели см. в статье, посвященной summary.mlModel.

`sgdInitTol`

Задайте число больше 0, чтобы использовать стохастический градиентный спуск (SGD) для поиска первоначальных параметров. Ненулевое значение указывает допуск, который используется SGD для определения схождения. Значение по умолчанию — 0 (указывает, что SGD не используется).

`trainThreads`

Число потоков для использования при обучении модели. Должно быть равно числу ядер на компьютере. Обратите внимание, что многопоточный алгоритм L-BFGS пытается загрузить набор данных в память. При возникновении проблем с нехваткой памяти задайте для trainThreads значение 1, чтобы отключить многопоточность. Если указано значение NULL, число используемых потоков будет определяться внутренне. По умолчанию используется значение NULL.

`denseOptimizer`

Если значение равно TRUE, включается принудительное уплотнение внутренних векторов оптимизации. Если значение равно FALSE, оптимизатор логистической регрессии может при необходимости использовать разреженные или уплотненные внутренние состояния. Если для denseOptimizer задать значение TRUE, внутреннему оптимизатору потребуется использовать уплотненное внутреннее состояние, что может снизить нагрузку на сборщик мусора при решении более крупных проблем.

`...`

Дополнительные аргументы.