FastTreeRankingFeaturizationEstimator Класс

Определение

Объект IEstimator<TTransformer> для преобразования вектора входных признаков в признаки на основе дерева.

public sealed class FastTreeRankingFeaturizationEstimator : Microsoft.ML.Trainers.FastTree.TreeEnsembleFeaturizationEstimatorBase
type FastTreeRankingFeaturizationEstimator = class
    inherit TreeEnsembleFeaturizationEstimatorBase
Public NotInheritable Class FastTreeRankingFeaturizationEstimator
Inherits TreeEnsembleFeaturizationEstimatorBase
Наследование
FastTreeRankingFeaturizationEstimator

Комментарии

Входные и выходные столбцы

Входные данные метки должны иметь тип key или Single. Значение метки определяет релевантность, где более высокие значения означают более высокую степень релевантности. Если метка имеет тип key, индексом ключа будет значение релевантности, где наименьший индекс является минимально релевантным. Если метка имеет тип Single, более высокие значения означают более высокую степень релевантности. Столбец признаков должен иметь известный размер вектора , а столбец входной группы строк — ключевогоSingle типа.

Этот оценщик выводит следующие столбцы:

Имя выходного столбца Тип столбца Описание
Trees Известный размер вектора Single Выходные значения всех деревьев. Его размер идентичен общему количеству деревьев в модели ансамбля деревьев.
Leaves Известный размер вектора Single Векторное представление от 0 до 1 для идентификаторов всех листьев, в которые попадает вектор входных признаков. Его размер — это количество общих листьев в модели ансамбля дерева.
Paths Известный размер вектора Single Векторное представление от 0 до 1 для путей, через которые вектор входных признаков прошел для достижения листьев. Его размер — это количество неконечных узлов в модели ансамбля дерева.

Эти выходные столбцы являются необязательными, и пользователь может изменить свои имена. Присвойте имена пропущенным столбцам значение NULL, чтобы они не были созданы.

Сведения о прогнозе

Этот оценщик создает несколько выходных столбцов из модели ансамбля дерева. Предположим, что модель содержит только одно дерево принятия решений:

               Node 0
               /    \
             /        \
           /            \
         /                \
       Node 1            Node 2
       /    \            /    \
     /        \        /        \
   /            \     Leaf -3  Node 3
  Leaf -1      Leaf -2         /    \
                             /        \
                            Leaf -4  Leaf -5

Предположим, что вектор входной функции попадает в Leaf -1. Выходные данные Trees могут быть вектором из 1 элемента, где единственным значением является значение принятия решения, перевозимое .Leaf -1 Выходные данные Leaves — вектор от 0 до 1. Если достигнутый лист является $i$-й (индексируется по $-(i+1)$, поэтому первый лист является Leaf -1) в дереве, $i$-й значение в Leaves будет равно 1, а все остальные значения будут равны 0. Выходные данные Paths представляют собой 0–1-е представление узлов, передаваемых до достижения конечной части. Элемент $i$th в Paths указывает, касается ли узел $i$-й (индексируется по $i$). Например, достижение Leaf -1 параметра привести к $[1, 1, 0, 0]$ в Pathsкачестве . Если деревьев несколько, этот оценщик просто сцепляет Trees's, Leaves's, Paths's из всех деревьев (информация первого дерева приходит первым в сцепленных векторах).

Ссылки на примеры использования см. в разделе См. также.

Методы

Fit(IDataView)

Создает объект , TreeEnsembleModelParameters который сопоставляет вызываемые InputColumnName столбцы с input тремя выходными столбцами.

(Унаследовано от TreeEnsembleFeaturizationEstimatorBase)
GetOutputSchema(SchemaShape)

PretrainedTreeFeaturizationEstimator добавляет три столбца с плавающей векторной точкой в inputSchema. При наличии столбца вектора признаков добавленные столбцы являются прогнозируемыми значениями всех деревьев, идентификаторами листов, в которые попадает вектор признаков, и путями к этим листьям.

(Унаследовано от TreeEnsembleFeaturizationEstimatorBase)

Методы расширения

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

Добавьте контрольную точку кэширования в цепочку оценщика. Это гарантирует, что подчиненные оценщики будут обучены на основе кэшированных данных. Полезно иметь контрольную точку кэширования перед инструкторами, которые принимают несколько проходов данных.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

Учитывая оценщик, верните объект-оболочку, который будет вызывать делегат после Fit(IDataView) вызова . Оценщику часто важно возвращать сведения о том, что подходит, поэтому Fit(IDataView) метод возвращает объект конкретного типа, а не просто общий ITransformer. Однако, в то же время, IEstimator<TTransformer> часто формируются в конвейеры с большим количеством объектов, поэтому нам может потребоваться построить цепочку оценщиков, где EstimatorChain<TLastTransformer> оценщик, для которого мы хотим получить преобразователь, похоронен где-то в этой цепочке. Для этого сценария с помощью этого метода можно подключить делегат, который будет вызываться после вызова fit.

Применяется к

См. также раздел