Содержимое моделей интеллектуального анализа данных для моделей логистической регрессии

Статья
10/31/2023

Применимо к: SQL Server 2019 и более ранних версий Analysis Services Azure Analysis Services Fabric/Power BI Premium

Важно!

Интеллектуальный анализ данных не рекомендуется использовать в службах SQL Server 2017 Analysis Services, а в SQL Server 2022 Analysis Services его поддержка прекращена. Документация не обновляется для устаревших и неподдерживаемых функций. Дополнительные сведения см. в статье об обратной совместимости служб Analysis Services.

В этом разделе приведено описание содержимого модели интеллектуального анализа данных, характерного для моделей, в которых используется алгоритм логистической регрессии (Майкрософт). Объяснение того, как интерпретировать статистику и структуру, общие для всех типов моделей, а также общие определения терминов, связанных с содержимым модели интеллектуального анализа данных, см. в разделе Содержимое модели интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных).

Основные сведения о структуре модели логистической регрессии

Модель логистической регрессии создается алгоритмом нейронной сети (Майкрософт) с параметрами, которые исключают из модели скрытый узел. Таким образом, общая структура модели логистической регрессии почти идентична структуре нейронной сети: каждая модель имеет один родительский узел, представляющий модель и ее метаданные, а также специальный узел граничной статистики (NODE_TYPE = 24), который содержит описательную статистику о входных атрибутах, используемых в модели.

Кроме того, модель содержит подсеть (NODE_TYPE = 17) для каждого прогнозируемого атрибута. Как и в модели нейронной сети, каждая подсеть всегда содержит две ветви: одну для входного слоя и вторую, содержащую скрытый слой (NODE_TYPE = 19) и выходной слой (NODE_TYPE = 20), для сети. Одна подсеть может использоваться для нескольких атрибутов, если они заданы только как прогнозируемые. Прогнозируемые атрибуты, которые также являются входными, не могут использоваться в одной подсети.

Однако в модели логистической регрессии узел, представляющий скрытый слой, является пустым и не имеет потомков. Поэтому модель содержит узлы, представляющие отдельные выходы (NODE_TYPE = 23) и отдельные входы (NODE_TYPE = 21), но не содержит отдельных скрытых узлов.

Структура содержимого для модели регрессии logisitc

По умолчанию модель логистической регрессии отображается в средстве просмотра нейронных сетей (Майкрософт). С помощью этого средства просмотра можно применить фильтр по входным атрибутам и их значениям, чтобы получить графическое представление об их влиянии на выходы. Подсказки в средстве просмотра покажут вероятность и точность, связанные с каждой парой входных и выходных значений. Дополнительные сведения см. в разделе Просмотр модели с помощью средства просмотра нейронных сетей (Майкрософт).

Чтобы изучить структуру входов и подсетей, а также просмотреть подробную статистику, можно использовать средство просмотра деревьев содержимого общего вида (Майкрософт). Можно щелкнуть любой узел, чтобы развернуть его и просмотреть дочерние узлы или отобразить весовые коэффициенты и другие статистические данные, содержащиеся в узле.

Содержимое модели логистической регрессии

В этом разделе представлено подробное описание с примерами только для тех столбцов модели интеллектуального анализа данных, которые имеют отношение к логистической регрессии. Содержимое модели почти полностью идентично содержимому модели нейронной сети, но описания, применимые к моделям нейронной сети, можно для удобства повторить в этой таблице.

Сведения о столбцах общего назначения в наборе строк схемы, таких как MODEL_CATALOG и MODEL_NAME, которые не описаны здесь, или объяснение терминологии модели интеллектуального анализа данных см. в разделе Содержимое модели интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных).

MODEL_CATALOG
Имя базы данных, в которой хранится модель.

MODEL_NAME
Имя модели.

ATTRIBUTE_NAME
Имя атрибута, соответствующего этому узлу.

Узел	Содержимое
Корневой элемент модели	Пусто
Граничная статистика	Пусто
Входной слой	Пусто
Входной узел	Имя входного атрибута
скрытый слой	Пусто
Выходной слой	Пусто
Выходной узел	Имя выходного атрибута

NODE_NAME
Имя узла. В текущей версии этот столбец содержит то же значение, что и NODE_UNIQUE_NAME, но такое соответствие может измениться в следующих версиях.

NODE_UNIQUE_NAME
Уникальное имя узла.

Дополнительные сведения о структурных данных о модели, содержащихся в именах и идентификаторах, см. в разделе Использование имен и идентификаторов узлов.

NODE_TYPE
Выходными данными модели логистической регрессии являются узлы следующих типов.

Идентификатор типа узла	Описание
1	Модель.
17	Узел-организатор подсети.
18	Узел-организатор входного слоя.
19	Узел-организатор скрытого слоя. Скрытый слой является пустым.
20	Узел-организатор выходного слоя.
21	Узел входного атрибута.
23	Узел выходного атрибута.
24	Узел граничной статистики.

NODE_CAPTION
Метка или заголовок, связанный с узлом. В моделях логистической регрессии этот столбец всегда пуст.

CHILDREN_CARDINALITY
Оценка количества дочерних узлов, которые имеет данный узел.

Узел	Содержимое
Корневой элемент модели	Показывает число дочерних узлов, куда входят по крайней мере 1 сеть, 1 необходимый граничный узел и 1 необходимый входной слой. Например, если значение равно 5, то существуют 3 подсети.
Граничная статистика	Всегда равно 0.
Входной слой	Показывает число пар «входной атрибут-значение», использованных моделью.
Входной узел	Всегда равно 0.
скрытый слой	В моделях логистической регрессии значение всегда равно 0.
Выходной слой	Показывает число выходных значений.
Выходной узел	Всегда равно 0.

PARENT_UNIQUE_NAME
Уникальное имя родителя узла. Для любых узлов на корневом уровне возвращается значение NULL.

NODE_DESCRIPTION
Понятное описание узла.

Узел	Содержимое
Корневой элемент модели	Пусто
Граничная статистика	Пусто
Входной слой	Пусто
Входной узел	Имя входного атрибута
скрытый слой	Пусто
Выходной слой	Пусто
Выходной узел	Если выходной атрибут является непрерывным, этот узел содержит имя выходного атрибута. Если выходной атрибут является дискретным или дискретизированным, этот узел содержит имя и значение атрибута.

NODE_RULE
XML-описание правила, внедренного в узел.

Узел	Содержимое
Корневой элемент модели	Пусто
Граничная статистика	Пусто
Входной слой	Пусто
Входной узел	Фрагмент XML-кода, содержащий те же сведения, что и столбец NODE_DESCRIPTION.
скрытый слой	Пусто
Выходной слой	Пусто
Выходной узел	Фрагмент XML-кода, содержащий те же сведения, что и столбец NODE_DESCRIPTION.

MARGINAL_RULE
В моделях логистической регрессии этот столбец всегда пуст.

NODE_PROBABILITY
Вероятность, связанная с этим узлом. В моделях логистической регрессии значение всегда равно 0.

MARGINAL_PROBABILITY
Вероятность доступа к узлу от родительского узла. В моделях логистической регрессии значение всегда равно 0.

NODE_DISTRIBUTION
Вложенная таблица, содержащая статистические данные для узла. Подробные сведения о содержимом этой таблицы для каждого типа узла см. в разделе Основные сведения о таблице NODE_DISTRIBUTION статьи Содержимое модели интеллектуального анализа данных для моделей нейронной сети (службы Analysis Services — интеллектуальный анализ данных).

NODE_SUPPORT
В моделях логистической регрессии значение всегда равно 0.

Примечание

Вероятность несущего множества всегда равна 0, поскольку выход этой модели не является вероятностным. Для алгоритма значимыми являются только весовые коэффициенты, и поэтому алгоритм не вычисляет вероятность, несущее множество и дисперсию.

Сведения о несущем множестве в обучающих вариантах для определенных значений см. в узле граничной статистики.

MSOLAP_MODEL_COLUMN

Узел	Содержимое
Корневой элемент модели	Пусто
Граничная статистика	Пусто
Входной слой	Пусто
Входной узел	Имя входного атрибута.
скрытый слой	Пусто
Выходной слой	Пусто
Выходной узел	Имя входного атрибута.

MSOLAP_NODE_SCORE
В моделях логистической регрессии значение всегда равно 0.

MSOLAP_NODE_SHORT_CAPTION
В моделях логистической регрессии этот столбец всегда пуст.

Использование имен и идентификаторов узлов

Система именования узлов в модели логистической регрессии передает дополнительные сведения о связях между узлами в модели. В следующей таблице показаны стандартные идентификаторы, назначаемые узлам в каждом слое.

Тип узла	Стандартный идентификатор узла
Корневой элемент модели (1)	00000000000000000.
Узел граничной статистики (24)	10000000000000000
Входной слой (18)	30000000000000000
Входной узел (21)	Начинается с 60000000000000000
Подсеть (17)	20000000000000000
Скрытый слой (19)	40000000000000000
Выходной слой (20)	50000000000000000
Выходной узел (23)	Начинается с 80000000000000000

С помощью этих идентификаторов можно определить, как выходные атрибуты связаны с заданными атрибутами входного слоя. Для этого нужно просмотреть таблицу NODE_DISTRIBUTION выходного узла. Каждая строка в этой таблице содержит идентификатор, указывающий на определенный узел входного атрибута. В таблице NODE_DISTRIBUTION также содержится коэффициент для этой пары входного и выходного атрибутов.

См. также:

Алгоритм логистической регрессии (Майкрософт)
Содержимое моделей интеллектуального анализа данных для моделей нейронных сетей (службы Analysis Services — интеллектуальный анализ данных)
Примеры запросов модели логистической регрессии
техническом справочнике по алгоритму логистической регрессии (Майкрософт)