Типы содержимого (интеллектуальный анализ данных)

Применимо к: SQL Server 2019 и более ранних версий Analysis Services Azure Analysis Services Fabric/Power BI Premium

Важно!

Интеллектуальный анализ данных не рекомендуется использовать в службах SQL Server 2017 Analysis Services, а в SQL Server 2022 Analysis Services его поддержка прекращена. Документация не обновляется для устаревших и неподдерживаемых функций. Дополнительные сведения см. в статье об обратной совместимости служб Analysis Services.

В Microsoft SQL Server SQL Server Analysis Services можно определить как физический тип данных для столбца в структуре интеллектуального анализа данных, так и логический тип контента для столбца при использовании в модели.

Тип данных определяет обработку данных алгоритмами в этих столбцах при создании моделей интеллектуального анализа данных. Определение типа данных столбца дает алгоритму сведения о типе данных в столбцах и о способах обработки данных. Каждый тип данных в SQL Server Analysis Services поддерживает один или несколько типов контента для интеллектуального анализа данных.

Тип содержимого описывает поведение содержимого столбца. Например, если содержимое столбцов повторяется с некоторой периодичностью, например дни недели, можно выбрать тип Cyclical.

Чтобы определенные алгоритмы могли правильно функционировать, требуется применение конкретных типов данных и типов содержимого. Например, упрощенный алгоритм Байеса (Майкрософт) не в состоянии использовать непрерывные столбцы на входе или не может прогнозировать непрерывные значения. Некоторые типы содержимого, например Key Sequence, используются только определенными алгоритмами. Список алгоритмов и типов контента, поддерживаемых каждым из них, см. в разделе Алгоритмы интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных).

Следующий список содержит типы содержимого, используемого в интеллектуальном анализе данных, и типы данных, которые их поддерживают.

Discrete

Дискретный означает, что столбец содержит конечное количество значений без континуума между значениями. Например, столбец с обозначением пола представляет собой типичный столбец для дискретного атрибута, в котором данные представляют конкретное количество категорий.

Из того, что значения содержатся в столбце с дискретным атрибутом, следует, что к этим значениям не применимо упорядочение, даже если значения являются числовыми. Более того, даже если значения, используемые для заполнения дискретного столбца, являются числовыми, не предусмотрена возможность вычисления дробных значений. Хорошим примером дискретных числовых данных являются междугородние телефонные коды.

Тип содержимого Discrete поддерживается всеми типами данных интеллектуального анализа данных.

С задержкой

Непрерывный означает, что столбец содержит значения, которые представляют числовые данные в масштабе, допускающем промежуточные значения. В отличие от дискретного столбца, содержащего конечные, счетные данные, непрерывный столбец представляет данные измерений и может содержать бесконечное количество дробных значений. Примером столбца непрерывного атрибута может служить столбец с данными о температуре.

Если столбец содержит непрерывные числовые данные и эти данные должны быть распределены, можно улучшить точность анализа, указав ожидаемое распределение значений. Распределение столбцов задается на уровне структуры интеллектуального анализа данных. Таким образом, параметр применяется ко всем моделям, основанным на структуре. Дополнительные сведения см. в разделе Распределение столбцов (интеллектуальный анализ данных).

Тип содержимого Continuous поддерживается следующими типами данных: Date, Doubleи Long.

Дискретизированный

Дискретизация — это процесс размещения значений из непрерывного набора данных по сегментам в целях ограничения количества возможных значений. Дискретизировать можно только числовые данные.

Таким образом, дискретизированный тип содержимого указывает, что столбец содержит значения, представляющие группы или сегменты значений, производных от непрерывного столбца. Контейнеры воспринимаются как упорядоченные дискретные значения.

Дискретизацию данных можно провести вручную, чтобы получить необходимые сегменты, либо можно использовать методы дискретизации, предоставляемые службами SQL Server Analysis Services. В некоторых алгоритмах дискретизация выполняется автоматически. Дополнительные сведения см. в разделе Изменение дискретизации столбца в модели интеллектуального анализа данных.

Тип содержимого Discretized поддерживается следующими типами данных: Date, Double, Longи Text.

Ключ

Тип содержимого ключ означает, что столбец однозначно определяет строку. В таблице вариантов ключевым столбцом, как правило, является столбец с числовым или текстовым идентификатором. Тип содержимого key указывает, что этот столбец должен использоваться не для анализа, а лишь для отслеживания записей.

Вложенные таблицы также имеют ключи, но ключ вложенной таблицы предназначен для других целей. Если столбец вложенной таблицы представляет собой атрибут, который должен быть проанализирован, то для него следует определить тип содержимого key . Значения в ключе вложенной таблицы должны быть уникальными для каждого варианта, но во всем множестве вариантов могут быть повторяющиеся значения.

Например, если анализируются продукты, приобретенные клиентами, то для столбца CustomerID в таблице вариантов нужно задать тип содержимого key и задать тип содержимого key для столбца PurchasedProducts во вложенной таблице.

Примечание

Вложенные таблицы становятся доступными, только если используются данные из внешнего источника данных, который был определен как представление источника данных для служб Analysis Services.

Этот тип содержимого поддерживается следующими типами данных: Date, Double, Longи Text.

Ключевая последовательность

Тип содержимого ключевая последовательность можно использовать только в модели кластеризации последовательностей. Если задан тип содержимого key sequence, значит, столбец содержит значения, представляющие последовательность событий. Значения упорядочены, но не должны обязательно находиться на одинаковом расстоянии друг от друга.

Данный тип содержимого поддерживается следующими типами данных: Double, Long, Textи Date.

Ключевой столбец времени

Тип содержимого ключевое время можно использовать только в моделях временных рядов. Задание типа содержимого key timeуказывает на то, что значения упорядочены и представляют масштаб времени.

Данный тип содержимого поддерживается следующими типами данных: Double, Longи Date.

Таблица

Тип содержимого таблица указывает, что столбец содержит другую таблицу данных с одним или несколькими столбцами и одной или несколькими строками. Применительно к любой конкретной строке в таблице вариантов этот столбец может содержать несколько значений, причем все они связаны с записью родительского варианта. Например, если основная таблица вариантов содержит список клиентов, то можно предусмотреть несколько столбцов, содержащих вложенные таблицы, например, столбец ProductsPurchased , в котором вложенная таблица перечисляет продукты, приобретенные этим клиентом в прошлом, а столбец Hobbies содержит перечень увлечений клиента.

Типом данных этого столбца всегда является Table.

Циклический

Тип содержимого циклический означает, что столбец содержит значения, представляющие циклический упорядоченный набор. Например, циклическим упорядоченным набором являются пронумерованные дни недели, поскольку день с номером 1 следует за днем с номером 7.

Циклические столбцы атрибутов считаются упорядоченными и дискретными в терминах типов содержимого.

Этот тип контента поддерживается всеми типами данных интеллектуального анализа данных в SQL Server Analysis Services. Однако большинство алгоритмов обрабатывает циклические значения как дискретные и не выполняет особой обработки.

Заказано

Тип содержимого упорядоченный также указывает, что столбец содержит значения, определяющие последовательность или порядок. Однако из того, что в этом типе содержимого для упорядочения применяются значения, не следует, что между значениями в наборе определены какие-либо связи, выражающие расстояния или величины. Например, если упорядоченный столбец атрибутов содержит сведения об уровне квалификации по шкале от 1 до 5, он не несет сведений о разнице между уровнями квалификации; уровень 5 не обязательно в пять раз лучше уровня 1.

Упорядоченные столбцы атрибутов считаются дискретными в терминах типов содержимого.

Этот тип контента поддерживается всеми типами данных интеллектуального анализа данных в SQL Server Analysis Services. Однако большинство алгоритмов обрабатывает упорядоченные значения как дискретные и не выполняет особой обработки.

Classified

Выше были описаны типы содержимого, широко применяемые во всех моделях, но, кроме них, для данных некоторых типов могут использоваться классифицированные столбцы, позволяющие определять типы содержимого. Дополнительные сведения о классифицированных столбцах см. в разделе Классифицированные столбцы (интеллектуальный анализ данных).

См. также:

Типы содержимого (расширения интеллектуального анализа данных)
Типы данных (интеллектуальный анализ данных)
Типы данных (расширения интеллектуального анализа данных)
изменить свойства структуры интеллектуального анализа данных
Столбцы структуры интеллектуального анализа данных