Поделиться через


Распределения столбцов (интеллектуальный анализ данных)

В службах Microsoft SQL Server Службы Analysis Services можно определить распределения столбцов в структуре интеллектуального анализа данных, чтобы влиять на то, как алгоритмы обрабатывают данные в этих столбцах при создании моделей интеллектуального анализа данных. В некоторых алгоритмах лучше задавать распределение для всех столбцов, содержащих непрерывные данные, до начала обработки модели в случае, если указанные столбцы содержат общие распределения значений. Если распределения не заданы, то получившиеся модели интеллектуального анализа данных могут предоставлять менее точные прогнозы, чем с заданными распределениями, поскольку у алгоритмов будет меньший объем сведений, из которых можно интерпретировать данные.

Алгоритмы, доступные в службах Службы Analysis Services, поддерживают следующие типы распределения.

  • Normal
    Значения для непрерывного столбца формируют гистограмму с нормальным распределением.

    Гистограмма с нормальным распределением

  • Log Normal
    Значения для непрерывного столбца формируют гистограмму, вытянутую в верхнем конце и скошенную в нижнем конце.

    Гистограмма с логарифмически нормальным распределением

  • Uniform
    Значения непрерывного столбца формируют пологую кривую, в которой все значения являются равновероятными.

    Гистограмма с равномерным распределением

Дополнительные сведения об алгоритмах служб Службы Analysis Services см. в разделе Алгоритмы интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных).

См. также

Справочник

Распределения (расширения интеллектуального анализа данных)

Основные понятия

Типы содержимого (интеллектуальный анализ данных)

Структуры интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных)

Методы дискретизации (Интеллектуальный анализ данных)

Столбцы структуры интеллектуального анализа данных