Изучение модели прогнозирования (учебник по интеллектуальному анализу данных — средний уровень)

После создания модели интеллектуального анализа для прогнозирования полученные результаты можно изучить с помощью вкладки Средство просмотра моделей интеллектуального анализа данных конструктора интеллектуального анализа данных. Средство просмотра временных рядов (Майкрософт) содержит две вкладки: Диаграммы и Модель.

Кроме того, для всех моделей можно использовать средство просмотра деревьев содержимого общего вида (Майкрософт). Каждое представление дает различную картину данных, имеющихся в модели временных рядов.

  • Вкладка «Диаграммы»

  • Вкладка «Модель»

  • Средство просмотра деревьев содержимого общего вида (Майкрософт)

Вкладка «Диаграммы»

На вкладке Диаграммы средства просмотра временных рядов (Майкрософт) в графическом виде отображаются все ряды, в том числе данные с предысторией и прогнозы. Каждая линия на графике временных рядов представляет уникальное сочетание товара, региона и прогнозируемого атрибута.

В условных обозначениях, расположенных в правой части средства просмотра, перечислены временные ряды, которые доступны в зависимости от параметров, выбранных в раскрывающемся списке. Устанавливая и снимая соответствующие флажки в условных обозначениях, можно управлять отображением временных рядов на графике.

Также можно изменить такие параметры отображения, как цвет каждого временного ряда, или указать, отображаются ли значения при точках диаграммы.

Выбор временных рядов

  1. Перейдите на вкладку Диаграммы вкладки Средство просмотра моделей интеллектуального анализа данных, если она еще не открыта.

  2. Установите все флажки в раскрывающемся списке, расположенном справа от представления диаграммы. Нажмите кнопку ОК.

    Теперь на диаграмме должны располагаться 24 различные линии рядов.

  3. Снимите флажки, расположенные справа от диаграммы, чтобы временно скрыть линии всех рядов, основанных на значениях поля Amount.

    Теперь снимите флажки, связанные с моделями велосипедов R750 и R250.

    В результате этих действий сейчас на диаграмме представлены следующие шесть линий рядов, что позволяет упростить сравнение трендов для моделей велосипедов M200 и T1000.

    • M200 Europe: количество

    • M200 North America: количество

    • M200 Pacific: количество

    • T1000 Europe: количество

    • T1000 North America: количество

    • T1000 Pacific: количество

Прогнозируемые серии количества M200 и T1000

Диаграмма, отображаемая в этом средстве просмотра, включает как данные с предысторией, так и прогнозируемые данные. Прогнозируемые данные выделены затенением, чтобы они отличались от исторических. Для упрощения сравнения различных рядов можно изменить цвета, соответствующие каждой линии графа. Дополнительные сведения см. в разделе изменить цвета, используемые в средстве просмотра интеллектуального анализа данных.

Линии трендов показывают, что общий объем продаж по всем регионам в целом растет, при этом пик наступает каждые 12 месяцев в декабре. Анализируя данную диаграмму, можно также сказать, что велосипеды модели T1000 имеют не такой большой объем исторических данных, как другие ряды товаров. Так происходит потому, что это новый товар. Поскольку данный ряд основан на гораздо меньшем объеме данных, прогнозы будут менее точны.

По умолчанию для каждого временного ряда отображается пять этапов прогнозирования в виде пунктирных линий. Количество этапов прогнозирования можно увеличить или уменьшить, изменив это значение. Также можно графически отобразить стандартное отклонение для прогноза путем добавления в диаграмму значений погрешностей.

Изменение параметров прогноза и отображения в представлении диаграммы

  1. Измените значение Этапы прогнозирования последовательно от 5 до 10, а затем обратно до 6.

    Если в данных с предысторией имеют место значительные колебания, то эти колебания будут воспроизводиться и даже усиливаться по мере увеличения числа этапов прогнозирования. Здесь следует провести некоторое исследование, чтобы выявить причину резкого увеличения в данных с предысторией, а затем решить, остановиться ли достигнутых результатах, искать способ исправления исходных данных или применить к модели методы сглаживания.

  2. Установите флажок Отображать отклонения.

    Для каждого прогнозируемого значения будет показываться оценка ошибки.

  3. Обратите внимание на шкалу оси X. Изменения в данных с предысторией и прогнозируемых данных всегда выражаются процентным значением, но фактические данные автоматически подстраиваются так, чтобы разместить на графике все значения. Поэтому следует соблюдать осторожность при сравнении моделей и не полагаться только на наблюдение. Чтобы получить точное значение или процентное увеличение и значение для прогнозов, наведите указатель мыши на пунктирную линию или сплошные линии либо щелкните линии для просмотра значений в окне Обозначения интеллектуального анализа данных.

    Совет. Если окно Обозначения интеллектуального анализа данных не отображается, перейдите к представлению Модель, щелкните любой узел правой кнопкой мыши и выберите команду Показать условные обозначения.

Тренды продемонстрировали недостаток данных для некоторых рядов. Возможно, усреднение продаж по модели или по региону позволит получить более достоверные прогнозы. Такой подход рассматривается далее в этом учебнике.

В начало

Вкладка «Модель»

Вкладка Модель средства просмотра временных рядов (Майкрософт) в конструкторе интеллектуального анализа данных позволяет просматривать модель прогнозирования в виде диаграммы дерева принятия решений.

Поскольку в данных описаны две различные меры (Amount и Quantity) для продаж нескольких серий товара (T1000 и т. д.) в трех различных регионах (Europe, North America и Pacific), то построенная модель фактически содержит 24 различных дерева, каждое из которых представляет модель закономерностей продаж для различного сочетания региона, товара и прогнозируемого атрибута.

Чтобы выбрать сочетание серии товара, региона и показателя продаж для просмотра, выберите ряд из раскрывающегося списка Дерево на вкладке Модель.

Что можно узнать, просматривая модель в виде дерева? Например, сравним две модели, одна из которых имеет дерево из нескольких уровней, а другая только один узел.

  • Если дерево содержит один узел, то это значит, что тренд, обнаруженный в модели, практически однороден во времени. Этот единственный узел с меткой Все можно использовать для просмотра формулы, которая описывает связь между входными переменными и результатом.

  • Если дерево для временного ряда содержит несколько ветвей, то это значит, что обнаруженный временной ряд оказался слишком сложный и его нельзя выразить одной формулой. Вместо этого дерево содержит несколько ветвей, каждая из которых помечается условиями, вызвавшими разбиение дерева. Когда дерево разбивается, каждая ветвь представляет отдельный сегмент времени, в котором тренд можно выразить одной формулой.

    Например, если на графике обнаруживается внезапный скачок объема продаж, начинающийся в сентябре и захватывающий новогодние праздники, можно перейти к представлению Модель, чтобы обнаружить точную дату изменения тренда. Ветви дерева, представляющие периоды «до сентября» и «после сентября» будут содержать разные формулы: одна формула математически описывает тренды продаж до разбиения, а другая формула описывает тренды продаж с сентября до новогодних праздников.

Просмотр дерева принятия решений для модели временных рядов

  1. В списке Дерево на вкладке Модель средства просмотра выберите ряд T1000 Europe: Amount.

    Щелкните узел с меткой Все.

    Для узла Все всплывающая подсказка будет содержать такие данные, как количество вариантов во всем ряду и формулы временного ряда, полученные в ходе анализа данных.

  2. Если окно Обозначения интеллектуального анализа данных не отображается, щелкните узел правой кнопкой мыши и выберите команду Показать условные обозначения.

    Сведения в окне Обозначения интеллектуального анализа данных во многом совпадают со сведениями в подсказке. Если любые из независимых переменных являются дискретными, также выводится гистограмма с распределением переменных в узле.

  3. Теперь выберите для просмотра другой временной ряд. В списке Дерево на вкладке Модель средства просмотра выберите ряд M200 North America: Amount.

    Диаграмма дерева сейчас содержит дочерний узел Все и два дочерних узла. По меткам дочерних узлов можно понять, в какой момент изменилась линия тренда.

    Описание каждого дочернего узла в окне Обозначения интеллектуального анализа данных также содержит число вариантов в каждой ветви дерева.

В следующем списке описаны некоторые дополнительные функции средства просмотра деревьев.

  • Можно изменить переменную, представленную на диаграмме, с помощью элемента управления Фон. По умолчанию более темные узлы содержат больше вариантов, поскольку параметр Фон имеет значение Заполнение. Чтобы узнать, сколько вариантов входит в узел, наведите указатель мыши на узел и просмотрите всплывающую подсказку или щелкните узел и просмотрите числа в окне Условные обозначения узла.

  • Формулу регрессии для узла также можно просмотреть во всплывающей подсказке или щелкнув узел. Если создана смешанная модель, можно просмотреть две формулы: одну для ARTXP (в конечных узлах) и одну для ARIMA (в корневом узле дерева).

  • В узлах, представляющих непрерывные числа, используются маленькие ромбы. Диапазон атрибутов показан в линейке, на которой находится ромб. Центр ромба расположен над средним значением для узла, а ширина ромба представляет дисперсию атрибута в этом узле.

В начало

Средство просмотра деревьев содержимого общего вида (необязательно)

В дополнение к собственному средству просмотра временных рядов, службы Службы Analysis Services предоставляют возможность использовать Средство просмотра деревьев содержимого общего вида (Майкрософт) для использования с любыми моделями интеллектуального анализа данных. Это средство просмотра обладает некоторыми преимуществами.

  • Средство просмотра временных рядов (Майкрософт). В этом представлении объединяются результаты двух алгоритмов. Каждый ряд можно просматривать отдельно, но нельзя определить, как сочетаются результаты действия каждого алгоритма. Кроме того, в этом представлении в подсказках и обозначениях интеллектуального анализа данных выводится только самая важная статистика.

  • Средство просмотра деревьев содержимого общего вида. Позволяет одновременно просматривать все ряды данных, использованные в модели. Если создана смешанная модель, то деревья ARIMA и ARTXP отображаются на одной диаграмме.

    Это средство просмотра позволяет получить всю статистику по обоим алгоритмам, а также распределение значений.

    Рекомендуется для пользователей, обладающих опытом интеллектуального анализа данных и желающих получить дополнительные сведения об алгоритмах анализа ARIMA и ARTXP.

Просмотр сведений для определенного ряда данных в средстве просмотра содержимого общего вида

  1. На вкладке Средство просмотра моделей интеллектуального анализа данных выберите Средство просмотра деревьев содержимого общего вида (Майкрософт) из раскрывающегося списка Средство просмотра.

  2. На панели Заголовок узла щелкните самый верхний узел («Все»).

  3. На панели Сведения об узле обратите внимание на значение ATTRIBUTE_NAME.

    Данное значение указывает, какой ряд, или сочетание товара и региона, содержится в этом узле. В примере с фирмой AdventureWorks самый верхний узел соответствует ряду M200 Europe.

  4. На панели Заголовок узла найдите первый узел, у которого присутствуют дочерние узлы.

    Если узел ряда имеет дочерние узлы, то представление в виде дерева, которое отображается на вкладке Модель средства просмотра временных рядов (Майкрософт), также будет иметь разветвленную структуру.

  5. Разверните узел и щелкните один из его дочерних узлов.

    Столбец NODE_DESCRIPTION схемы содержит условие, которые привело к разбиению дерева.

  6. На панели Заголовок узла щелкните самый верхний узел ARIMA и разверните его таким образом, чтобы отобразились все дочерние узлы.

  7. На панели Сведения об узле обратите внимание на значение ATTRIBUTE_NAME.

    Данное значение указывает, какой ряд содержится в этом узле. Самый верхний узел в разделе ARIMA должен совпадать с самым верхним узлом в разделе («Все»). В примере с фирмой AdventureWorks данный узел содержит результаты алгоритма ARIMA для ряда M200 Europe.

Дополнительные сведения см. в разделе Содержимое модели интеллектуального анализа данных для моделей временных рядов (службы Analysis Services — интеллектуальный анализ данных).

В начало

Следующая задача занятия

Создание прогнозов временных рядов (учебник по интеллектуальному анализу данных — средний уровень)

См. также

Справочник

Технический справочник по алгоритму временных рядов (Майкрософт)

Основные понятия

Примеры запросов моделей временных рядов