Настройка и обработка модели прогнозирования (учебник по интеллектуальному анализу данных — средний уровень)

Алгоритм временных рядов (Microsoft) предоставляет параметры, которые влияют на способ создания модели и методы анализа временных данных. С помощью этих свойств можно существенно повлиять на прогнозы, сделанные моделью интеллектуального анализа данных.

На этом занятии учебника вы выполните следующие изменения модели.

  1. Настройте способ обработки временных рядов в модели с помощью добавления нового значения для параметра PERIODICITY_HINT.

  2. Узнаете о двух других важных параметрах алгоритма временных рядов (Майкрософт): параметре FORECAST_METHOD, который позволяет управлять методом прогнозирования, и параметре PREDICTION_SMOOTHING, который позволяет задать сочетание долгосрочных и краткосрочных прогнозов.

  3. При необходимости можно указать алгоритму, как вычислять отсутствующие значения.

  4. После внесения всех изменений необходимо будет развернуть и обработать модель.

Настройка параметров временных рядов

Указания периодичности

Параметр PERIODICITY_HINT дает алгоритму информацию о дополнительных временных периодах, которые вы ожидаете увидеть в данных. По умолчанию модели временных рядов автоматически пытаются обнаружить закономерность в данных. Но если ожидаемый временной цикл уже известен, указание периодичности может повысить точность модели. Однако неправильное указание периодичности может снизить точность, поэтому если вы не уверены, какое значение использовать, лучше оставить значение по умолчанию.

Например, представление для этой модели суммирует данные продаж из Adventure Works DW Multidimensional 2012 по месяцам. Поэтому каждый временной срез, используемый моделью, представляет один месяц, и все прогнозы также делаются по месяцам. Поскольку в году 12 месяцев и предполагается, что каждый год картина продаж более или менее повторяется, можно задать в параметре PERIODICITY_HINT значение 12, чтобы показать, что 12 временных срезов (месяцев) составляют один полный цикл продаж.

Метод прогнозирования

Параметр FORECAST_METHOD управляет оптимизацией алгоритма временных рядов для краткосрочных или долгосрочных прогнозов. По умолчанию параметр FORECAST_METHOD имеет значение MIXED. Это означает, что два разных алгоритма объединены и сбалансированы для получения хороших результатов как в краткосрочных, так и долгосрочных прогнозах.

Однако если вы хотите использовать определенный алгоритм, можно изменить это значение на ARIMA или ARTXP.

Баланс между долгосрочными и краткосрочными прогнозами

Можно также настроить сочетание долгосрочных и краткосрочных прогнозов с помощью параметра PREDICTION_SMOOTHING. По умолчанию он имеет параметр 0,5, что обычно обеспечивает наилучший баланс для общей точности.

Изменение параметров алгоритма

  1. На вкладке Модели интеллектуального анализа данных щелкните правой кнопкой мыши Прогнозирование и выберите команду Задать параметры алгоритма.

  2. В строке PERIODICITY_HINT диалогового окна Параметры алгоритма щелкните столбец Значение и введите {12}, включая фигурные скобки.

    По умолчанию алгоритм также добавит значение {1}.

  3. В строке FORECAST_METHOD проверьте, что текстовое поле Значение пусто или содержит значение MIXED. Если задано иное значение, введите MIXED, чтобы снова установить параметр по умолчанию.

  4. Убедитесь, что текстовое поле Значение в строке PREDICTION_SMOOTHING пусто или равно 0,5. Если задано иное значение, щелкните Значение и введите 0,5, чтобы снова установить для параметра значение по умолчанию.

    ПримечаниеПримечание

    Параметр PREDICTION_SMOOTHING доступен только в версии SQL Server Enterprise. Поэтому увидеть или изменить значение параметра PREDICTION_SMOOTHING в выпуске SQL Server Standard нельзя. Однако по умолчанию используются оба алгоритма с одинаковым весом.

  5. Нажмите кнопку ОК.

Обработка отсутствующих данных (необязательно)

Во многих случаях данные продаж могут иметь пробелы, заполненные нулями, или магазин может не выполнить отчет к сроку, в результате чего в конце ряда останется пустая ячейка. В таких случаях службы Службы Analysis Services не будут обрабатывать модель и выдадут следующую ошибку.

«Ошибка (интеллектуальный анализ данных): Временные метки не синхронизированы, начиная с ряда <имя ряда> модели интеллектуального анализа данных <имя модели>. Все временные ряды должны завершаться в одной временной метке и не могут иметь произвольно отсутствующие точки данных. Задание в качестве значения параметра MISSING_VALUE_SUBSTITUTION "PREVIOUS" или числовой константы автоматически исправляет отсутствующие точки данных, где это возможно».

Чтобы избежать этой ошибки, можно указать, что службы Службы Analysis Services должны автоматически предоставлять новые значения для заполнения промежутков с помощью одного из следующих методов.

  • Использование среднего значения. Среднее значение вычисляется с помощью всех действительных значений в одном ряде данных.

  • Использование предыдущего значения. Несколько ячеек с отсутствующими данными можно заполнить предыдущими значениями, но нельзя заполнить начальные значения.

  • Использование предоставляемого постоянного значения.

Заполнение промежутков средними значениями

  1. На вкладке Модели интеллектуального анализа данных щелкните правой кнопкой мыши столбец Прогнозирование и выберите команду Задать параметры алгоритма.

  2. В диалоговом окне Параметры алгоритма, в строке MISSING_VALUE_SUBSTITUTION щелкните столбец Значение и введите Среднее.

Построение модели

Чтобы использовать модель, необходимо развернуть ее на сервере и обработать, выполнив алгоритм с обучающими данными.

Обработка модели прогнозирования

  1. В меню Модель интеллектуального анализа данных среды SQL Server Data Tools выберите команду Обработать структуру интеллектуального анализа данных и все модели.

  2. Когда отобразится предупреждение с запросом на построение проекта с последующим его развертыванием, нажмите кнопку Да.

  3. В диалоговом окне Обработка структуры интеллектуального анализа данных — Прогнозирование нажмите кнопку Выполнить.

    Будет открыто диалоговое окно Ход обработки, в котором отображаются сведения о ходе обработки модели. Обработка модели может занять некоторое время.

  4. После успешного завершения обработки нажмите кнопку Закрыть, чтобы выйти из диалогового окна Ход обработки.

  5. Нажмите еще раз кнопку Закрыть, чтобы выйти из диалогового окна Обработка структуры интеллектуального анализа данных — Прогнозирование.

Следующая задача занятия

Изучение модели прогнозирования (учебник по интеллектуальному анализу данных — средний уровень)

См. также

Справочник

Технический справочник по алгоритму временных рядов (Майкрософт)

Основные понятия

Алгоритм временных рядов (Майкрософт)

Требования к обработке и связанные замечания (интеллектуальный анализ данных)