Построение связанной модели кластеризации последовательностей (учебник по интеллектуальному анализу данных — средний уровень)

Статья
05/08/2013

В результате исследования модели кластеризации последовательностей выяснилось, что другие атрибуты, например, Region или Income, оказывают значительное влияние на модели. Поэтому, чтобы упростить понимание последовательностей, будет создана связанная модель кластеризации последовательностей и будут удалены атрибуты, относящиеся к демографическим данным клиента.

В этой задаче будет создана копия региональной модели кластеризации последовательностей, затем из модели будут удалены все столбцы, непосредственно не связанные с последовательностями.

Новая модель будет содержать те же столбцы, что и модель интеллектуального анализа данных, на основе которой она создана. Однако из структуры интеллектуального анализа данных не нужно удалять столбцы, необходимо только указать, что новая модель интеллектуального анализа данных не учитывает столбцы.

Создание копии модели кластеризации последовательностей

В среде SQL Server Data Tools (SSDT), в конструкторе интеллектуального анализа данных перейдите на вкладку Модели интеллектуального анализа данных.
Щелкните правой кнопкой мыши копируемую модель и выберите Создать модель интеллектуального анализа данных.
В диалоговом окне Создание модели интеллектуального анализа данных введите имя модели и выберите Кластеризация последовательностей.

Для этого учебника введите имя кластеризации последовательностей.
Нажмите кнопку ОК.

Удаление столбцов из модели интеллектуального анализа данных

На вкладке Модель интеллектуального анализа данных в столбце для новой модели с именем Sequence Clustering щелкните строку для атрибута Income Group и выберите Пропускать.
Повторите этот шаг для атрибута Region.
Щелкните знак плюс рядом с именем таблицы v Assoc Seq Line Items, чтобы развернуть таблицу и просмотреть новые столбцы из вложенной таблицы.

Новая модель должна иметь только следующие столбцы.

Order Number    Key

Line Number     Key

Модель     Predict

Обработка новой модели кластеризации последовательностей

На вкладке Модель интеллектуального анализа данных щелкните правой кнопкой мыши новую модель с именем Кластеризация последовательностей и выберите команду Обработка модели.

Новая упрощенная модель интеллектуального анализа данных основана на структуре, которая уже обработана, поэтому повторная обработка структуры не требуется. Можно обработать только новую модель интеллектуального анализа данных.
Чтобы выполнить развертывание на сервере обновленного проекта интеллектуального анализа данных, нажмите кнопку Да.
В диалоговом окне Обработка модели интеллектуального анализа данных нажмите кнопку Выполнить.
Нажмите кнопку Закрыть, чтобы закрыть диалоговое окно Ход обработки, а затем вновь нажмите кнопку Закрыть в диалоговом окне Обработка модели интеллектуального анализа данных.

Следующая задача занятия

Создание прогнозов для модели кластеризации последовательностей (учебник по интеллектуальному анализу данных — средний уровень)

См. также

Основные понятия

Требования к обработке и связанные замечания (интеллектуальный анализ данных)

Share via