Добавление представления источника данных для данных Call Center (учебник по интеллектуальному анализу данных — средний уровень)

В этой задаче добавляется представление источника данных, которое будет использоваться для доступа к данным центра обработки вызовов. Для построения исходной модели нейронной сети, предназначенной для исследования, и модели логистической регрессии, с помощью которой будут даваться рекомендации, будут использоваться одни и те же данные.

Также для добавления столбца дня недели будет использован конструктор представлений исходных данных. Это необходимо, поскольку исходный код отслеживает данные по датам центра обработки вызовов, при этом опыт подсказывает, что существуют повторяющиеся шаблоны как в плане объема, так и в плане качества обслуживания, в зависимости от того, является ли этот день выходным или рабочим днем.

Процедуры

Добавление представления источника данных

  1. В окне Обозреватель решений щелкните правой кнопкой мыши элемент Представления источников данных и выберите команду Создать представление источника данных.

    Будет открыт мастер представлений источников данных.

  2. На странице Мастер представлений источников данных щелкните Далее.

  3. На странице Выбор источника данных в списке Реляционные источники данных выберите источник данных Adventure Works DW Multidimensional 2012 . Если этот источник данных отсутствует, см. раздел Учебник по основам интеллектуального анализа данных. Нажмите кнопку Далее.

  4. На странице Выбор таблиц и представлений выберите следующую таблицу, а затем щелкните стрелку вправо, чтобы добавить ее в представление источника данных.

    • FactCallCenter (dbo)

    • DimDate

  5. Нажмите кнопку Далее.

  6. На странице Завершение работы мастера представлению источника данных по умолчанию присваивается имя Adventure Works DW Multidimensional 2012 . Измените имя на CallCenter и нажмите кнопку Готово.

    Откроется конструктор представлений источников данных, где будет отображено представление источника данных CallCenter.

  7. Щелкните правой кнопкой мыши панель «Представление источника данных» и выберите команду Добавить или удалить таблицы. Выберите таблицу DimDate и нажмите кнопку ОК.

    Связь между столбцами DateKey в каждой таблице будет добавлена автоматически. Эту связь нужно будет использовать, чтобы получить столбец EnglishDayNameOfWeek из таблицы DimDate и использовать его в модели.

  8. В конструкторе представления источника данных щелкните правой кнопкой мыши таблицу FactCallCenter и выберите команду Создать именованное вычисление.

    В диалоговом окне Создать именованное вычисление введите следующие значения.

    Имя столбца

    DayOfWeek

    Описание

    Получение дня недели из таблицы DimDate

    Выражение

    (SELECT EnglishDayNameOfWeek AS DayOfWeek FROM DimDate where FactCallCenter.DateKey = DimDate.DateKey)

    Чтобы убедиться, что выражение создает нужную дату, щелкните правой кнопкой мыши таблицу FactCallCenter и выберите пункт Просмотреть данные.

  9. Внимательно просмотрите доступные данные и постарайтесь понять, как они используются в интеллектуальном анализе данных.

Имя столбца

Содержит

FactCallCenterID

При импорте данных в хранилище данных создается произвольный ключ.

Этот столбец идентифицирует уникальные записи. Его следует использовать в качестве ключа вариантов для модели интеллектуального анализа данных.

DateKey

Дата работы центра обработки вызовов в виде целого числа. Целочисленные ключи дат часто используются в хранилищах данных, однако может потребоваться получить дату в формате дата/время для группирования по значениям даты.

Обратите внимание, что даты не являются уникальными, поскольку поставщик предоставляет отдельный отчет для каждой смены в каждый день работы.

WageType

Показывает, является день рабочим, выходным или праздничным.

Качество обслуживания клиентов в выходные и рабочие дни может отличаться, поэтому этот столбец будет входным.

Shift

Указывает смену, для которой регистрируется звонок. Этот центр обработки вызовов разделяет рабочий день на четыре смены: AM, PM1, PM2 и Midnight.

Смена может влиять на качество обслуживания клиентов, поэтому она будет входными данными.

LevelOneOperators

Указывает число операторов уровня 1 на дежурстве.

Сотрудники центра обработки вызовов начинают на уровне 1, поэтому они менее опытные.

LevelTwoOperators

Указывает число операторов уровня 2 на дежурстве.

Чтобы стать оператором уровня 2, сотрудник должен отработать определенное количество часов и зарегистрировать их в журнале.

TotalOperators

Общее количество операторов, присутствующих на смене.

Calls

Число звонков, полученных в течении смены.

AutomaticResponses

Число звонков, полностью обработанных системой автоматической обработки (голосовое меню или IVR).

Orders

Число заказов, принятых в результате телефонных звонков.

IssuesRaised

Число проблем, требующих дополнительного рассмотрения, о которых было сообщено по телефону.

AverageTimePerIssue

Среднее время, необходимое для ответа на входящий звонок.

ServiceGrade

Показатель, отражающий общее качество обслуживания, измеряемое как показатель прекращения звонков за всю смену. Чем выше показатель звонков, прекращенных абонентом во время ожидания, тем более вероятно, что клиенты остаются недовольными, а компания теряет потенциальные заказы.

Обратите внимание, что дата включает четыре разных столбца, которые основываются на одном столбце дат: WageType, DayOfWeek, Shift и DateKey. Обычно в интеллектуальном анализе данных лучше использовать несколько столбцов, полученных из одних данных, поскольку значения очень сильно коррелируют друг с другом и могут скрывать другие шаблоны.

Однако столбец DateKey не будет использоваться в модели, поскольку он содержит слишком много уникальных значений. Между столбцами Shift и DayOfWeek нет прямой связи, а столбцы WageType и DayOfWeek связаны только частично. Если есть озабоченность по поводу коллинеарности, можно создать структуру, используя все доступные столбцы, затем проигнорировать другие столбцы в каждой модели и протестировать результаты.

Следующая задача занятия

Создание структуры и модели нейронной сети (учебник по интеллектуальному анализу данных — средний уровень)

См. также

Основные понятия

Представления источников данных в многомерных моделях