Новые возможности (службы Analysis Services — интеллектуальный анализ данных)

В последней версии служб MicrosoftSQL ServerAnalysis Services реализованы новые функции и усовершенствования.

Создание контрольных проверочных наборов

При создании структуры интеллектуального анализа данных теперь можно разделить данные на обучающие и проверочные наборы. Определение секции хранится в структуре, и обучающий и проверочный наборы можно использовать повторно с любыми моделями интеллектуального анализа данных, основанных на этой структуре.

Данные между обучающими и проверочными секциями разбиваются случайным образом; при этом начальное значение, которое использовалось при создании секций, можно указать при необходимости повторного создания секции.

Можно указать размер проверочного набора как процент от общего количества строк, как максимальное количество строк либо совместить требования. Дополнительные сведения об использовании обучающих и проверочных наборов данных см. в разделе Секционирование данных на обучающий и проверочный наборы данных (службы Analysis Services — интеллектуальный анализ данных).

Дополнительные сведения обо всех функциях проверки моделей в SQL Server 2008 см. в разделе Проверка моделей интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных).

Фильтрация по вариантам модели

Теперь есть возможность присоединения фильтров к моделям интеллектуального анализа данных и применения фильтров во время обучения и проверки. Применение фильтра к модели позволяет управлять данными, которые используются для обучения модели, а также упрощает доступ к результатам модели на подмножествах данных.

Например, необходимо узнать точность модели прямой почтовой рассылки только для клиентов с определенным уровнем дохода. Для этого при создании диаграммы точности прогнозов можно применить фильтр на столбец «Доход» модели интеллектуального анализа данных и просмотреть результаты только для указанных демографических данных.

Среда Business Intelligence Development Studio также содержит новые редакторы фильтров, которые помогут составлять сложные условия, применимые как к таблицам вариантов, так и к вложенным таблицам.

Дополнительные сведения о создании фильтров для моделей интеллектуального анализа данных см. в разделе Создание фильтров для моделей интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных).

Дополнительные сведения о фильтрации данных для проверки моделей интеллектуального анализа данных см. в разделе Средства проверки точности построения моделей (службы Analysis Services — интеллектуальный анализ данных).

Перекрестная проверка нескольких моделей интеллектуального анализа данных

Перекрестная проверка является общепринятым методом оценки точности моделей интеллектуального анализа данных. При перекрестной проверке данные структуры интеллектуального анализа данных многократно секционируются в подмножества, на базе подмножеств строятся модели, затем измеряется точность модели для каждой секции. Полученная статистика позволяет определить надежность модели интеллектуального анализа данных и упрощает сравнение моделей на основе одной структуры.

Перекрестная проверка доступна в представлении диаграммы точности интеллектуального анализа данных в конструкторе интеллектуального анализа данных. Кроме того, можно секционировать структуру интеллектуального анализа данных, проверять несколько моделей и формировать данные анализа с помощью хранимых процедур служб Analysis Services.

Чтобы сформировать отчет о перекрестной проверке в SQL Server 2008, нужно указать структуру интеллектуального анализа данных и прогнозируемый атрибут, а затем задать число сверток, в которые будут сегментированы данные.

Службы Analysis Services возвращают таблицу со статистикой, например с вероятностью или корнем среднеквадратичной погрешности для отдельных секций, а также среднее и квадратичное отклонение всех измерений для статистических моделей. Дополнительные сведения см. в разделе Перекрестная проверка (службы Analysis Services — интеллектуальный анализ данных).

Поддержка надстроек интеллектуального анализа данных для Office 2007

SQL Server 2008 поддерживает создание, управление и использование моделей интеллектуального анализа данных из Microsoft Excel при использовании надстроек интеллектуального анализа данных для Office 2007. Новейшая версия распространенной бесплатной надстройки улучшена благодаря поддержке обучающих и тестовых секций на стороне сервера, перекрестной проверке и нескольким новым аналитическим средствам, таким как анализ покупательского поведения и калькулятор печатаемых прогнозов.

Можно также использовать мастер документирования модели, чтобы легко создавать документы структур и моделей, хранимых в экземпляре SQL Server 2008. Дополнительные сведения о надстройках см. в разделе Надстройки интеллектуального анализа данных для Office 2007.

Расширения к алгоритму временных рядов (Майкрософт)

Чтобы увеличить точность и стабильность некоторых прогнозов в моделях с временными рядами, к алгоритму временных рядов Майкрософт было добавлен новый алгоритм. Построенный на основе хорошо известного алгоритма ARIMA, новый алгоритм обеспечивает лучшие долгосрочные прогнозы, чем ARTxp, который использовался в службах Analysis Services. (Алгоритм ARTxp, в котором используется дерево с авторегрессией, оптимизирован для одного временного среза или краткосрочных прогнозов.)

По умолчанию в новой реализации алгоритма временных рядов Майкрософт для обучения одной версии модели используется алгоритм ARTxp, а для обучения другой версии — алгоритм ARIMA. Затем алгоритм взвешивает результаты этих двух моделей для обеспечения предпочитаемых характеристик прогноза. Если по каким-либо причинам реализация по умолчанию не подходит, то алгоритму временных рядов (Майкрософт) можно указать использование только алгоритма ARTxp или ARIMA. В SQL Server 2008 Enterprise можно задать в алгоритмах пользовательский вес, обеспечивающий наилучший прогноз в изменяемом временном диапазоне.

Алгоритм временных рядов (Майкрософт) теперь также принимает данные во время прогноза для поддержки новых бизнес-сценариев. Например, можно создать модель прогнозирования прибыли, основанную на усреднении показателей по продуктам, региональной статистике или другом широком наборе данных. Затем можно применить эту модель к временным рядам, показывающим продажи отдельного продукта. Применение общей модели обеспечивает стабильность и наличие статистических данных и позволяет настроить прогноз на определенный продукт.

Кроме того, ранее можно было обучить модели с помощью нескольких рядов и затем применить модели к новым данным для формирования прогнозов по сценариям анализа вариантов.

Дополнительные сведения о моделях временных рядов для интеллектуального анализа данных см. в разделах Алгоритм временных рядов (Майкрософт) и PredictTimeSeries (расширения интеллектуального анализа данных).

Детализация до структуры и столбцов структуры интеллектуального анализа данных

При включенной детализации структуры интеллектуального анализа данных в SQL Server 2008 можно создавать запросы для структуры интеллектуального анализа данных и возвращать подробные сведения о вариантах, использованных для обучения и проверки. Запросы детализации к структуре можно создавать при помощи расширений интеллектуального анализа данных.

Кроме того, если детализация включена для модели интеллектуального анализа данных и соответствующей структуры интеллектуального анализа данных, то можно создавать запросы, возвращающие столбцы данных из базовой структуры. Это позволяет легко получать подробные сведения о вариантах в отдельном взятом узле. Например, можно получить контактную информацию для клиентов в определенном кластере.

Дополнительные сведения см. в разделе Использование детализации в моделях и структурах интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных).

Примеры запросов расширения интеллектуального анализа к структуре интеллектуального анализа данных см. в разделе SELECT FROM <структура>.CASES.

Примеры детализации из модели в структуру данных см. в разделе SELECT FROM <модель>.CASES (расширения интеллектуального анализа данных).

Создание псевдонимов для столбцов модели интеллектуального анализа данных

Теперь для столбцов модели интеллектуального анализа данных можно создавать псевдонимы, что облегчает понимание содержимого столбца и упрощает ссылку на столбцы в инструкциях расширений интеллектуального анализа данных.

Например, если создать структуру интеллектуального анализа данных, содержащую непрерывные и дискретные версии одних и тех же данных, то обоим столбцам можно присвоить одно и тоже имя, что упростит сравнение.

Дополнительные сведения о просмотре псевдонимов и управлении ими см. в разделах Настройка свойств в модели интеллектуального анализа данных или Как создать псевдоним для столбца модели.

Дополнительные сведения о создании псевдонима столбца с помощью расширений интеллектуального анализа данных см. в разделе ALTER MINING STRUCTURE (расширения интеллектуального анализа данных).

Запрос набора строк схемы интеллектуального анализа данных

В SQL Server 2008 многие существующие наборы строк схемы интеллектуального анализа данных OLE DB доступны как набор системных таблиц, к которым легко осуществлять запросы с помощью DMX-инструкций. Это упрощает получение метаданных, связанных с моделями и структурами, извлечение подробностей из содержимого модели интеллектуального анализа данных или мониторинг экземпляра служб Analysis Services или службы.

Дополнительные сведения см. в разделе Запрос наборов строк схемы интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных).

Новое расположение образцов

В электронную документацию более не входят образцы баз данных и приложений SQL Server. Образцы баз данных и приложений находятся на веб-узле Образцы SQL Server. На веб-узле пользователям проще найти эти и дополнительные образцы, связанные с MicrosoftSQL Server и бизенс-аналитикой. На веб-узле образцов SQL Server можно выполнить следующие действия:

  • просмотреть образцы, присланные разработчиками, пользователями и членами сообщества Microsoft MVP;

  • загружать образцы баз данных и проектов кода;

  • участвовать в дискуссиях, сообщая о проблемах и задавая вопросы об образцах по любой области технологии, а также наблюдать за дискуссиями.

Параллельная установка со службами SQL Server 2005 Analysis Services

SQL Server 2008 В настоящее время службы Analysis Services можно установить параллельно со службами SQL Server 2005 Analysis Services (SSAS). Дополнительные сведения см. в разделе Работа с несколькими версиями и экземплярами SQL Server.

Важные сведения о проблемах параллельной установки, которые влияют на службы Analysis Services, см. в файле Readme, поставляемом вместе с этим выпуском продукта.

Создание и восстановление резервных копий баз данных служб Analysis Services

Возможности создания и восстановления резервных копий базы данных служб Analysis Services были расширены. Стало меньше ограничений на размер базы данных, а время, затрачиваемое на операции резервного копирования и восстановления, значительно сократилось.

Дополнительные сведения см. в разделе Новые возможности (службы Analysis Services — многомерная база данных).

Прочие расширения служб Analysis Services

При создании кубов OLAP (используемых также для интеллектуального анализа данных) с помощью служб Analysis Services теперь стало намного проще конструировать измерения и связанные с ними иерархии и атрибуты. В состав конструктора измерений входит новый конструктор связей атрибутов, который помогает создавать связи между атрибутами и предоставляет по ним рекомендации.

Дополнительные сведения см. в разделе Новые возможности (службы Analysis Services — многомерная база данных).