Новые возможности служб SQL Server машины обученияWhat's new in SQL Server Machine Learning Services

ОБЛАСТЬ ПРИМЕНЕНИЯ ЭТОЙ СТАТЬИ: даSQL Server (только Windows)нетБаза данных SQL AzureнетХранилище данных SQL AzureнетParallel Data Warehouse THIS TOPIC APPLIES TO: yesSQL Server (Windows only)noAzure SQL DatabasenoAzure SQL Data WarehousenoParallel Data Warehouse

Возможности обучения машины будут добавлены к SQL Server в каждом выпуске как мы продолжаем развернуть, расширить и улучшить интеграцию платформы данных и обработки и анализа данных, анализа и защищено обучения, который вы хотите реализовать по данным.Machine learning capabilities are added to SQL Server in each release as we continue to expand, extend, and deepen the integration between the data platform and the data science, analytics, and supervised learning you want to implement over your data.

Новые возможности SQL Server 2017 г.New in SQL Server 2017

Этот выпуск добавлена поддержка Python и отрасли алгоритмов машинного обучения.This release added Python support and industry-leading machine learning algorithms. Переименован в соответствии с новой областью 2017 г. SQL Server помечен появлением обучения машины службы (в базе данных) для SQL Server, благодаря поддержке языка Python и R.Renamed to reflect the new scope, SQL Server 2017 marked the introduction of SQL Server Machine Learning Services (In-Database), with language support for both Python and R.

Этот выпуск также появился обучения машины сервера SQL Server (автономный), полностью независим от SQL Server для рабочих нагрузок R и Python, которые вы хотите запустить на выделенной системы.This release also introduced SQL Server Machine Learning Server (Standalone), fully independent of SQL Server, for R and Python workloads that you want to run on a dedicated system. С автономным сервером можно распространять и масштабирования решения R или Python без использования SQL Server.With the standalone server, you can distribute and scale R or Python solutions without using SQL Server.

ВыпускRelease Обновления компонентовFeature update
НАКОПИТЕЛЬНЫМ ОБНОВЛЕНИЕМ 6CU 6 Пакет обновления и исправления ошибок, но это не новая функция объявлений.Bug fixes and package refresh, but no new feature announcements. Предварительно обученной модели отсутствуют исправления включают поддержку для типов данных даты и времени в запросе SPEES Python и улучшенные сообщения об ошибках в microsoftml.Fixes include support for DateTime data types in SPEES query for Python and improved error messages in microsoftml when pre-trained models are missing.
НАКОПИТЕЛЬНЫМ ПАКЕТОМ ОБНОВЛЕНИЯ 5CU 5 Пакет обновления и исправления ошибок, но это не новая функция объявлений.Bug fixes and package refresh, but no new feature announcements. Включены усовершенствования для преобразования функции и переменные в revoscalepy, исправление ошибок долго связаны с путем в rxInstallPackages, исправление подключений в замыкания на себя для RxExec rx_exec функции и исправления для предупреждений.Fixes include improvements to transform functions and variables in revoscalepy, correcting the long path-related errors in rxInstallPackages, fixing connections in a loopback for RxExec and rx_exec functions, and revisions to warning messages.
НАКОПИТЕЛЬНЫМ ОБНОВЛЕНИЕМ 4CU 4 Пакет обновления и исправления ошибок, но это не новая функция объявлений.Bug fixes and package refresh, but no new feature announcements.
НАКОПИТЕЛЬНЫМ ПАКЕТОМ ОБНОВЛЕНИЯ 3CU 3 Python модели сериализации в revoscalepy, с помощью rx_serialize_model функция.Python model serialization in revoscalepy, using the rx_serialize_model function.

Оценки собственного плюс усовершенствования оценки в реальном времени.Native scoring plus enhancements to Realtime scoring. С оценки в базе данных, пропускная способность — миллиона строк в секунду, с помощью R-модели.With in-database scoring, throughput is a million rows per second using R models. В этом обновлении оценки в реальном времени и оценки собственного обеспечивают более высокую производительность в одной строки и массовой оценки.In this update, realtime scoring and native scoring offer better performance in single-row and batch scoring. Собственный оценки использует функцию T-SQL для быстрой оценки может выполняться в любом выпуске SQL Server, даже в Linux.Native scoring uses a T-SQL function for fast scoring that can be run on any edition of SQL Server, even on Linux. Функция требует без установки R или дополнительной настройки.The function requires no installation of R or extra configuration. Это означает обучения модели в другом месте, сохраните его в SQL Server и затем выполнять количественную оценку без вызова R. Дополнительные сведения о методологиях оценки см. в разделе выполнении оценки в реальном времени или собственного оценки.This means you can train a model elsewhere, save it in SQL Server, and then perform scoring without ever calling R. For more information on scoring methodologies, see How to perform realtime scoring or native scoring.
НАКОПИТЕЛЬНЫМ ПАКЕТОМ ОБНОВЛЕНИЯ 2CU 2 Пакет обновления и исправления ошибок, но это не новая функция объявлений.Bug fixes and package refresh, but no new feature announcements.
НАКОПИТЕЛЬНЫМ ПАКЕТОМ ОБНОВЛЕНИЯ 1CU 1 В revoscalepy, добавляет rx_create_col_info для возвращения сведений о схеме из источника данных SQL Server, аналогично rxCreateColInfo для R.In revoscalepy, adds rx_create_col_info for returning schema information from a SQL Server data source, similar to rxCreateColInfo for R.

Усовершенствования rx_exec для поддержки параллельных сценариях с использованием RxLocalParallel контекста вычислений.Enhancements to rx_exec to support parallel scenarios using the RxLocalParallel compute context.
Начальный выпускInitial release Интеграция Python для аналитики в базе данныхPython integration for in-database analytics

Revoscalepy пакет является эквивалентом Python RevoScaleR.The revoscalepy package is the Python-equivalent of RevoScaleR. Можно создавать модели Python для линейной и логистической регрессии, деревья принятия решений, повышенных деревьев и случайные леса, все параллельно и способны выполнялась в контекстах удаленных вычислений.You can create Python models for linear and logistic regressions, decision trees, boosted trees, and random forests, all parallelizable, and capable of being run in remote compute contexts. Данный пакет поддерживает использование нескольких источников данных и контекстах удаленных вычислений.This package supports use of multiple data sources and remote compute contexts. Специалист по анализу данных или разработчик могут выполнять код Python на удаленный экземпляр SQL Server, для просмотра данных или моделей создаются без перемещения данных.The data scientist or developer can execute Python code on a remote SQL Server, to explore data or build models without moving data.

Microsoftml пакет является эквивалентом Python MicrosoftML R-пакет.The microsoftml package is the Python-equivalent of the MicrosoftML R package.

T-SQL и Python интеграция через sp_execute_external_script.T-SQL and Python integration through sp_execute_external_script. Может вызывать любой код Python, с помощью этой хранимой процедуры.You can call any Python code using this stored procedure. Эта инфраструктура безопасности обеспечивает развертывание корпоративного уровня Python моделей и сценариев, которые могут вызываться из приложения с помощью простой хранимой процедуры.This secure infrastructure enables enterprise-grade deployment of Python models and scripts that can be called from an application using a simple stored procedure. Повышение производительности достигается путем потоковой передачи данных из SQL в процессы Python и параллелизации кольцо MPI.Additional performance gains are achieved by streaming data from SQL to Python processes and MPI ring parallelization.

T-SQL можно использовать PREDICT функцию для выполнения оценки собственного на предварительно обученной модели, которая ранее была сохранена в требуемый двоичный формат.You can use the T-SQL PREDICT function to perform native scoring on a pre-trained model that has been previously saved in the required binary format.
Начальный выпускInitial release MicrosoftML (R) содержит состояние современных машинного обучения алгоритмы и преобразование данных, может быть контекстах удаленных вычислений масштабированный или запускаться в.MicrosoftML (R) contains state-of-the-art machine learning algorithms and data transformation that can be scaled or run in remote compute contexts. Алгоритмы включают настраиваемые глубоких нейронных сетей, деревья принятия решений быстрого и леса принятия решений, линейной регрессии и логистической регрессии.Algorithms include customizable deep neural networks, fast decision trees and decision forests, linear regression, and logistic regression.
Начальный выпускInitial release Предварительно обученной модели для распознавания изображений и анализ мнений положительные отрицательные.Pre-trained models for image recognition and positive-negative sentiment analysis. Эти модели используются для создания прогнозов на ваших данных.Use these models to generate predictions on your own data.
Начальный выпускInitial release R пакета управления, включая следующие основные особенности: роли, чтобы помочь Администратору управлять пакетами и назначение разрешений для установки пакетов, базы данных создать ВНЕШНЮЮ БИБЛИОТЕКУ инструкции T-SQL, Справка администраторов баз данных управлять пакетами, без необходимости знать R и R богатый набор функций в RevoScaleR для установки, удаление или перечисление пакетов, принадлежащих пользователям.R package management, including the following highlights: database roles to help the DBA manage packages and assign permissions to install packages, CREATE EXTERNAL LIBRARY statement in T-SQL to help DBAs manage packages without needing to know R, and a rich set of R functions in RevoScaleR to help install, remove, or list packages owned by users.
Начальный выпускInitial release Ввода в эксплуатацию через mrsdeploy для развертывания и размещения R-сценария веб-службы.Operationalization through mrsdeploy for deploying and hosting R script as a web service. Применяется только для сценария R (эквивалента Python).Applies to R script only (no Python equivalent). Предназначен для параметра server (автономный), чтобы избежать конкуренции ресурсов с другими операциями SQL Server.Intended for the (Standalone) server option to avoid resource competition with other SQL Server operations.

Новые возможности SQL Server 2016New in SQL Server 2016

Этой машины выпуске появилась в SQL Server с помощью функциональных возможностей обучения служб R SQL Server 2016, подсистема аналитики в базе данных для сценария обработки R на данных, находящихся в экземпляр ядра СУБД.This release introduced machine learning capabilities into SQL Server through SQL Server 2016 R Services, an in-database analytics engine for processing R script on resident data within a database engine instance.

Кроме того SQL Server 2016 R Server (изолированный) был выпущен как способ установки R Server на сервере Windows.Additionally, SQL Server 2016 R Server (Standalone) was released as a way to install R Server on a Windows server. Первоначально программа установки SQL Server содержит единственный способ установки R Server для Windows.Initially, SQL Server Setup provided the only way to install R Server for Windows. В последующих выпусках разработчики и специалисты по анализу данных, желавшим R Server для Windows использовать другой автономный установщик для достижения общей цели.In later releases, developers and data scientists who wanted R Server on Windows could use another standalone installer to achieve the same goal. Изолированный сервер в SQL Server является функциональным эквивалентом автономная Серверная система Microsoft R Server для Windows.The standalone server in SQL Server is functionally equivalent to the standalone server product, Microsoft R Server for Windows.

ВыпускRelease Обновления компонентовFeature update
CU дополненияCU additions В реальном времени оценки использует собственные библиотеки C++ для чтения модели, хранящихся в оптимизированный двоичный формат и создавать прогнозы без необходимости вызывать среду выполнения R.Realtime scoring relies on native C++ libraries to read a model stored in an optimized binary format, and then generate predictions without having to call the R runtime. В результате оценки операции гораздо быстрее.This makes scoring operations much faster. С помощью оценки в реальном времени, можно выполнить хранимую процедуру или выполнять оценки из кода R в реальном времени.With realtime scoring, you can run a stored procedure or perform realtime scoring from R code. В реальном времени оценки может также использоваться для SQL Server 2016, если экземпляр обновляется до последней версии Microsoft R ServerMicrosoft R Server.Realtime scoring is also available for SQL Server 2016, if the instance is upgraded to the latest release of Microsoft R ServerMicrosoft R Server.
Начальный выпускInitial release Интеграция R для аналитики в базе данных.R integration for in-database analytics.

R-пакетов R вызывающей функции в T-SQL и наоборот.R packages for calling R functions in T-SQL, and vice versa. Функции RevoScaleR обеспечения аналитики R в масштабе, фрагментация на компоненты, согласование данных и управление распределенная обработка и статистическая обработка результатов.RevoScaleR functions provide R analytics at scale by chunking data into component parts, coordinating and managing distributed processing, and aggregating results. В службах SQL Server 2016 R (в базе данных) подсистема RevoScaleR интегрирован с экземпляром компонента database engine, brining данные и аналитика вместе в один и тот же контекст обработки.In SQL Server 2016 R Services (In-Database), the RevoScaleR engine is integrated with a database engine instance, brining data and analytics together in the same processing context.

Интеграция T-SQL и R через sp_execute_external_script.T-SQL and R integration through sp_execute_external_script. Может вызывать любой код R, с помощью этой хранимой процедуры.You can call any R code using this stored procedure. Эта инфраструктура безопасности обеспечивает развертывание корпоративного уровня Rn моделей и сценариев, которые могут вызываться из приложения с помощью простой хранимой процедуры.This secure infrastructure enables enterprise-grade deployment of Rn models and scripts that can be called from an application using a simple stored procedure. Повышение производительности достигается путем потоковой передачи данных из SQL в процессы R и параллелизации кольцо MPI.Additional performance gains are achieved by streaming data from SQL to R processes and MPI ring parallelization.

T-SQL можно использовать PREDICT функцию для выполнения оценки собственного на предварительно обученной модели, которая ранее была сохранена в требуемый двоичный формат.You can use the T-SQL PREDICT function to perform native scoring on a pre-trained model that has been previously saved in the required binary format.

Стратегия поддержка LinuxLinux support roadmap

Машинное обучение с помощью R или Python в базе данных в настоящее время не поддерживается в SQL Server в Linux.Machine learning using R or Python in-database is not currently supported in SQL Server on Linux. Найдите объявления в более поздней версии.Look for announcements in a later release.

Однако в Linux могут выполнять оценки собственного с помощью функции ПРОГНОЗИРОВАНИЯ T-SQL.However, on Linux you can perform native scoring using the T-SQL PREDICT function. Оценки собственного позволяет оценки из предварительно обученные модели очень быстро, без вызова или даже требования среды выполнения R.Native scoring lets you score from a pretrained model very fast, without calling or even requiring an R runtime. Это означает, что SQL Server в Linux можно использовать для создания прогнозов очень быстро, для обслуживания клиентских приложений.This means you can use SQL Server on Linux to generate predictions very fast, to serve client applications.

Стратегия базы данных SQL AzureAzure SQL Database roadmap

Ограниченная поддержка R в базе данных SQL Azure: доступен только в Западная центральной части США, в службах, созданных на уровне Premium.There is limited support for R in Azure SQL Database: available only in West Central US, in services created at the Premium tier. Развернутое покрытия, включая поддержку Python, скорее всего, выполните в будущем выпуске.Expanded coverage, including Python support, is likely to follow in a future release. Однако есть не запланированная дата их выпуска в данный момент.However, there is no projected release date at this time.

Следующие шагиNext steps