Новые возможности службы обучения машины в SQL ServerWhat's new in Machine Learning Services in SQL Server

В SQL Server 2016 Корпорация Майкрософт представила SQL Server R Services, компонент, который поддерживает обработки и анализа данных корпоративного уровня, интеграция языка R в SQL Server database engine.In SQL Server 2016, Microsoft introduced SQL Server R Services, a feature that supports enterprise-scale data science, by integrating the R language with the SQL Server database engine.

В 2017 г. SQL Server взаимодействующих с базами данных машинного обучения стала еще более мощные, добавляя поддержку популярных языка Python.In SQL Server 2017, database-integrated machine learning became even more powerful, with addition of support for the popular Python language. А также поддержка новых языков поступает новое имя: службы обучения машины (в базе данных).Along with the support for new languages comes a new name: Machine Learning Services (In-Database).

CATCH, то последняя объявление!Catch the latest announcement here! Python в 2017 г. SQL Server: усиленной в базе данных машинного обученияPython in SQL Server 2017: enhanced in-database machine learning

Новые возможности в SQL Server 2017What's new in SQL Server 2017

Машины обучения Server в SQL Server предоставляет полную поддержку построения и развертывания решений машины обучения в R или Python.Machine Learning Server in SQL Server provides comprehensive support for building and deploying machine learning solutions in either R or Python. Вот краткое описание этой версии.Here are the highlights of this release:

Новые возможности в накопительный пакет обновления 1 для SQL Server 2017 г.What's new in Cumulative Update 1 for SQL Server 2017

Теперь можно обновить компоненты Python и R сервер обучения машины 9.2.1.24.You can now upgrade your Python and R components to Machine Learning Server 9.2.1.24. Этот выпуск предлагает множество улучшений в revoscalepy и RevoScaleR, включая повышение производительности.This release features many enhancements to revoscalepy and RevoScaleR, including performance improvements.

Интеграция Python в базе данныхIn-database Python integration

Можно запустить Python в хранимых процедурах или Python удаленно с помощью имени компьютера SQL Server в контексте выполнения.You can run Python in stored procedures, or execute Python remotely using the SQL Server computer as the compute context. Такая интеграция открывает новые пути для подавляющего сообщества разработчиков Python и специалистов по анализу данных, чтобы использовать возможности SQL Server.This integration opens up new avenues for the vast community of Python developers and data scientists to use the power of SQL Server.

Разработчиков SQL Server предоставляет доступ к обширные библиотеки Python экосистему с открытым исходным кодом, включая наиболее популярных платформ, таких как scikit-узнать TensorFlow, Caffe и Theano/Keras.SQL Server developers gain access to the extensive Python libraries from the open source ecosystem, including popular frameworks such as scikit-learn, TensorFlow, Caffe, and Theano/Keras. И обязательно проанализируйте принципиально новые функциональные возможности от корпорации Майкрософт, таких как revoscalepy и microsoftml!And be sure to explore innovations from Microsoft such as revoscalepy and microsoftml!

Выполнение Python, практически не в базе данных машинного обучения, с каким образом.Running Python in-database isn't just about machine learning, by the way. Существует множество других возможных приложений для интеграции Python с SQL и использование возможности каждого из языков для обеспечения более разумно, мощные решения.There are a myriad of other potential applications for integrating Python with SQL, and using the power of each language to deliver more intelligent, powerful solutions.

  • revoscalepyrevoscalepy

    Этот выпуск включает окончательной версии revoscalepy, которые передают эквиваленты Python алгоритмов в RevoScaleR.This release includes the final version of revoscalepy, which supplies Python equivalents of the algorithms in RevoScaleR. Можно создавать модели Python для линейной и логистической регрессии, деревья принятия решений, повышенных деревьев и случайные леса, все параллельно и способны выполнялась в контекстах удаленных вычислений.You can create Python models for linear and logistic regressions, decision trees, boosted trees, and random forests, all parallelizable, and capable of being run in remote compute contexts.

    Дополнительные сведения см. в разделе возможности revoscalepy.For more information, see What is revoscalepy.

  • Контексты удаленных вычислений для PythonRemote compute contexts for Python

    Этот выпуск поддерживает использование нескольких источников данных и контекстах удаленных вычислений.This release supports use of multiple data sources and remote compute contexts. Специалист по анализу данных или разработчик могут выполнять код Python на удаленный экземпляр SQL Server, для просмотра данных или моделей создаются без перемещения данных.The data scientist or developer can execute Python code on a remote SQL Server, to explore data or build models without moving data. Контексты удаленных вычислений для использования требуется revoscalepy.Use of remote compute contexts requires revoscalepy.

  • Поддержка Python в Microsoft машины обучения Server (изолированный)Python support in Microsoft Machine Learning Server (Standalone)

    SQL Server 2017SQL Server 2017включает параметр, чтобы установить автономную машины обучения Microsoft Server. includes the option to install a standalone version of the Microsoft Machine Learning Server. С помощью сервера обучения машины, можно распространять и масштабировать кода R или Python без использования SQL Server.By using Machine Learning Server, you can distribute and scale R or Python code without using SQL Server.

Поддержка LinuxLinux support

Машинное обучение с помощью R или Python в базе данных в настоящее время не поддерживается в SQL Server в Linux.Machine learning using R or Python in-database is not currently supported in SQL Server on Linux. Найдите объявления в более поздней версии.Look for announcements in a later release.

Однако в Linux могут выполнять оценки собственного с помощью функции ПРОГНОЗИРОВАНИЯ T-SQL.However, on Linux you can perform native scoring using the T-SQL PREDICT function. Оценки собственного позволяет оценки из предварительно обученные модели очень быстро, без вызова или даже требования среды выполнения R.Native scoring lets you score from a pretrained model very fast, without calling or even requiring an R runtime. Это означает, что SQL Server в Linux можно использовать для создания прогнозов очень быстро, для обслуживания клиентских приложений.This means you can use SQL Server on Linux to generate predictions very fast, to serve client applications.

Новые алгоритмыNew algorithms

MicrosoftML пакет R и Python содержит алгоритмы состояние современных машинного обучения и преобразование данных, которое может быть масштабированный или выполнения в удаленных контекстов вычислений.The MicrosoftML package for both R and Python contains state-of-the-art machine learning algorithms and data transformation that can be scaled or run in remote compute contexts. Алгоритмы включают настраиваемые глубоких нейронных сетей, деревья принятия решений быстрого и леса принятия решений, линейной регрессии и логистической регрессии.Algorithms include customizable deep neural networks, fast decision trees and decision forests, linear regression, and logistic regression. Пакет MicrosoftML поставляется с интерфейсами R и Python.The MicrosoftML package comes with both R and Python interfaces.

Дополнительные сведения см. в разделе введение в MicrosoftML и microsoftml для Python.For more information, see Introduction to MicrosoftML and microsoftml for Python.

Ввода в эксплуатациюOperationalization

Этот выпуск содержит несколько параметров и возможностей развертывания и распространения задач машинного обучения:This release contains multiple options and features to help you deploy and distribute machine learning tasks:

  • Развертывание и интеграция решения машины Python, с помощью T-SQLDeploy and integrate machine Python solutions, using T-SQL

    Означает интеграции Python с помощью T-SQL, можно вызвать любой код Python с помощью sp_execute_external_script.The integration of Python with T-SQL means that you can call any Python code using sp_execute_external_script. Эта инфраструктура безопасности обеспечивает развертывание корпоративного уровня Python моделей и сценариев, которые могут вызываться из приложения с помощью простой хранимой процедуры.This secure infrastructure enables enterprise-grade deployment of Python models and scripts that can be called from an application using a simple stored procedure. Производительность является потоковой передачи данных из SQL в процессы Python и параллелизации кольцо MPI.Additional performance is by streaming data from SQL to Python processes and MPI ring parallelization.

  • mrsdeploy для Pythonmrsdeploy for Python

    Mrsdeploy пакетов для Машинного обучения сервераMachine Learning Server и Машинного обучения сервераMachine Learning Server поддерживает развертывание моделей Python и сценариев, как веб-службы.The mrsdeploy package for Машинного обучения сервераMachine Learning Server and Машинного обучения сервераMachine Learning Server supports deployment of Python models and scripts as web services. Пример такого подхода см. в разделе публикации и использования кода Python.For an example of how it works, see Publish and consume Python code.

  • ПроизводительностьPerformance

    Корпорация Майкрософт помещено границы производительности для оценки.Microsoft has pushed the boundaries of performance for scoring. С оценки в базе данных, обработки миллиона строк в секунду, с помощью R-модели.With in-database scoring, we processed a million rows per second using R models. В этом выпуске новые возможности для оценки в реальном времени и оценки собственного поддерживают более высокую производительность в одной строки и массовой оценки.In this release, new features for realtime scoring and native scoring support better performance in single-row and batch scoring.

Оценки в реальном времени и оценки собственногоRealtime scoring and native scoring

Использует собственные библиотеки C++ для чтения модели, хранящихся в оптимизированный двоичный формат и создавать прогнозы без необходимости вызывать среду выполнения R оценки в реальном времени.Realtime scoring relies on native C++ libraries to read a model stored in an optimized binary format, and then generate predictions without having to call the R runtime. В результате оценки операции гораздо быстрее.This makes scoring operations much faster.

Кроме того, этот выпуск SQL Server 2017SQL Server 2017 включает функцию машинного кода T-SQL для быстрой оценки, может выполняться в любом выпуске SQL Server, даже в Linux.Additionally, this release of SQL Server 2017SQL Server 2017 includes a native T-SQL function for fast scoring that can be run on any edition of SQL Server, even on Linux. Функция требует без установки R или дополнительной настройки.The function requires no installation of R or extra configuration. Это означает обучения модели в другом месте, сохраните его в SQL Server и затем выполнять количественную оценку без вызова R. Эта функция называется оценки собственного.This means you can train a model elsewhere, save it in SQL Server, and then perform scoring without ever calling R. This feature is referred to as native scoring.

  • Собственный оценки доступен только в SQL Server 2017SQL Server 2017.Native scoring is available only in SQL Server 2017SQL Server 2017. Он использует функцию T-SQL, которая может выполняться в любом выпуске SQL Server, включая Linux.It uses a T-SQL function that can run in any edition of SQL Server, including Linux.
    • В реальном времени оценки поддерживается в SQL Server 2017SQL Server 2017и в Microsoft Server обучения машины.Realtime scoring is supported in SQL Server 2017SQL Server 2017, and in Microsoft Machine Learning Server. Можно выполнить хранимую процедуру или выполнять оценки из кода R в реальном времени.You can run a stored procedure or perform realtime scoring from R code.
    • В реальном времени оценки может также использоваться для SQL Server 2016, если экземпляр обновляется до последней версии Microsoft R ServerMicrosoft R Server.Realtime scoring is also available for SQL Server 2016, if the instance is upgraded to the latest release of Microsoft R ServerMicrosoft R Server.

Дополнительные сведения см. в следующих статьях:For more information, see these articles:

Обновление компьютера, обучением и получить предварительно обученной моделиUpgrade your machine learning experience and get pre-trained models

Если вы установили более ранней версии служб SQL Server 2016 R, теперь можно обновить до последней версии путем переключения сервера для использования политики современных жизненного цикла программного обеспечения.If you installed an earlier version of SQL Server 2016 R Services, you can now upgrade to the latest version by switching your server to use the Modern Software Lifecycle policy. Таким образом, можно воспользоваться преимуществами быстрее цикл выпуска для R и автоматически обновить все компоненты R.By doing so, you can take advantage of a faster release cycle for R and automatically upgrade all R components. Дополнительные сведения см. в разделе новые возможности сервера обучения машины.For more information, see What's new in Machine Learning Server.

Программа установки также предлагает возможность установить коллекцию предварительно обученной модели в двоичном формате.The installer also offers the option to install a collection of pre-trained models in binary format. Эти модели поддерживают машинного обучения в сценариях, таких как распознавание изображений, где может быть трудно найти большие наборы данных для обучения модели.These models support machine learning in scenarios such as image recognition, where it might be difficult for customers to find large datasets to train a model. После установки одного из предварительно обученной модели, можно использовать для прогнозирования на ваших данных, не затрачивая время и расходы, участвующих в обучении модели таких больших и сложных.After you install one of the pre-trained models, you can use it for prediction on your own data without the time and expense involved in training such a large and complex model.

Дополнительные сведения см. в разделе установить предварительно обученной модели в SQL ServerFor more information, see Install pre-trained models in SQL Server

Управление пакетамиPackage management

Этот выпуск содержит множество улучшений в пакет управления для SQL Server.This release includes many improvements in package management for SQL Server. К ним относятся следующие объекты.These include:

  • Роли базы данных, чтобы помочь Администратору управлять пакетами и назначение разрешений для установки пакетовDatabase roles to help the DBA manage packages and assign permissions to install packages
  • Инструкции СОЗДАНИЯ ВНЕШНЕЙ БИБЛИОТЕКИ в T-SQL, чтобы помочь администраторам баз данных управления пакетами, не зная RThe CREATE EXTERNAL LIBRARY statement in T-SQL, to help DBAs manage packages without needing to know R
  • Широкий набор функций R, чтобы помочь установить, удалить или перечисление пакетов, принадлежащих пользователямA rich set of R functions to help install, remove, or list packages owned by users

Дополнительные сведения см. в разделе пакета управления.For more information, see Package management.

Начало работыGet started