microsoftml (пакет Python в Службах машинного обучения SQL Server)microsoftml (Python package in SQL Server Machine Learning Services)

Применимо к:Applies to: даSQL Server 2017 (14.x);SQL Server 2017 (14.x)yesSQL Server 2017 (14.x);SQL Server 2017 (14.x) и более поздние версииПрименимо к:Applies to: даSQL Server 2017 (14.x);SQL Server 2017 (14.x)yesSQL Server 2017 (14.x);SQL Server 2017 (14.x) and later

microsoftml — это пакет Python от Майкрософт, предоставляющий высокопроизводительные алгоритмы машинного обучения.microsoftml is a Python package from Microsoft that provides high-performance machine learning algorithms. Он включает в себя функции для обучения и преобразований, оценки, анализа текста и изображений, а также извлечения компонентов для получения значений из существующих данных.It includes functions for training and transformations, scoring, text and image analysis, and feature extraction for deriving values from existing data. Пакет входит в состав Служб машинного обучения SQL Server и поддерживает высокую производительность при работе с большими данными, используя многоядерную обработку и быструю потоковую передачу данных.The package is included in SQL Server Machine Learning Services and supports high performance on big data, using multicore processing, and fast data streaming.

Полная справочная документацияFull reference documentation

Пакет microsoftml распространяется в нескольких продуктах Майкрософт, но его использование не зависит от того, получили ли вы его в SQL Server или в другом продукте.The microsoftml package is distributed in multiple Microsoft products, but usage is the same whether you get the package in SQL Server or another product. Благодаря сходству функций документация по отдельным функциям microsoftml опубликована только в одном разделе в справочнике по Python для Microsoft Machine Learning Server.Because the functions are the same, documentation for individual microsoftml functions is published to just one location under the Python reference for Microsoft Machine Learning Server. Если для конкретных продуктов функции будут действовать иначе, выявленные расхождения будут приведены на странице справки по функциям.Should any product-specific behaviors exist, discrepancies will be noted in the function help page.

Версии и платформыVersions and platforms

Модуль microsoftml основан на Python 3.5 и доступен только при установке одного из следующих продуктов или скачиваемых файлов Майкрософт:The microsoftml module is based on Python 3.5 and available only when you install one of the following Microsoft products or downloads:

Примечание

В SQL Server 2017 полные версии выпусков продуктов доступны только для Windows.Full product release versions are Windows-only in SQL Server 2017. В SQL Server 2019 библиотека microsoftml поддерживает Windows и Linux.Both Windows and Linux are supported for microsoftml in SQL Server 2019.

Зависимости пакетовPackage dependencies

Алгоритмы в microsoftml используют revoscalepy для следующего:Algorithms in microsoftml depend on revoscalepy for:

  • Объекты источников данных.Data source objects. Данные, потребляемые функциями microsoftml, создаются с помощью функций revoscalepy.Data consumed by microsoftml functions are created using revoscalepy functions.
  • Удаленное вычисление (перенос выполнения функций в удаленный экземпляр SQL Server).Remote computing (shifting function execution to a remote SQL Server instance). Пакет revoscalepy предоставляет функции для создания и активации контекста удаленных вычислений для SQL Server.The revoscalepy package provides functions for creating and activating a remote compute context for SQL server.

В большинстве случаев при использовании microsoftml пакеты будут загружаться вместе.In most cases, you will load the packages together whenever you are using microsoftml.

Функции по категориямFunctions by category

Чтобы можно было понять, как использовать каждую функцию, в этом разделе приводится описание функций по категориям.This section lists the functions by category to give you an idea of how each one is used. Для поиска функций в алфавитном порядке можно воспользоваться оглавлением.You can also use the table of contents to find functions in alphabetical order.

1. Функции обучения1-Training functions

ФункцияFunction ОписаниеDescription
microsoftml.rx_ensemblemicrosoftml.rx_ensemble Обучение ансамбля моделей.Train an ensemble of models.
microsoftml.rx_fast_forestmicrosoftml.rx_fast_forest Случайный лес.Random Forest.
microsoftml.rx_fast_linearmicrosoftml.rx_fast_linear Линейная модель.Linear Model. Метод стохастической оптимизации с двойными координатами.with Stochastic Dual Coordinate Ascent.
microsoftml.rx_fast_treesmicrosoftml.rx_fast_trees Повышенные деревья.Boosted Trees.
microsoftml.rx_logistic_regressionmicrosoftml.rx_logistic_regression Логистическая регрессия.Logistic Regression.
microsoftml.rx_neural_networkmicrosoftml.rx_neural_network Нейронная сеть.Neural Network.
microsoftml.rx_oneclass_svmmicrosoftml.rx_oneclass_svm Обнаружение аномалий.Anomaly Detection.

2. Функции преобразования2-Transform functions

Обработка категориальных переменныхCategorical variable handling

ФункцияFunction ОписаниеDescription
microsoftml.categoricalmicrosoftml.categorical Преобразует текстовый столбец в категории.Converts a text column into categories.
microsoftml.categorical_hashmicrosoftml.categorical_hash Хэширует и преобразует текстовый столбец в категории.Hashes and converts a text column into categories.

Управление схемойSchema manipulation

ФункцияFunction ОписаниеDescription
microsoftml.concatmicrosoftml.concat Сцепляет несколько столбцов в один вектор.Concatenates multiple columns into a single vector.
microsoftml.drop_columnsmicrosoftml.drop_columns Удаляет столбцы из набора данных.Drops columns from a dataset.
microsoftml.select_columnsmicrosoftml.select_columns Сохраняет столбцы из набора данных.Retains columns of a dataset.

переменные, выборVariable selection

ФункцияFunction ОписаниеDescription
microsoftml.count_selectmicrosoftml.count_select Выбор признаков на основе количества.Feature selection based on counts.
microsoftml.mutualinformation_selectmicrosoftml.mutualinformation_select Выбор признаков на основе взаимной информации.Feature selection based on mutual information.

Текстовая аналитикаText analytics

ФункцияFunction ОписаниеDescription
microsoftml.featurize_textmicrosoftml.featurize_text Преобразует текстовые столбцы в числовые признаки.Converts text columns into numerical features.
microsoftml.get_sentimentmicrosoftml.get_sentiment Анализ тональности.Sentiment analysis.

Аналитика изображенийImage analytics

ФункцияFunction ОписаниеDescription
microsoftml.load_imagemicrosoftml.load_image Загружает изображение.Loads an image.
microsoftml.resize_imagemicrosoftml.resize_image Изменяет размеры изображения.Resizes an Image.
microsoftml.extract_pixelsmicrosoftml.extract_pixels Извлекает пиксели из изображения.Extracts pixels from an image.
microsoftml.featurize_imagemicrosoftml.featurize_image Преобразует изображение в признаки.Converts an image into features.

Функции добавления признаковFeaturization functions

ФункцияFunction ОписаниеDescription
microsoftml.rx_featurizemicrosoftml.rx_featurize Преобразование данных для источников данных.Data transformation for data sources

3. Функции оценки3-Scoring functions

КомпонентFunction ОписаниеDescription
microsoftml.rx_predictmicrosoftml.rx_predict Производит оценку с помощью модели машинного обучения Майкрософт.Scores using a Microsoft machine learning model

Вызов microsoftmlHow to call microsoftml

Функции в microsoftml вызываются в коде Python, инкапсулированном в хранимые процедуры.Functions in microsoftml are callable in Python code encapsulated in stored procedures. Большинство разработчиков создают решения microsoftml локально, а затем переносят готовый код Python в хранимые процедуры, отрабатывая, таким образом, процедуру развертывания.Most developers build microsoftml solutions locally, and then migrate finished Python code to stored procedures as a deployment exercise.

Пакет microsoftml для Python устанавливается по умолчанию, но, в отличие от revoscalepy, он не загружается по умолчанию при запуске сеанса Python с использованием исполняемых файлов Python, устанавливаемых с SQL Server.The microsoftml package for Python is installed by default, but unlike revoscalepy, it is not loaded by default when you start a Python session using the Python executables installed with SQL Server.

В качестве первого шага импортируйте пакет microsoftml, а затем импортируйте revoscalepy, если необходимо использовать удаленные контексты вычисления либо связанные объекты подключения и источники данных.As a first step, import the microsoftml package, and import revoscalepy if you need to use remote compute contexts or related connectivity or data source objects. Затем можно сослаться на нужные вам функции.Then, reference the individual functions you need.

from microsoftml.modules.logistic_regression.rx_logistic_regression import rx_logistic_regression
from revoscalepy.functions.RxSummary import rx_summary
from revoscalepy.etl.RxImport import rx_import_datasource

См. также разделSee also