SQL Server 2019 のビッグデータクラスターで Machine Learning Services を使用して Python と R のスクリプトを実行する

[アーティクル]
03/21/2023

適用対象: SQL Server 2019 (15.x)

重要

Microsoft SQL Server 2019 ビッグデータクラスターのアドオンは廃止されます。 SQL Server 2019 ビッグデータクラスターのサポートは、2025 年 2 月 28 日に終了します。ソフトウェアアシュアランス付きの SQL Server 2019 を使用する既存の全ユーザーはプラットフォームで完全にサポートされ、ソフトウェアはその時点まで SQL Server の累積更新プログラムによって引き続きメンテナンスされます。詳細については、お知らせのブログ記事と「Microsoft SQL Server プラットフォームのビッグデータオプション」を参照してください。

Machine Learning Services を使用して SQL Server ビッグデータクラスターのマスターインスタンスで Python や R のスクリプトを実行できます。

注意

また、Java 言語拡張機能を使用して、SQL Server ビッグデータクラスターのマスターインスタンスで Java コードを実行することもできます。以下の手順に従うと、SQL Server言語拡張機能も有効になります。

Machine Learning Services を有効にする

Machine Learning Services は、SQL Server 2019 のビッグデータクラスターに既定でインストールされるため、個別にインストールする必要はありません。

Machine Learning Services を有効にするには、マスターインスタンスで次のステートメントを実行します。

EXEC sp_configure 'external scripts enabled', 1
RECONFIGURE WITH OVERRIDE
GO

ビッグデータクラスターのマスターインスタンスで、Python および R のスクリプトを実行する準備ができました。初めてスクリプトを実行する場合は、「次のステップ」の下のクイックスタートを参照してください。

注意

可用性グループリスナー接続で構成設定を設定することはできません。ビッグデータクラスターが高可用性で展開されている場合は、レプリカごとに external scripts enabled を設定します。「クラスターで高可用性を有効にする」を参照してください。

クラスターで高可用性を有効にする

高可用性で SQL Server ビッグデータクラスターを展開すると、その展開によってマスターインスタンスの可用性グループが作成されます。 Machine Learning Services を有効にするには、可用性グループの各インスタンスに external scripts enabled を設定します。ビッグデータクラスターの場合は、SQL Server マスターインスタンスの各レプリカで sp_configure を実行する必要があります。

次のセクションでは、各インスタンスで外部スクリプトを有効にする方法について説明します。

各インスタンスに対して外部ロードバランサーを作成する

可用性グループの各レプリカに対して、インスタンスへの接続を許可するロードバランサーを作成します。

kubectl expose pod <pod-name> --port=<connection port number> --name=<load-balancer-name> --type=LoadBalancer -n <kubernetes namespace>

この記事の例では、次の値を使用します。

<pod-name>: master-#
<connection port number>: 1533
<load-balancer-name>: mymaster-#
<kubernetes namespace>: mssql-cluster

ご利用の環境に合わせて次のスクリプトを更新して、コマンドを実行します。

kubectl expose pod master-0 --port=1533 --name=mymaster-0 --type=LoadBalancer -n mssql-cluster
kubectl expose pod master-1 --port=1533 --name=mymaster-1 --type=LoadBalancer -n mssql-cluster
kubectl expose pod master-2 --port=1533 --name=mymaster-2 --type=LoadBalancer -n mssql-cluster

kubectl によって次の出力が返されます。

service/mymaster-0 exposed
service/mymaster-1 exposed
service/mymaster-2 exposed

各ロードバランサーは、マスターレプリカのエンドポイントです。

各レプリカでスクリプトの実行を有効にする

マスターレプリカエンドポイントの IP アドレスを取得します。

次のコマンドは、レプリカエンドポイントの外部 IP アドレスを返します。

kubectl get services <load-balancer-name> -n <kubernetes namespace>

このシナリオで各レプリカの外部 IP アドレスを取得するには、次のコマンドを実行します。
```
kubectl get services mymaster-0 -n mssql-cluster
kubectl get services mymaster-1 -n mssql-cluster
kubectl get services mymaster-2 -n mssql-cluster
```
注意

外部 IP アドレスが使用可能になるまでに少し時間がかかることがあります。各エンドポイントが外部 IP アドレスを返すまで、上記のスクリプトを定期的に実行します。
マスターレプリカエンドポイントに接続し、スクリプトの実行を有効にします。

次のステートメントを実行します。
```
EXEC sp_configure 'external scripts enabled', 1
RECONFIGURE WITH OVERRIDE
GO
```
たとえば、sqlcmd を使用して上記のコマンドを実行できます。次の例では、マスターレプリカエンドポイントに接続し、スクリプトの実行を有効にします。スクリプトの値を実際の環境に合わせて更新します。
```
sqlcmd -S <IP address>,1533 -U <user name> -P <password> -Q "EXEC sp_configure 'external scripts enabled', 1; RECONFIGURE WITH OVERRIDE;"
```
レプリカごとにこのステップを繰り返します。

デモンストレーション

次の図は、このプロセスを示しています。

マスターレプリカエンドポイントを削除する

Kubernetes クラスターで、各レプリカのエンドポイントを削除します。エンドポイントは、負荷分散サービスとして Kubernetes で公開されます。

次のコマンドを実行すると、負荷分散サービスが削除されます。

kubectl delete svc <load-balancer-name> -n mssql-cluster

この記事の例では、次のコマンドを実行します。

kubectl delete svc mymaster-0 -n mssql-cluster
kubectl delete svc mymaster-1 -n mssql-cluster
kubectl delete svc mymaster-2 -n mssql-cluster

SQL Server 2019 のビッグデータクラスターで Machine Learning Services を使用して Python と R のスクリプトを実行する

Machine Learning Services を有効にする

クラスターで高可用性を有効にする

各インスタンスに対して外部ロードバランサーを作成する

各レプリカでスクリプトの実行を有効にする

デモンストレーション

マスターレプリカエンドポイントを削除する

SQL Server のビッグデータクラスターでの機械学習のクイックスタート

Python のクイックスタート

R のクイックスタート

SQL Server のビッグデータクラスターでの機械学習のチュートリアル

Python のチュートリアル

スキーレンタル (線形回帰)

顧客を分類する (K-Means クラスタリング)

NYC タクシーのヒント (分類)

R のチュートリアル

スキーレンタル (デシジョンツリー)

顧客を分類する (K-Means クラスタリング)

NYC タクシーのヒント (分類)

SQL Server のビッグデータクラスターでの機械学習の攻略ガイド

データ探索とモデリング

データ型の変換

デプロイ

予測

パッケージの管理

新しい Python パッケージのインストール

新しい R パッケージのインストール

Monitor

セキュリティ

Spark の機械学習

次のステップ

フィードバック

フィードバック

その他のリソース

SQL Server 2019 のビッグ データ クラスターで Machine Learning Services を使用して Python と R のスクリプトを実行する

Machine Learning Services を有効にする

クラスターで高可用性を有効にする

各インスタンスに対して外部ロード バランサーを作成する

各レプリカでスクリプトの実行を有効にする

デモンストレーション

マスター レプリカ エンドポイントを削除する

SQL Server のビッグ データ クラスターでの機械学習のクイックスタート

Python のクイックスタート

R のクイックスタート

SQL Server のビッグ データ クラスターでの機械学習のチュートリアル

Python のチュートリアル

スキー レンタル (線形回帰)

顧客を分類する (K-Means クラスタリング)

NYC タクシーのヒント (分類)

R のチュートリアル

スキー レンタル (デシジョン ツリー)

顧客を分類する (K-Means クラスタリング)

NYC タクシーのヒント (分類)

SQL Server のビッグ データ クラスターでの機械学習の攻略ガイド

データ探索とモデリング

データ型の変換

デプロイ

予測

パッケージの管理

新しい Python パッケージのインストール

新しい R パッケージのインストール

Monitor

セキュリティ

Spark の機械学習

次のステップ

フィードバック

フィードバック

その他のリソース

SQL Server 2019 のビッグデータクラスターで Machine Learning Services を使用して Python と R のスクリプトを実行する

各インスタンスに対して外部ロードバランサーを作成する

マスターレプリカエンドポイントを削除する

SQL Server のビッグデータクラスターでの機械学習のクイックスタート

SQL Server のビッグデータクラスターでの機械学習のチュートリアル

スキーレンタル (線形回帰)

スキーレンタル (デシジョンツリー)

SQL Server のビッグデータクラスターでの機械学習の攻略ガイド