セキュリティで保護されたワークスペースを使用する場合のネットワークトラフィックフロー

[アーティクル]
02/04/2024

Azure Machine Learning ワークスペースと関連付けられているリソースを Azure 仮想ネットワークに配置すると、リソース間のネットワークトラフィックが変わります。仮想ネットワークを使用しない場合、ネットワークトラフィックはパブリックインターネット経由で、あるいは Azure データセンター内で流れます。仮想ネットワークを導入したら、ネットワークセキュリティを強化することもできます。たとえば、仮想ネットワークとパブリックインターネットの間の受信と送信の通信をブロックできます。しかし、Azure Machine Learning では、パブリックインターネット上の一部のリソースへのアクセスが必要となります。たとえば、デプロイと管理の操作には Azure Resource Manager が使用されます。

この記事では、パブリックインターネットとの間の必要なトラフィックをリストします。また、次のシナリオにおいて、クライアントの開発環境とセキュリティで保護された Azure Machine Learning ワークスペースの間のネットワークトラフィックがどのように流れるかについて説明します。

Azure Machine Learning スタジオを使用して、以下を操作する:
- ワークスペース
- AutoML
- Designer
- データセットとデータストア
Azure Machine Learning スタジオは、Web ブラウザーで部分的に実行される Web ベースの UI です。これは Azure サービスを呼び出して、モデルのトレーニング、デザイナーの使用、データセットの表示などのタスクを実行します。これらの呼び出しの中には、Azure Machine Learning SDK、Azure CLI、REST API、Visual Studio Code を使用している場合とは異なる通信フローが使用されるものもあります。
Azure Machine Learning スタジオ、Azure Machine Learning SDK、Azure CLI、または REST API を使用して、以下を操作する:
- コンピューティングインスタンスとクラスター
- Azure Kubernetes Service (AKS)
- Azure Machine Learning によって管理される Docker イメージ

シナリオまたはタスクがここにリストされていない場合は、セキュリティで保護されたワークスペースの有無にかかわらず、同じように動作するはずです。

前提条件

この記事では、以下の構成を前提としています。

Azure Machine Learning ワークスペースで、仮想ネットワークとの通信にプライベートエンドポイントが使用されている。
ワークスペースで使用される Azure ストレージアカウント、キーコンテナー、およびコンテナーレジストリでも、仮想ネットワークとの通信にプライベートエンドポイントが使用されている。
クライアントワークステーションで、仮想ネットワークへのアクセスに VPN ゲートウェイまたは Azure ExpressRoute が使用されている。

受信と送信の要件

シナリオ	必要な受信	必要な送信	追加構成
スタジオからワークスペースにアクセスする	適用なし	Microsoft Entra ID Azure Front Door Azure Machine Learning	場合によっては、カスタム DNS サーバーを使用する必要があります。詳細については、カスタム DNS でのワークスペースの使用に関するページを参照してください。
スタジオから AutoML、デザイナー、データセット、およびデータストアを使用する	適用なし	適用なし	ワークスペースサービスプリンシパルを構成する信頼された Azure サービスからのアクセスを許可する詳細については、「仮想ネットワークを使用して Azure Machine Learning ワークスペースをセキュリティで保護する」を参照してください。
コンピューティングインスタンスとコンピューティングクラスターを使用する	Azure Machine Learning (ポート 44224) Azure Batch (ポート 29876 ～ 29877)	Microsoft Entra ID Azure Resource Manager Azure Machine Learning Azure Storage Azure Key Vault	ファイアウォールを使用する場合は、ユーザー定義のルートを作成します。詳細については、ネットワークの着信トラフィックおよび送信トラフィックの構成に関する記事を参照してください。
Azure Kubernetes Service を使用する	適用なし	AKS の送信構成については、「Azure Kubernetes Service 推論環境をセキュリティで保護する」を参照してください。
Azure Machine Learning によって管理される Docker イメージを使用する	適用なし	Microsoft アーティファクトレジストリ	ワークスペースのコンテナーレジストリが仮想ネットワークの背後にある場合は、コンピューティングクラスターを使用してイメージを作成するようにワークスペースを構成します。詳細については、「仮想ネットワークを使用して Azure Machine Learning ワークスペースをセキュリティで保護する」を参照してください。

ストレージアカウントの目的

Azure Machine Learning は複数のストレージアカウントを使用します。それぞれに異なるデータが保存され、目的も異なります。

ご使用のストレージ: Azure サブスクリプションのストレージアカウントにデータと成果物 (モデル、トレーニングデータ、トレーニングログ、Python スクリプトなど) が保存されます。たとえば、ワークスペースのデフォルトのストレージアカウントは、サブスクリプションに含まれています。 Azure Machine Learning のコンピューティングインスタンスとコンピューティングクラスターは、ポート 445 (SMB) と 443 (HTTPS) を介して、このストレージ内のファイルと BLOB データにアクセスします。

コンピューティングインスタンスまたはコンピューティングクラスターを使用する場合、ストレージアカウントは、SMB プロトコルを介してファイル共有としてマウントされます。コンピューティングインスタンスとクラスターでは、このファイル共有を使用して、データ、モデル、Jupyter ノートブック、データセットなどの項目が保存されます。コンピューティングインスタンスとクラスターでは、ストレージアカウントにアクセスするときにプライベートエンドポイントが使用されます。
Microsoft ストレージ: Azure Machine Learning コンピューティングインスタンスとコンピューティングクラスターは、Azure Batch に依存します。これらは Microsoft サブスクリプションにあるストレージにアクセスします。このストレージは、コンピューティングインスタンスまたはクラスターの管理にのみ使用されます。ここにはデータが格納されていません。コンピューティングインスタンスとコンピューティングクラスターは、ポート 443 (HTTPS) を使用して、このストレージ内の BLOB、テーブル、キューのデータにアクセスします。

Azure Machine Learning では、メタデータは Azure Cosmos DB インスタンスにも格納されます。既定では、このインスタンスは Microsoft サブスクリプションでホストされ、Microsoft によって管理されます。必要に応じて、Azure サブスクリプションで Azure Cosmos DB インスタンスを使用できます。詳細については、Azure Machine Learning を使用したデータの暗号化に関するページを参照してください。

シナリオ: スタジオからワークスペースにアクセスする

Note

このセクションの情報は、Azure Machine Learning スタジオからのワークスペースの使用に固有のものです。 Azure Machine Learning SDK、REST API、Azure CLI、または Visual Studio Code を使用する場合、このセクションの情報は適用されません。

スタジオからワークスペースにアクセスする場合、ネットワークトラフィックフローは次のようになります。

リソースに対して認証を行うために、構成では Microsoft Entra ID を使用します。
管理およびデプロイ操作の場合、構成では Azure Resource Manager を使用します。
Azure Machine Learning に固有のタスクの場合、構成では Azure Machine Learning service を使用します。
Azure Machine Learning スタジオへのアクセスについては、構成では Azure FrontDoor を使用します。
ほとんどのストレージ操作では、トラフィックは、ワークスペース用の既定のストレージのプライベートエンドポイントを経由して流れます。例外については、この記事の「スタジオから AutoML、デザイナー、データセット、およびデータストアを使用する」セクションで説明します。
また、仮想ネットワーク内のリソースの名前を解決できるようにする DNS ソリューションを構成する必要もあります。詳細については、カスタム DNS でのワークスペースの使用に関するページを参照してください。

スタジオを使用する場合のクライアントとワークスペースの間のネットワークトラフィックの図。

シナリオ: スタジオから AutoML、デザイナー、データセット、およびデータストアを使用する

Azure Machine Learning スタジオの次の機能では、''データプロファイル'' が使用されます。

データセット: スタジオからデータセットを調べます。
デザイナー: モジュールの出力データを視覚化します。
AutoML: データプレビューまたはプロファイルを表示し、ターゲット列を選択します。
ラベル付け: ラベルを使用して、機械学習プロジェクトのデータを準備します。

データプロファイルは、ワークスペース用の既定の Azure ストレージアカウントにアクセスする Azure Machine Learning マネージドサービスの機能に依存します。マネージドサービスは ''仮想ネットワークに存在しない'' ため、仮想ネットワーク内のストレージアカウントに直接アクセスすることはできません。代わりに、ワークスペースではサービスプリンシパルを使用してストレージにアクセスします。

ヒント

サービスプリンシパルは、ワークスペースを作成するときに指定できます。そうしないと、自動的に作成され、ワークスペースと同じ名前になります。

ストレージアカウントへのアクセスを許可するには、ワークスペースにリソースインスタンスを許可するようにストレージアカウントを構成するか、[信頼されたサービスの一覧にある Azure サービスがこのストレージアカウントにアクセスすることを許可します] を選択します。この設定により、マネージドサービスは Azure データセンターネットワークを介してストレージにアクセスできるようになります。

次に、ワークスペースのサービスプリンシパルを、ストレージアカウントのプライベートエンドポイントに対する閲覧者ロールに追加します。 Azure では、このロールは、ワークスペースとストレージサブネットの情報を確認するために使用されます。それらが同じである場合は、Azure によってアクセスが許可されます。最後に、サービスプリンシパルには、ストレージアカウントへの Blob データ共同作成者のアクセスも必要です。

詳細については、「仮想ネットワークを使用して Azure Machine Learning ワークスペースをセキュリティで保護する」の「Azure Storage アカウントをセキュリティで保護する」を参照してください。

クライアント、データプロファイル、およびストレージ間のトラフィックの図。

シナリオ: コンピューティングインスタンスとコンピューティングクラスターを使用する

Azure Machine Learning コンピューティングインスタンスとコンピューティングクラスターは、Microsoft によってホストされるマネージドサービスです。それらは Azure Batch サービス上に構築されます。これらは Microsoft マネージド環境に存在しますが、仮想ネットワークにも挿入されます。

コンピューティングインスタンスまたはコンピューティングクラスターを作成すると、次のリソースも仮想ネットワークに作成されます。

必要なアウトバウンド規則を使用するネットワークセキュリティグループ。これらの規則では、Azure Machine Learning (ポート 44224 の TCP) および Azure Batch (ポート 29876 から 29877 の TCP) からの "受信" アクセスが許可されます。

重要

ファイアウォールを使用して仮想ネットワークへのインターネットアクセスをブロックする場合は、このトラフィックを許可するようにファイアウォールを構成する必要があります。たとえば、Azure Firewall を使用して、ユーザー定義のルートを作成できます。詳細については、ネットワークの着信トラフィックおよび送信トラフィックの構成に関する記事を参照してください。
パブリック IP アドレスを使用するロードバランサー。

また、次のサービスタグへの送信アクセスを許可します。各タグについて、region をコンピューティングインスタンスまたはクラスターの Azure リージョンに置き換えます。

Storage.region: この送信アクセスは、Azure Batch マネージド仮想ネットワーク内の Azure ストレージアカウントに接続するために使用されます。
Keyvault.region: この送信アクセスは、Azure Batch マネージド仮想ネットワーク内の Azure Key Vault アカウントに接続するために使用されます。

コンピューティングインスタンスまたはクラスターからのデータアクセスは、仮想ネットワーク用のストレージアカウントのプライベートエンドポイントを経由します。

コンピューティングインスタンスで Visual Studio Code を使用する場合は、他の送信トラフィックを許可する必要があります。詳細については、ネットワークの着信トラフィックおよび送信トラフィックの構成に関する記事を参照してください。

コンピューティングインスタンスまたはクラスターを使用する場合のトラフィックフローの図。

シナリオ: オンラインエンドポイントを使用する

受信と送信の通信のセキュリティは、マネージドオンラインエンドポイント用に個別に構成します。

受信方向の通信

オンラインエンドポイントのスコアリング URL との受信通信は、エンドポイントの public_network_access フラグを使用してセキュリティで保護できます。フラグをに disabled 設定すると、オンラインエンドポイントは、Azure Machine Learning ワークスペースのプライベートエンドポイントを介してクライアントの仮想ネットワークからのみトラフィックを受け取ります。

エンドポイントの可視性は、Azure Machine Learning ワークスペースの public_network_access フラグによっても制御されます。このフラグが disabled の場合、スコアリングエンドポイントには、ワークスペースのプライベートエンドポイントを含む仮想ネットワークからのみアクセスできます。このフラグが enabled の場合、仮想ネットワークとパブリックネットワークからスコアリングエンドポイントにアクセスできます。

送信方向の通信

Azure Machine Learning ワークスペースのマネージド仮想ネットワーク分離を有効にすることで、デプロイからの送信通信を、ワークスペースレベルのセキュリティで保護できます。この設定を使用すると、Azure Machine Learning によってワークスペースのマネージド仮想ネットワークが作成されます。ワークスペースのマネージド仮想ネットワーク内のすべてのデプロイでは、送信通信に仮想ネットワークのプライベートエンドポイントを使用できます。

送信通信をセキュリティで保護するための従来のネットワーク分離方法は、デプロイの egress_public_network_access フラグを無効にすることで機能しました。代わりにワークスペースマネージド仮想ネットワークを使用して、デプロイ用の送信通信をセキュリティで保護できるようにすることを強くお勧めします。従来のアプローチとは異なり、デプロイでワークスペースマネージド仮想ネットワークを使用する場合、デプロイの egress_public_network_access フラグは適用されなくなりました。代わりに、ワークスペースのマネージド仮想ネットワークに設定した規則によって送信通信が制御されます。

シナリオ: Azure Kubernetes Service を使用する

Azure Kubernetes Service に必要な送信構成については、「仮想ネットワークを使用して Azure Machine Learning 推論環境をセキュリティで保護する」を参照してください。

Note

Azure Kubernetes Service のロードバランサーは、Azure Machine Learning によって作成されるロードバランサーと同じではありません。仮想ネットワークでのみ使用できるセキュリティで保護されたアプリケーションとしてモデルをホストするには、Azure Machine Learning によって作成される内部ロードバランサーを使用します。パブリックアクセスを許可する場合は、Azure Machine Learning によって作成されるパブリックロードバランサーを使用します。

モデルで外部データソースなどへの追加の受信または送信接続が必要な場合は、ネットワークセキュリティグループまたはファイアウォールを使用してトラフィックを許可します。

シナリオ: Azure Machine Learning によって管理される Docker イメージを使用する

Azure Machine Learning では、モデルのトレーニングや推論の実行に使用できる Docker イメージが提供されます。これらのイメージは、Microsoft アーティファクトレジストリでホストされます。

自分で指定したコンテナーレジストリなどの独自の Docker イメージを指定する場合は、アーティファクトレジストリとの送信通信は必要ありません。

ヒント

コンテナーレジストリが仮想ネットワークでセキュリティ保護されている場合、Azure Machine Learning では、Docker イメージをビルドするためにそれを使用することはできません。代わりに、イメージをビルドするために Azure Machine Learning コンピューティングクラスターを指定する必要があります。詳細については、「仮想ネットワークを使用して Azure Machine Learning ワークスペースをセキュリティで保護する」を参照してください。

提供された Docker イメージを使用する場合のトラフィックフローの図。

次のステップ

セキュリティで保護された構成でのネットワークトラフィックの流れについては学習しました。次は、仮想ネットワークの分離とプライバシーの概要の記事を読んで、仮想ネットワークでの Azure Machine Learning のセキュリティ保護について詳しく学習します。

ベストプラクティスについては、「Azure Machine Learning のエンタープライズセキュリティに関するベストプラクティス」の記事を参照してください。

次の方法で共有

セキュリティで保護されたワークスペースを使用する場合のネットワークトラフィックフロー

前提条件

受信と送信の要件

ストレージアカウントの目的

シナリオ: スタジオからワークスペースにアクセスする

シナリオ: スタジオから AutoML、デザイナー、データセット、およびデータストアを使用する

シナリオ: コンピューティングインスタンスとコンピューティングクラスターを使用する

シナリオ: オンラインエンドポイントを使用する

受信方向の通信

送信方向の通信

シナリオ: Azure Kubernetes Service を使用する

シナリオ: Azure Machine Learning によって管理される Docker イメージを使用する

次のステップ

その他のリソース

次の方法で共有

セキュリティで保護されたワークスペースを使用する場合のネットワーク トラフィック フロー

前提条件

受信と送信の要件

ストレージ アカウントの目的

シナリオ: スタジオからワークスペースにアクセスする

シナリオ: スタジオから AutoML、デザイナー、データセット、およびデータストアを使用する

シナリオ: コンピューティング インスタンスとコンピューティング クラスターを使用する

シナリオ: オンライン エンドポイントを使用する

受信方向の通信

送信方向の通信

シナリオ: Azure Kubernetes Service を使用する

シナリオ: Azure Machine Learning によって管理される Docker イメージを使用する

次のステップ

その他のリソース

セキュリティで保護されたワークスペースを使用する場合のネットワークトラフィックフロー

ストレージアカウントの目的

シナリオ: コンピューティングインスタンスとコンピューティングクラスターを使用する

シナリオ: オンラインエンドポイントを使用する