AksEndpoint クラス
Note
これは試験段階のクラスであり、いつでも変更される可能性があります。 詳細については、https://aka.ms/azuremlexperimental を参照してください。
Azure Kubernetes Service で実行されている同じエンドポイントの背後にある Web サービス バージョンのコレクションを表します。
AksWebservice が単一のスコアリング エンドポイントで 1 つのサービスをデプロイするのに対して、AksEndpoint クラスを使用すると、同じスコアリング エンドポイントの背後に複数の Web サービス バージョンをデプロイできます。 各 Web サービスのバージョンは、一定の割合のトラフィックを処理するように構成できます。これにより、たとえば A/B テストなどに適した、制御された方法でモデルをデプロイできます。 AksEndpoint では、AksWebservice と同様のモデル オブジェクトからデプロイできます。
Webservice インスタンスを初期化します。
Webservice コンストラクターは、指定されたワークスペースに関連付けられている Webservice オブジェクトのクラウド表現を取得します。 取得した Webservice オブジェクトの特定の型に対応する子クラスのインスタンスが返されます。
- 継承
-
AksEndpoint
コンストラクター
AksEndpoint(workspace, name)
パラメーター
変数
- versions
- dict[str, AksWebservice]
バージョン名からバージョン オブジェクトへのディクショナリ。 このエンドポイントの一部としてデプロイされたすべてのバージョンが含まれています。
メソッド
create_version |
指定されたプロパティを使用して、エンドポイントで新しいバージョンを追加します。 |
delete_version |
エンドポイント内のバージョンを削除します。 |
deploy_configuration |
AKS コンピューティング先にデプロイするための構成オブジェクトを作成します。 |
serialize |
この Webservice を JSON シリアル化された辞書に変換します。 |
update |
指定されたプロパティでエンドポイントを更新します。 None のままの値は、このエンドポイントでは変更されません。 |
update_version |
指定されたプロパティを使用して、エンドポイントで既存のバージョンを更新します。 None のままの値は、このバージョンでは変更されません。 |
create_version
指定されたプロパティを使用して、エンドポイントで新しいバージョンを追加します。
create_version(version_name, autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, cpu_cores=None, memory_gb=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, tags=None, properties=None, description=None, models=None, inference_config=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, traffic_percentile=None, is_default=None, is_control_version_type=None, cpu_cores_limit=None, memory_gb_limit=None)
パラメーター
- autoscale_enabled
- bool
エンドポイントでこのバージョンの自動スケーリングを有効にするかどうか。
num_replicas
が None の場合、既定値は True です。
- autoscale_target_utilization
- int
自動スケーラーがエンドポイントでこのバージョンに対して維持しようとする目標使用率 (最大 100%)。 既定値は 70 です。
- replica_max_concurrent_requests
- int
エンドポイントでこのバージョンに許可するレプリカあたりの最大同時要求数。 既定値は 1 です。 この設定は、マイクロソフト テクニカル サポートまたはマイクロソフトの Azure Machine Learning チームのメンバーの指示がない限り、既定値の 1 してください。
- num_replicas
- int
エンドポイントでこのバージョンに割り当てるコンテナーの数。 既定値はありません。このパラメーターが設定されない場合、自動スケーラーは既定で有効になります。
このエンドポイントに提供するキー値プロパティのディクショナリ。 これらのプロパティはデプロイ後に変更することはできませんが、新しいキーと値のペアを追加できます。
- failure_threshold
- int
Pod が起動し、liveness probe が失敗したとき、Kubernetes では、failureThreshold 回数だけ試し、それからあきらめます。 既定値は 3 です。 最大値は 1 です。
例外
delete_version
エンドポイント内のバージョンを削除します。
delete_version(version_name)
パラメーター
例外
deploy_configuration
AKS コンピューティング先にデプロイするための構成オブジェクトを作成します。
static deploy_configuration(autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, auth_enabled=None, cpu_cores=None, memory_gb=None, enable_app_insights=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, primary_key=None, secondary_key=None, tags=None, properties=None, description=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, namespace=None, token_auth_enabled=None, version_name=None, traffic_percentile=None, compute_target_name=None, cpu_cores_limit=None, memory_gb_limit=None)
パラメーター
- autoscale_enabled
- bool
エンドポイントでこのバージョンの自動スケーリングを有効にするかどうか。
num_replicas
が None の場合、既定値は True です。
- autoscale_target_utilization
- int
自動スケーラーがエンドポイントでこのバージョンに対して維持しようとする目標使用率 (最大 100%)。 既定値は 70 です。
- enable_app_insights
- bool
エンドポイントでこのバージョンの ApplicationInsights ログを有効にするかどうか。 既定値は False です。
- replica_max_concurrent_requests
- int
エンドポイントでこのバージョンに許可するレプリカあたりの最大同時要求数。 既定値は 1 です。 この設定は、マイクロソフト テクニカル サポートまたはマイクロソフトの Azure Machine Learning チームのメンバーの指示がない限り、既定値の 1 してください。
- num_replicas
- int
エンドポイントでこのバージョンに割り当てるコンテナーの数。 既定値はありません。このパラメーターが設定されない場合、自動スケーラーは既定で有効になります。
このエンドポイントに提供するキー値プロパティのディクショナリ。 これらのプロパティはデプロイ後に変更することはできませんが、新しいキーと値のペアを追加できます。
- failure_threshold
- int
Pod が起動し、liveness probe が失敗した場合、Kubernetes は failureThreshold
回試してから、あきらめます。 既定値は 3 です。 最大値は 1 です。
- namespace
- str
このエンドポイントをデプロイする Kubernetes 名前空間: 最大 63 文字の小文字の英数字 ('a'-'z'、'0'-'9') とハイフン ('-') 文字。 先頭と末尾の文字をハイフンにすることはできません。
- token_auth_enabled
- bool
このエンドポイントに対してトークン認証を有効にするかどうか。 これが有効になっている場合、ユーザーは Azure Active Directory の資格情報を使用してアクセス トークンを取得することにより、このエンドポイントにアクセスできます。 既定値は False です。
の戻り値の型 :
例外
serialize
この Webservice を JSON シリアル化された辞書に変換します。
serialize()
戻り値
この Webservice の JSON 表現。
の戻り値の型 :
例外
update
指定されたプロパティでエンドポイントを更新します。
None のままの値は、このエンドポイントでは変更されません。
update(auth_enabled=None, token_auth_enabled=None, enable_app_insights=None, description=None, tags=None, properties=None)
パラメーター
- token_auth_enabled
- bool
このエンドポイントに対してトークン認証を有効にするかどうか。 これが有効になっている場合、ユーザーは Azure Active Directory の資格情報を使用してアクセス トークンを取得することにより、このエンドポイントにアクセスできます。 既定値は False です。
- enable_app_insights
- bool
エンドポイントでこのバージョンの Application Insights ログを有効にするかどうか。 既定値は False です。
このエンドポイントに提供するキー値プロパティのディクショナリ。 これらのプロパティはデプロイ後に変更することはできませんが、新しいキーと値のペアを追加できます。
例外
update_version
指定されたプロパティを使用して、エンドポイントで既存のバージョンを更新します。
None のままの値は、このバージョンでは変更されません。
update_version(version_name, autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, cpu_cores=None, memory_gb=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, tags=None, properties=None, description=None, models=None, inference_config=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, traffic_percentile=None, is_default=None, is_control_version_type=None, cpu_cores_limit=None, memory_gb_limit=None)
パラメーター
- autoscale_enabled
- bool
エンドポイントでこのバージョンの自動スケーリングを有効にするかどうか。 num_replicas が None の場合、既定値は True です。
- autoscale_target_utilization
- int
自動スケーラーがエンドポイントでこのバージョンに対して維持しようとする目標使用率 (最大 100%)。 既定値は 70 です。
- replica_max_concurrent_requests
- int
エンドポイントでこのバージョンに許可するレプリカあたりの最大同時要求数。 既定値は 1 です。 この設定は、マイクロソフト テクニカル サポートまたはマイクロソフトの Azure Machine Learning チームのメンバーの指示がない限り、既定値の 1 してください。
- num_replicas
- int
エンドポイントでこのバージョンに割り当てるコンテナーの数。 既定値はありません。このパラメーターが設定されない場合、自動スケーラーは既定で有効になります。
このエンドポイントに提供するキー値プロパティのディクショナリ。 これらのプロパティはデプロイ後に変更することはできませんが、新しいキーと値のペアを追加できます。
- failure_threshold
- int
Pod が起動し、liveness probe が失敗したとき、Kubernetes では、failureThreshold 回数だけ試し、それからあきらめます。 既定値は 3 です。 最大値は 1 です。
例外
フィードバック
https://aka.ms/ContentUserFeedback」を参照してください。
以下は間もなく提供いたします。2024 年を通じて、コンテンツのフィードバック メカニズムとして GitHub の issue を段階的に廃止し、新しいフィードバック システムに置き換えます。 詳細については、「フィードバックの送信と表示