automl_explain_utilities 模块

包含训练后用于解释 Azure 机器学习中的自动化机器学习模型的实用程序。

有关详细信息,请参阅:

AutoMLExplainerSetupClass

表示占位符类,用于与 Azure 机器学习解释包进行交互。

使用此模块中的 automl_setup_model_explanations 函数返回 AutoMLExplainerSetupClass。

ONNXEstimatorClassificationInferceHelperExplainabilityWrapper

自动化机器学习 ONNX 分类管道的包装器类。

此类实现标准 predict() 和 predict_proba() 函数。

ONNXEstimatorInferceHelperExplainabilityWrapper

用于实现标准 predict() 和 predict_proba() 的自动化机器学习 ONNX 管道的包装器基类。

ONNXEstimatorRegressionInferceHelperExplainabilityWrapper

用于实现标准 predict() 函数的自动化机器学习 ONNX 回归管道的包装器类。

StreamingPipelineExplainabilityWrapper

流式处理管道的包装器,用于实现 Azure 模型可解释性库预期的 API。

SurrogateModelTypes

定义自动化机器学习中使用的代理项模型以解释模型。

TimeseriesClassicalModelTypeChecker

用于检查模型或组合模型是否包含经典预测模型的实用工具。

此检查器还会检查经典预测模型的类型。 对于组合模型,它将检查:

  1. 内部模型是否为经典预测模型。
  2. 所有内部模型是否为仅使用目标列的预测模型。

函数

automl_check_model_if_explainable

检查自动化机器学习子运行是否可解释。

automl_check_model_if_explainable(run: Any, need_refresh_run: bool = True) -> bool

参数

run
Run
必需

自动化机器学习子运行。

need_refresh_run
bool
默认值: True

是否需要刷新运行。

返回

如果可以解释模型,则为“True”,否则为“False”。

automl_setup_model_explanations

设置用于解释自动化机器学习模型的特征化数据。

设置说明后,可以使用类 MimicWrapper 来计算和可视化特征重要性。 有关详细信息,请参阅可解释性:自动化机器学习中的模型说明

automl_setup_model_explanations(fitted_model: Union[sklearn.pipeline.Pipeline, azureml.automl.runtime.streaming_pipeline_wrapper.StreamingPipelineWrapper], task: str, X: Optional[Union[numpy.ndarray, pandas.core.frame.DataFrame, scipy.sparse.base.spmatrix, azureml.dataprep.api.dataflow.Dataflow, azureml.data.tabular_dataset.TabularDataset]] = None, X_test: Optional[Union[numpy.ndarray, pandas.core.frame.DataFrame, scipy.sparse.base.spmatrix, azureml.dataprep.api.dataflow.Dataflow, azureml.data.tabular_dataset.TabularDataset]] = None, y: Optional[Union[numpy.ndarray, pandas.core.series.Series, pandas.core.arrays.categorical.Categorical, azureml.dataprep.api.dataflow.Dataflow, azureml.data.tabular_dataset.TabularDataset]] = None, y_test: Optional[Union[numpy.ndarray, pandas.core.series.Series, pandas.core.arrays.categorical.Categorical, azureml.dataprep.api.dataflow.Dataflow, azureml.data.tabular_dataset.TabularDataset]] = None, features: Optional[List[str]] = None, automl_run: Optional[azureml.core.run.Run] = None, downsample: bool = True, **kwargs: Any) -> azureml.train.automl.runtime.automl_explain_utilities.AutoMLExplainerSetupClass

参数

fitted_model
必需

拟合的自动化机器学习模型。

task
Union[str, Tasks]
必需

“分类”、“回归”或“预测”任务类型,具体取决于所解决的机器学习问题的类型。

X
Union[DataFrame, ndarray, <xref:azureml.dataprep.Dataflow>, <xref:azureml.core.Dataset,azureml.data.TabularDataset>]
默认值: None

在自动化机器学习试验期间调整管道时使用的训练特征。

y
Union[DataFrame, ndarray, <xref:azureml.dataprep.Dataflow>, <xref:azureml.core.Dataset,azureml.data.TabularDataset>]
默认值: None

在自动化机器学习试验期间调整管道时使用的训练标签。

X_test
Union[DataFrame, ndarray, <xref:azureml.dataprep.Dataflow>, <xref:azureml.core.Dataset,azureml.data.TabularDataset>]
默认值: None

测试用于解释模型的数据。

y_test
Union[DataFrame, ndarray, <xref:azureml.dataprep.Dataflow>, <xref:azureml.core.Dataset,azureml.data.TabularDataset>]
默认值: None

解释模型所使用的 y 的试验数据。

features
list[str]
默认值: None

原始特征名称的列表。

downsample
bool
默认值: None

如果为 true,则如果样本数超过 5000 个,则对测试数据集进行下采样。 默认值为 True。

kwargs
dict
默认值: True

返回

模型的说明设置类。

返回类型