dataprep_utilities 模块

用于与 azureml.dataprep 交互的实用工具方法。

函数

dataprep_error_handler

处理 dataprep 错误。

param e: dataprep 服务引发的异常 type: DprepException

dataprep_error_handler(e: azureml.dataprep.api.errorhandlers.DataPrepException) -> NoReturn

参数

e

get_dataprep_json

获取 dataprep json。

get_dataprep_json(X: Optional[Any] = None, y: Optional[Any] = None, sample_weight: Optional[Any] = None, X_valid: Optional[Any] = None, y_valid: Optional[Any] = None, sample_weight_valid: Optional[Any] = None, cv_splits_indices: Optional[Any] = None) -> Optional[str]

参数

X
<xref:azureml.dataprep.Dataflow>
默认值: None

训练特征。

y
<xref:azureml.dataprep.Dataflow>
默认值: None

训练标签。

sample_weight
<xref:azureml.dataprep.Dataflow>
默认值: None

训练数据的示例权重。

X_valid
<xref:azureml.dataprep.Dataflow>
默认值: None

验证特征。

y_valid
<xref:azureml.dataprep.Dataflow>
默认值: None

验证标签。

sample_weight_valid
<xref:azureml.dataprep.Dataflow>
默认值: None

验证集样本权重。

cv_splits_indices
<xref:azureml.dataprep.Dataflow>
默认值: None

自定义验证拆分索引。

返回

数据流的字典的 JSON 字符串表示形式

get_dataprep_json_dataset

获取 dataprep json。

get_dataprep_json_dataset(training_data: Optional[Any] = None, validation_data: Optional[Any] = None, test_data: Optional[Any] = None) -> Optional[str]

参数

training_data
<xref:azureml.dataprep.Dataflow>
默认值: None

训练数据。

validation_data
<xref:azureml.dataprep.Dataflow>
默认值: None

验证数据

test_data
<xref:azureml.dataprep.Dataflow>
默认值: None

测试数据

返回

数据流的字典的 JSON 字符串表示形式

is_dataflow

检查传递的对象是否为数据流类型。

is_dataflow(dataflow: Any) -> bool

参数

dataflow
必需

要检查的值。

返回

如果数据流的类型为 azureml.dataprep.Dataflow,则为 True

load_dataflows_from_json_dict

从 json 字典加载数据流。

load_dataflows_from_json_dict(dataflow_json_dict: Dict[str, Any]) -> Dict[str, Any]

参数

dataprep_json
str
必需

数据流的字典的 JSON 字符串表示形式

返回

键为数据流名称、值为数据流的字典,如果 JSON 格式错误,则为“无”

save_dataflows_to_json

将数据流保存到 json。

save_dataflows_to_json(dataflow_dict: Dict[str, Any]) -> Optional[str]

参数

dataflow_dict
dict(str, <xref:azureml.dataprep.Dataflow>)
必需

键为数据流名称、值为数据流的字典

返回

数据流的字典的 JSON 字符串表示形式