dataset_utilities 模块
用于与 azureml.core.Dataset 交互的实用工具方法。
函数
collect_usage_telemetry
collect_usage_telemetry(compute: Any, spark_context: Any, **kwargs: Any) -> None
参数
- compute
- spark_context
convert_inputs
将给定的数据集转换为以可跟踪定义。
convert_inputs(X: Any, y: Any, sample_weight: Any, X_valid: Any, y_valid: Any, sample_weight_valid: Any) -> Tuple[Any, Any, Any, Any, Any, Any]
参数
- X
必需
表示 X 的数据集
- y
必需
表示 y 的数据集
- sample_weight
必需
表示样本权重的数据集
- X_valid
必需
表示 X_valid 的数据集
- y_valid
必需
表示 y_valid 的数据集
- sample_weight_valid
必需
表示验证样本权重的数据集
convert_inputs_dataset
将给定的数据集转换为以可跟踪定义。
convert_inputs_dataset(*datasets: Any) -> Tuple[Any, …]
参数
- datasets
必需
要转换为可跟踪定义的数据集
ensure_saved
ensure_saved(workspace: azureml.core.workspace.Workspace, **kwargs: Any) -> None
参数
- workspace
get_dataset_from_mltable_data_json
从 MLTable 数据 json 中获取数据集
get_dataset_from_mltable_data_json(ws: azureml.core.workspace.Workspace, mltable_data_json_obj: Dict[str, Any], data_label: azureml.automl.core.shared.constants.MLTableDataLabel) -> Optional[azureml.data.abstract_dataset.AbstractDataset]
参数
- ws
必需
从中获取数据集的工作区
- mltable_data_json_obj
必需
mltable 数据 json 对象
- data_label
必需
指示要从 mltable 数据 json 加载的数据集的标签
get_datasets_from_data_json
从数据 json 获取数据集,该数据 json 可以是 MLTable 数据 json(使用 URI)或 Dataprep json(使用数据集 ID)
get_datasets_from_data_json(ws: azureml.core.workspace.Workspace, data_preparation_json: Dict[str, Any], data_labels: List[azureml.automl.core.shared.constants.MLTableDataLabel]) -> Tuple[Optional[azureml.data.abstract_dataset.AbstractDataset], Optional[azureml.data.abstract_dataset.AbstractDataset], Optional[azureml.data.abstract_dataset.AbstractDataset]]
参数
- ws
必需
从中获取数据集的工作区
- data_preparation_json
必需
数据 json 对象
- data_labels
必需
指示要从数据 json 加载的数据集的标签列表
get_datasets_from_dataprep_json
从 Dataprep json(使用数据集 ID)获取数据集
get_datasets_from_dataprep_json(ws: azureml.core.workspace.Workspace, dataprep_json: Dict[str, Any], data_labels: List[azureml.automl.core.shared.constants.MLTableDataLabel]) -> Tuple[Optional[azureml.data.abstract_dataset.AbstractDataset], Optional[azureml.data.abstract_dataset.AbstractDataset], Optional[azureml.data.abstract_dataset.AbstractDataset]]
参数
- ws
必需
从中获取数据集的工作区
- data_preparation_json
必需
数据 json 对象
- data_labels
必需
指示要从数据 json 加载的数据集的标签列表
get_datasets_from_mltable_data_json
从 MLTable 数据 json(使用 URI)获取数据集
get_datasets_from_mltable_data_json(ws: azureml.core.workspace.Workspace, mltable_data_json_obj: Dict[str, Any], data_labels: List[azureml.automl.core.shared.constants.MLTableDataLabel]) -> Tuple[Optional[azureml.data.abstract_dataset.AbstractDataset], Optional[azureml.data.abstract_dataset.AbstractDataset], Optional[azureml.data.abstract_dataset.AbstractDataset]]
参数
- ws
必需
从中获取数据集的工作区
- data_preparation_json
必需
数据 json 对象
- data_labels
必需
指示要从数据 json 加载的数据集的标签列表
get_datasets_json
获取 dataprep json。
get_datasets_json(training_data: Optional[Any] = None, validation_data: Optional[Any] = None, test_data: Optional[Any] = None) -> Optional[str]
参数
返回
数据集的字典的 JSON 字符串表示形式
is_dataset
查看给定对象是否为数据集或数据集定义。
is_dataset(dataset: Any) -> bool
参数
- dataset
必需
要检查的对象
反馈
提交和查看相关反馈