dataprep_utilities 模块
用于与 azureml.dataprep 交互的实用工具方法。
函数
materialize_dataflow
通过一次性提取所有基础数据,将数据流具体化为 pandas 数据帧。 如果 as_numpy 设置为 True,则改为返回 ndarray
materialize_dataflow(dataflow: Any, as_numpy: bool = False) -> Union[pandas.core.frame.DataFrame, numpy.ndarray]
参数
- dataflow
必需
要检索的数据流
- as_numpy
默认值: False
如果数据需要具体化为 numpy 数组
返回
Pandas 数据帧或 Numpy ndarray
resolve_cv_splits_indices
解析 cv 拆分索引。
param cv_splits_indices: 数据流列表,其中每个数据流都表示一组拆分索引 type: list(azureml.dataprep.Dataflow) return: 解析后的 cv_splits_indices,如果类型不正确,则返回传入的原始值
resolve_cv_splits_indices(cv_splits_indices: List[azureml.dataprep.api.dataflow.Dataflow]) -> List[List[numpy.ndarray]]
参数
- cv_splits_indices
retrieve_numpy_array
从数据流中检索 pandas 数据帧并返回基础 ndarray。
param dataflow: 要检索的数据流 type: azureml.dataprep.Dataflow return: 检索到的 np.ndarray,如果类型不正确,则返回原始数据流值
retrieve_numpy_array(dataflow: Any) -> numpy.ndarray
参数
- dataflow
retrieve_pandas_dataframe
从数据流中检索 pandas 数据帧。
param dataflow: 要检索的数据流 type: azureml.dataprep.Dataflow return: 检索到的 pandas 数据帧,如果类型不正确,则返回原始数据流值
retrieve_pandas_dataframe(dataflow: Any) -> pandas.core.frame.DataFrame
参数
- dataflow
反馈
提交和查看相关反馈