InMemoryDataProvider 类

使用训练数据的内存中表示形式的默认数据提供程序。

继承
InMemoryDataProvider

构造函数

InMemoryDataProvider(data: Union[Tuple[Union[numpy.ndarray, pandas.core.frame.DataFrame, scipy.sparse.base.spmatrix], Union[numpy.ndarray, pandas.core.series.Series, pandas.core.arrays.categorical.Categorical], azureml.automl.runtime.sampling.splitting_config.SplittingConfig], Dict[str, Tuple[Union[numpy.ndarray, pandas.core.frame.DataFrame, scipy.sparse.base.spmatrix], Union[numpy.ndarray, pandas.core.series.Series, pandas.core.arrays.categorical.Categorical], azureml.automl.runtime.sampling.splitting_config.SplittingConfig]]], seed: int = 314489979)

参数

data
seed
默认值: 314489979

方法

get_cross_validation_sets

返回一个由元组(X_train、y_train、X_valid、y_valid)表示的 CV 拆分的列表。

get_train_validation_sets

获取存储的训练和验证集。

get_cross_validation_sets

返回一个由元组(X_train、y_train、X_valid、y_valid)表示的 CV 拆分的列表。

get_cross_validation_sets(column: Optional[str] = None) -> List[Tuple[Union[numpy.ndarray, pandas.core.frame.DataFrame, scipy.sparse.base.spmatrix], Union[numpy.ndarray, pandas.core.frame.DataFrame, scipy.sparse.base.spmatrix], Union[numpy.ndarray, pandas.core.series.Series, pandas.core.arrays.categorical.Categorical], Union[numpy.ndarray, pandas.core.series.Series, pandas.core.arrays.categorical.Categorical]]]

参数

column
默认值: None

get_train_validation_sets

获取存储的训练和验证集。

get_train_validation_sets(column: Optional[str] = None) -> Tuple[Union[numpy.ndarray, pandas.core.frame.DataFrame, scipy.sparse.base.spmatrix], Union[numpy.ndarray, pandas.core.frame.DataFrame, scipy.sparse.base.spmatrix], Union[numpy.ndarray, pandas.core.series.Series, pandas.core.arrays.categorical.Categorical], Union[numpy.ndarray, pandas.core.series.Series, pandas.core.arrays.categorical.Categorical]]

参数

column
默认值: None

(可选)要采样的列。

返回

来自输入数据集的元组(X_train、X_valid、y_train、y_valid)。