DiskBasedDataProvider 类

使用磁盘上的文件延迟加载到训练集的内存的数据提供程序。

继承
DiskBasedDataProvider

构造函数

DiskBasedDataProvider(pickled_data_file: str, seed: int = 314489979)

参数

pickled_data_file
seed
默认值: 314489979

方法

get_cross_validation_sets

返回一个由元组 (X_train, X_valid, y_train, y_valid) 表示的 CV 拆分的列表。

get_train_validation_sets

从输入数据集返回元组 (X_train, X_valid, y_train, y_valid)。

get_cross_validation_sets

返回一个由元组 (X_train, X_valid, y_train, y_valid) 表示的 CV 拆分的列表。

get_cross_validation_sets(column: Optional[str] = None) -> List[Tuple[Union[numpy.ndarray, pandas.core.frame.DataFrame, scipy.sparse.base.spmatrix], Union[numpy.ndarray, pandas.core.frame.DataFrame, scipy.sparse.base.spmatrix], Union[numpy.ndarray, pandas.core.series.Series, pandas.core.arrays.categorical.Categorical], Union[numpy.ndarray, pandas.core.series.Series, pandas.core.arrays.categorical.Categorical]]]

参数

column
默认值: None

get_train_validation_sets

从输入数据集返回元组 (X_train, X_valid, y_train, y_valid)。

get_train_validation_sets(column: Optional[str] = None) -> Tuple[Union[numpy.ndarray, pandas.core.frame.DataFrame, scipy.sparse.base.spmatrix], Union[numpy.ndarray, pandas.core.frame.DataFrame, scipy.sparse.base.spmatrix], Union[numpy.ndarray, pandas.core.series.Series, pandas.core.arrays.categorical.Categorical], Union[numpy.ndarray, pandas.core.series.Series, pandas.core.arrays.categorical.Categorical]]

参数

column
默认值: None