DiskBasedDataProvider 类
使用磁盘上的文件延迟加载到训练集的内存的数据提供程序。
- 继承
-
DiskBasedDataProvider
构造函数
DiskBasedDataProvider(pickled_data_file: str, seed: int = 314489979)
参数
- pickled_data_file
- seed
默认值: 314489979
方法
| get_cross_validation_sets |
返回一个由元组 (X_train, X_valid, y_train, y_valid) 表示的 CV 拆分的列表。 |
| get_train_validation_sets |
从输入数据集返回元组 (X_train, X_valid, y_train, y_valid)。 |
get_cross_validation_sets
返回一个由元组 (X_train, X_valid, y_train, y_valid) 表示的 CV 拆分的列表。
get_cross_validation_sets(column: Optional[str] = None) -> List[Tuple[Union[numpy.ndarray, pandas.core.frame.DataFrame, scipy.sparse.base.spmatrix], Union[numpy.ndarray, pandas.core.frame.DataFrame, scipy.sparse.base.spmatrix], Union[numpy.ndarray, pandas.core.series.Series, pandas.core.arrays.categorical.Categorical], Union[numpy.ndarray, pandas.core.series.Series, pandas.core.arrays.categorical.Categorical]]]
参数
- column
默认值: None
get_train_validation_sets
从输入数据集返回元组 (X_train, X_valid, y_train, y_valid)。
get_train_validation_sets(column: Optional[str] = None) -> Tuple[Union[numpy.ndarray, pandas.core.frame.DataFrame, scipy.sparse.base.spmatrix], Union[numpy.ndarray, pandas.core.frame.DataFrame, scipy.sparse.base.spmatrix], Union[numpy.ndarray, pandas.core.series.Series, pandas.core.arrays.categorical.Categorical], Union[numpy.ndarray, pandas.core.series.Series, pandas.core.arrays.categorical.Categorical]]
参数
- column
默认值: None
反馈
提交和查看相关反馈