OpenDatasetBase Класс
Базовый класс открытого набора данных для наследования.
Создание открытых наборов данных.
- Наследование
-
OpenDatasetBase
Конструктор
OpenDatasetBase(cols: List[str] | None = None, enable_telemetry: bool = True, **kwargs)
Параметры
Список имен столбцов для загрузки из набора данных, по умолчанию — Нет.
- enable_telemetry
- bool
Указывает, следует ли включить телеметрию для этого набора данных, по умолчанию используется значение True.
Методы
get_file_dataset |
Возвращает файловый набор данных для открытого набора данных. |
get_tabular_dataset |
Инициализация AbstractTabularOpenDataset с помощью URL-адреса BLOB-объекта. |
to_pandas_dataframe |
К кадру данных Pandas. |
to_spark_dataframe |
К кадру данных Spark. |
get_file_dataset
Возвращает файловый набор данных для открытого набора данных.
get_file_dataset(start_date: datetime = None, end_date: datetime = None, enable_telemetry: bool = True, **kwargs) -> FileDataset
Параметры
Возвращаемое значение
файловый набор данных
Возвращаемый тип
get_tabular_dataset
Инициализация AbstractTabularOpenDataset с помощью URL-адреса BLOB-объекта.
get_tabular_dataset(start_date: datetime = None, end_date: datetime = None, cols: List[str] = None, enable_telemetry: bool = True, **kwargs) -> TabularDataset
Параметры
Список имен столбцов для извлечения. По всем столбцам вернется значение None.
Возвращаемое значение
Табличный набор данных
Возвращаемый тип
to_pandas_dataframe
К кадру данных Pandas.
to_pandas_dataframe() -> DataFrame
to_spark_dataframe
К кадру данных Spark.
to_spark_dataframe()
Атрибуты
cols
Возвращает список имен столбцов для извлечения.
data
Возвращает данные объекта OpenDataset.
id
Возвращает идентификатор расположения открытых данных.
log_properties
Возвращает свойства журнала.
registry_id
Получение идентификатора реестра этого общедоступного набора данных, зарегистрированного в серверной части.
Этот идентификатор реестра используется для получения последних метаданных, таких как место хранения. Однако, всем подклассам общедоступных данных должен быть назначен _registry_id.
Возвращаемое значение
Строка идентификатора реестра.
Возвращаемый тип
time_column_name
Имя столбца времени.
Обратная связь
https://aka.ms/ContentUserFeedback.
Ожидается в ближайшее время: в течение 2024 года мы постепенно откажемся от GitHub Issues как механизма обратной связи для контента и заменим его новой системой обратной связи. Дополнительные сведения см. в разделеОтправить и просмотреть отзыв по