dataaccess Paquet

Contient les fonctionnalités permettant de fournir des méthodes d’accès aux fichiers blob.

Quand vous utilisez une classe du package opendatasets, par exemple la classe ChicagoSafety, les classes et fonctions d’accès aux données de ce package sont utilisées en interne. En règle générale, vous n’avez pas besoin d’utiliser directement les fonctionnalités du package d’accès aux données.

Modules

base_blob_info

Contient la classe de base des informations d’objet blob.

blob_parquet_descriptor

Contient le descripteur du parquet de l’objet blob.

dataset_partition_prep

Contient les fonctionnalités permettant de spécifier la préparation du partitionnement du jeu de données.

La préparation du partitionnement s’effectue automatiquement, quand vous utilisez une classe opendatasets qui nécessite un partitionnement de données, par exemple la classe NycTlcGreen.

pandas_data_load_limit

Contient les fonctionnalités permettant de limiter le chargement des données Pandas quand des fichiers Parquet sont volumineux.

Avec les fonctionnalités de ce module, vous pouvez spécifier comment limiter le chargement des données Pandas quand des fichiers Parquet sont trop volumineux à charger.