Partager via


PublicData Classe

Définit la classe de base des données publiques.

La classe des données publiques contient des propriétés et méthodes communes pour chaque jeu de données ouvert.

Initialisez avec des colonnes.

Héritage
builtins.object
PublicData

Constructeur

PublicData(cols: List[str] | None, enable_telemetry: bool = True)

Paramètres

cols
list
Obligatoire

Liste des noms de colonnes à enrichir.

enable_telemetry
bool
valeur par défaut: True

Indique s’il est nécessaire d’envoyer des données de télémétrie.

cols
Obligatoire

liste de noms de colonnes que l’utilisateur souhaite enrichir

enable_telemetry
Obligatoire

s’il faut envoyer des données de télémétrie

Méthodes

get_enricher

Obtient l’enrichissement.

to_pandas_dataframe

Vers la trame de données pandas.

to_spark_dataframe

Vers la trame de données spark.

get_enricher

Obtient l’enrichissement.

get_enricher()

to_pandas_dataframe

Vers la trame de données pandas.

to_pandas_dataframe()

to_spark_dataframe

Vers la trame de données spark.

to_spark_dataframe()

Attributs

cols

Obtient la liste des noms des colonnes à récupérer.

env

Retourne l’environnement d’exécution.

id

Obtient l’ID d’emplacement des données ouvertes.

registry_id

Obtient l’ID de registre de ce jeu de données public inscrit sur le serveur principal.

Azure utilise cet ID de registre pour récupérer les métadonnées les plus récentes, telles que l’emplacement de stockage. Vous devez vous attendre à ce que toutes les sous-classes de données publiques affectent _registry_id.

Retours

ID du registre.

Type de retour

str

logger

logger = <Logger azureml.opendatasets (DEBUG)>

mandatory_columns

mandatory_columns = []