dataset_utilities Module

Méthodes utilitaires pour l’interaction avec azureml.core.DataSet.

Fonctions

collect_usage_telemetry

collect_usage_telemetry(compute: Any, spark_context: Any, **kwargs: Any) -> None

Paramètres

compute
spark_context

convert_inputs

Convertir les jeux de données donnés en définitions pouvant être suivies.

convert_inputs(X: Any, y: Any, sample_weight: Any, X_valid: Any, y_valid: Any, sample_weight_valid: Any) -> Tuple[Any, Any, Any, Any, Any, Any]

Paramètres

X
Obligatoire

jeu de données représentant X

y
Obligatoire

jeu de données représentant y

sample_weight
Obligatoire

jeu de données représentant la pondération de l’échantillon

X_valid
Obligatoire

jeu de données représentant X_valid

y_valid
Obligatoire

jeu de données représentant y_valid

sample_weight_valid
Obligatoire

jeu de données représentant la pondération de l’échantillon de validation

convert_inputs_dataset

Convertir les jeux de données donnés en définitions pouvant être suivies.

convert_inputs_dataset(*datasets: Any) -> Tuple[Any, ...]

Paramètres

datasets
Obligatoire

jeux de données à convertir en définitions pouvant être suivies

ensure_saved

ensure_saved(workspace: Workspace, **kwargs: Any) -> None

Paramètres

workspace

get_dataset_from_mltable_data_json

Obtenir le jeu de données du JSON de données MLTable

get_dataset_from_mltable_data_json(ws: Workspace, mltable_data_json_obj: Dict[str, Any], data_label: MLTableDataLabel) -> AbstractDataset | None

Paramètres

ws
Obligatoire

espace de travail auprès duquel obtenir le jeu de données

mltable_data_json_obj
Obligatoire

objet JSON de données mltable

data_label
Obligatoire

étiquette indiquant le jeu de données à charger depuis le JSON de données mltable

get_datasets_from_data_json

Obtenir des jeux de données depuis le JSON de données qui peut être un JSON de données MLTable (avec un URI) ou un JSON Dataprep (avec un ID de jeu de données)

get_datasets_from_data_json(ws: Workspace, data_preparation_json: Dict[str, Any], data_labels: List[MLTableDataLabel]) -> Tuple[AbstractDataset | None, AbstractDataset | None, AbstractDataset | None]

Paramètres

ws
Obligatoire

espace de travail auprès duquel obtenir le jeu de données

data_preparation_json
Obligatoire

objet JSON de données

data_labels
Obligatoire

liste d’étiquettes indiquant le jeu de données à charger depuis le JSON de données

get_datasets_from_dataprep_json

Obtenir un jeu de données depuis le JSON Dataprep (avec un ID de jeu de données)

get_datasets_from_dataprep_json(ws: Workspace, dataprep_json: Dict[str, Any], data_labels: List[MLTableDataLabel]) -> Tuple[AbstractDataset | None, AbstractDataset | None, AbstractDataset | None]

Paramètres

ws
Obligatoire

espace de travail auprès duquel obtenir le jeu de données

data_preparation_json
Obligatoire

objet JSON de données

data_labels
Obligatoire

liste d’étiquettes indiquant le jeu de données à charger depuis le JSON de données

dataprep_json

get_datasets_from_mltable_data_json

Obtenir des jeux de données à partir du JSON de données MLTable (avec un URI)

get_datasets_from_mltable_data_json(ws: Workspace, mltable_data_json_obj: Dict[str, Any], data_labels: List[MLTableDataLabel]) -> Tuple[AbstractDataset | None, AbstractDataset | None, AbstractDataset | None]

Paramètres

ws
Obligatoire

espace de travail auprès duquel obtenir le jeu de données

data_preparation_json
Obligatoire

objet JSON de données

data_labels
Obligatoire

liste d’étiquettes indiquant le jeu de données à charger depuis le JSON de données

mltable_data_json_obj

get_datasets_json

Obtenir dataprep JSON.

get_datasets_json(training_data: Any | None = None, validation_data: Any | None = None, test_data: Any | None = None) -> str | None

Paramètres

training_data
Dataset
valeur par défaut: None

Données de formation.

validation_data
Dataset
valeur par défaut: None

Données de validation

test_data
Dataset
valeur par défaut: None

Données de test

Retours

Représentation sous forme de chaîne JSON d’un dictionnaire de jeux de données

is_dataset

Vérifier si l’objet donné est un jeu de données ou une définition de jeu de données.

is_dataset(dataset: Any) -> bool

Paramètres

dataset
Obligatoire

objet à vérifier