DatasetDefinition Osztály

Olyan lépések sorozatát határozza meg, amelyek meghatározzák, hogyan olvashatja és alakíthatja át az adatokat egy adatkészletben.

Megjegyzés

Ez az osztály elavult. További információ: https://aka.ms/dataset-deprecation.

Egy Azure Machine Learning-munkaterületen regisztrált adathalmaz több definícióval is rendelkezhet, amelyek mindegyike a hívásával update_definitionhozható létre. Minden definíció egyedi azonosítóval rendelkezik. A jelenlegi definíció a legutóbbi létrehozott definíció.

A nem regisztrált adathalmazok esetében csak egy definíció létezik.

Az adathalmaz-definíciók támogatják az osztályhoz <xref:azureml.dataprep.Dataflow> felsorolt összes átalakítást: lásd: http://aka.ms/azureml/howto/transformdata. Az adathalmaz-definíciókkal kapcsolatos további információkért látogasson el a webhelyre https://aka.ms/azureml/howto/versiondata.

Inicializálja az Adathalmazdefiníció objektumot.

Öröklődés
azureml.dataprep.api.engineless_dataflow.EnginelessDataflow
DatasetDefinition

Konstruktor

DatasetDefinition(workspace=None, dataset_id=None, version_id=None, dataflow=None, dataflow_json=None, notes=None, etag=None, created_time=None, modified_time=None, state=None, deprecated_by_dataset_id=None, deprecated_by_definition_version=None, data_path=None, dataset=None, file_type='Unknown')

Paraméterek

workspace
str
Kötelező

A munkaterület, amelyben az Adathalmaz regisztrálva van.

dataset_id
str
Kötelező

Az Adathalmaz azonosítója.

version_id
str
Kötelező

A definíció verziója.

dataflow
str
Kötelező

Az Adatfolyam objektum.

dataflow_json
Kötelező

Az Adatfolyam json.

notes
str
Kötelező

A definícióval kapcsolatos nem kötelező információk.

etag
str
Kötelező

Etag.

created_time
datetime
Kötelező

A definíció létrehozási ideje.

modified_time
datetime
Kötelező

A definíció utolsó módosítási időpontja.

deprecated_by_dataset_id
str
Kötelező

A definíciót elavuló adathalmaz azonosítója.

deprecated_by_definition_version
str
Kötelező

A definíció azon verziója, amely elavult.

data_path
DataPath
Kötelező

Az adatútvonal.

dataset
Dataset
Kötelező

A szülő adathalmaz-objektum.

Metódusok

archive

Archiválja az adathalmaz definícióját.

create_snapshot

Hozzon létre egy pillanatképet a regisztrált adatkészletről.

deprecate

Az adathalmaz elavult, az új adatkészletre mutató mutatóval.

reactivate

Az adathalmaz definíciójának újraaktiválása.

Elavult vagy archivált adathalmaz-definíciókon dolgozik.

to_pandas_dataframe

Hozzon létre egy Pandas-adatkeretet az adathalmaz-definíció által definiált átalakítási folyamat végrehajtásával.

to_spark_dataframe

Hozzon létre egy Spark DataFrame-et, amely végrehajtja az adatfolyam által definiált átalakítási folyamatot.

archive

Archiválja az adathalmaz definícióját.

archive()

Válaszok

Nincsenek.

Visszatérési típus

Megjegyzések

Az archiválás után az adathalmaz lekérésére tett kísérletek hibát eredményeznek. Ha véletlenül archiválja, használja reactivate az aktiválásához.

create_snapshot

Hozzon létre egy pillanatképet a regisztrált adatkészletről.

create_snapshot(snapshot_name, compute_target=None, create_data_snapshot=False, target_datastore=None)

Paraméterek

snapshot_name
str
Kötelező

A pillanatkép neve. A pillanatképek nevének egyedinek kell lennie egy adatkészleten belül.

compute_target
ComputeTarget vagy str
alapértelmezett érték: None

A pillanatképprofil létrehozására szolgáló számítási cél. Ha nincs megadva, a rendszer a helyi számítást használja.

create_data_snapshot
bool
alapértelmezett érték: False

Ha igaz, létrejön az adatok materializált másolata.

target_datastore
Union[AbstractAzureStorageDatastore, str]
alapértelmezett érték: None

A céladattár, ahová menteni szeretné a pillanatképet. Ha nincs megadva, a pillanatkép a munkaterület alapértelmezett tárolójában jön létre.

Válaszok

DatasetSnapshot objektum.

Visszatérési típus

Megjegyzések

A pillanatképek rögzítik az alapul szolgáló adatok időösszegző statisztikáit és magát az adatok egy opcionális másolatát. A pillanatképek létrehozásával kapcsolatos további információkért látogasson el a webhelyre https://aka.ms/azureml/howto/createsnapshots.

deprecate

Az adathalmaz elavult, az új adatkészletre mutató mutatóval.

deprecate(deprecate_by_dataset_id, deprecated_by_definition_version=None)

Paraméterek

deprecate_by_dataset_id
uuid
Kötelező

Az aktuális adathalmaz elavulásáért felelős adathalmaz-azonosító.

deprecated_by_definition_version
str
alapértelmezett érték: None

Az adathalmaz-definíció verziója, amely az aktuális adathalmaz-definíció elavulásáért felelős.

Válaszok

Nincsenek.

Visszatérési típus

Megjegyzések

Az elavult adathalmaz-definíciók a használatukkor naplóznak figyelmeztetéseket. Az adathalmaz-definíciók felhasználásának teljes letiltásához archiválja azt.

Ha egy adathalmaz-definíció véletlenül elavult, használja reactivate az aktiválását.

reactivate

Az adathalmaz definíciójának újraaktiválása.

Elavult vagy archivált adathalmaz-definíciókon dolgozik.

reactivate()

Válaszok

Nincsenek.

Visszatérési típus

to_pandas_dataframe

Hozzon létre egy Pandas-adatkeretet az adathalmaz-definíció által definiált átalakítási folyamat végrehajtásával.

to_pandas_dataframe()

Válaszok

Egy Pandas DataFrame.

Visszatérési típus

Megjegyzések

A Pandas DataFrame teljes mértékben materializált memóriát ad vissza.

to_spark_dataframe

Hozzon létre egy Spark DataFrame-et, amely végrehajtja az adatfolyam által definiált átalakítási folyamatot.

to_spark_dataframe()

Válaszok

Egy Spark DataFrame.

Visszatérési típus

Megjegyzések

A visszaadott Spark-adatkeret csak végrehajtási terv, és valójában nem tartalmaz adatokat, mivel a Spark Dataframe-ek lazán lesznek kiértékelve.