DatasetDefinition Osztály
Olyan lépések sorozatát határozza meg, amelyek meghatározzák, hogyan olvashatja és alakíthatja át az adatokat egy adatkészletben.
Megjegyzés
Ez az osztály elavult. További információ: https://aka.ms/dataset-deprecation.
Egy Azure Machine Learning-munkaterületen regisztrált adathalmaz több definícióval is rendelkezhet, amelyek mindegyike a hívásával update_definitionhozható létre. Minden definíció egyedi azonosítóval rendelkezik. A jelenlegi definíció a legutóbbi létrehozott definíció.
A nem regisztrált adathalmazok esetében csak egy definíció létezik.
Az adathalmaz-definíciók támogatják az osztályhoz <xref:azureml.dataprep.Dataflow> felsorolt összes átalakítást: lásd: http://aka.ms/azureml/howto/transformdata. Az adathalmaz-definíciókkal kapcsolatos további információkért látogasson el a webhelyre https://aka.ms/azureml/howto/versiondata.
Inicializálja az Adathalmazdefiníció objektumot.
- Öröklődés
-
azureml.dataprep.api.engineless_dataflow.EnginelessDataflowDatasetDefinition
Konstruktor
DatasetDefinition(workspace=None, dataset_id=None, version_id=None, dataflow=None, dataflow_json=None, notes=None, etag=None, created_time=None, modified_time=None, state=None, deprecated_by_dataset_id=None, deprecated_by_definition_version=None, data_path=None, dataset=None, file_type='Unknown')
Paraméterek
- dataflow_json
Az Adatfolyam json.
Metódusok
archive |
Archiválja az adathalmaz definícióját. |
create_snapshot |
Hozzon létre egy pillanatképet a regisztrált adatkészletről. |
deprecate |
Az adathalmaz elavult, az új adatkészletre mutató mutatóval. |
reactivate |
Az adathalmaz definíciójának újraaktiválása. Elavult vagy archivált adathalmaz-definíciókon dolgozik. |
to_pandas_dataframe |
Hozzon létre egy Pandas-adatkeretet az adathalmaz-definíció által definiált átalakítási folyamat végrehajtásával. |
to_spark_dataframe |
Hozzon létre egy Spark DataFrame-et, amely végrehajtja az adatfolyam által definiált átalakítási folyamatot. |
archive
Archiválja az adathalmaz definícióját.
archive()
Válaszok
Nincsenek.
Visszatérési típus
Megjegyzések
Az archiválás után az adathalmaz lekérésére tett kísérletek hibát eredményeznek. Ha véletlenül archiválja, használja reactivate az aktiválásához.
create_snapshot
Hozzon létre egy pillanatképet a regisztrált adatkészletről.
create_snapshot(snapshot_name, compute_target=None, create_data_snapshot=False, target_datastore=None)
Paraméterek
- snapshot_name
- str
A pillanatkép neve. A pillanatképek nevének egyedinek kell lennie egy adatkészleten belül.
- compute_target
- ComputeTarget vagy str
A pillanatképprofil létrehozására szolgáló számítási cél. Ha nincs megadva, a rendszer a helyi számítást használja.
- create_data_snapshot
- bool
Ha igaz, létrejön az adatok materializált másolata.
- target_datastore
- Union[AbstractAzureStorageDatastore, str]
A céladattár, ahová menteni szeretné a pillanatképet. Ha nincs megadva, a pillanatkép a munkaterület alapértelmezett tárolójában jön létre.
Válaszok
DatasetSnapshot objektum.
Visszatérési típus
Megjegyzések
A pillanatképek rögzítik az alapul szolgáló adatok időösszegző statisztikáit és magát az adatok egy opcionális másolatát. A pillanatképek létrehozásával kapcsolatos további információkért látogasson el a webhelyre https://aka.ms/azureml/howto/createsnapshots.
deprecate
Az adathalmaz elavult, az új adatkészletre mutató mutatóval.
deprecate(deprecate_by_dataset_id, deprecated_by_definition_version=None)
Paraméterek
- deprecate_by_dataset_id
- uuid
Az aktuális adathalmaz elavulásáért felelős adathalmaz-azonosító.
- deprecated_by_definition_version
- str
Az adathalmaz-definíció verziója, amely az aktuális adathalmaz-definíció elavulásáért felelős.
Válaszok
Nincsenek.
Visszatérési típus
Megjegyzések
Az elavult adathalmaz-definíciók a használatukkor naplóznak figyelmeztetéseket. Az adathalmaz-definíciók felhasználásának teljes letiltásához archiválja azt.
Ha egy adathalmaz-definíció véletlenül elavult, használja reactivate az aktiválását.
reactivate
Az adathalmaz definíciójának újraaktiválása.
Elavult vagy archivált adathalmaz-definíciókon dolgozik.
reactivate()
Válaszok
Nincsenek.
Visszatérési típus
to_pandas_dataframe
Hozzon létre egy Pandas-adatkeretet az adathalmaz-definíció által definiált átalakítási folyamat végrehajtásával.
to_pandas_dataframe()
Válaszok
Egy Pandas DataFrame.
Visszatérési típus
Megjegyzések
A Pandas DataFrame teljes mértékben materializált memóriát ad vissza.
to_spark_dataframe
Hozzon létre egy Spark DataFrame-et, amely végrehajtja az adatfolyam által definiált átalakítási folyamatot.
to_spark_dataframe()
Válaszok
Egy Spark DataFrame.
Visszatérési típus
Megjegyzések
A visszaadott Spark-adatkeret csak végrehajtási terv, és valójában nem tartalmaz adatokat, mivel a Spark Dataframe-ek lazán lesznek kiértékelve.
Visszajelzés
https://aka.ms/ContentUserFeedback.
Hamarosan elérhető: 2024-ben fokozatosan kivezetjük a GitHub-problémákat a tartalom visszajelzési mechanizmusaként, és lecseréljük egy új visszajelzési rendszerre. További információ:Visszajelzés küldése és megtekintése a következőhöz: