DatasetDefinition Sınıf
Veri kümesindeki verilerin nasıl okunacağını ve dönüştürüleceğini belirten bir dizi adım tanımlar.
Not
Bu sınıf kullanım dışı bırakıldı. Daha fazla bilgi için bkz. https://aka.ms/dataset-deprecation.
Azure Machine Learning çalışma alanına kayıtlı bir veri kümesinin, her biri çağrılarak update_definitionoluşturulan birden çok tanımı olabilir. Her tanımın benzersiz bir tanımlayıcısı vardır. Geçerli tanım, oluşturulan en son tanımdır.
Kayıtlı olmayan Veri Kümeleri için yalnızca bir tanım vardır.
Veri kümesi tanımları, sınıfı için Dataflow listelenen tüm dönüştürmeleri destekler: bkz http://aka.ms/azureml/howto/transformdata. . Veri Kümesi Tanımları hakkında daha fazla bilgi edinmek için adresine https://aka.ms/azureml/howto/versiondatagidin.
- Devralma
-
azureml.dataprep.api.dataflow.DataflowDatasetDefinition
Oluşturucu
DatasetDefinition(workspace=None, dataset_id=None, version_id=None, dataflow=None, dataflow_json=None, notes=None, etag=None, created_time=None, modified_time=None, state=None, deprecated_by_dataset_id=None, deprecated_by_definition_version=None, data_path=None, dataset=None, file_type='Unknown')
Yöntemler
archive |
Veri kümesi tanımını arşivle. |
create_snapshot |
Kayıtlı Veri Kümesinin anlık görüntüsünü oluşturun. |
deprecate |
Yeni Veri Kümesinin işaretçisiyle Veri Kümesini kullanımdan kaldırın. |
reactivate |
Veri kümesi tanımını yeniden etkinleştirin. Kullanım dışı bırakılmış veya arşivlenmiş veri kümesi tanımlarında çalışır. |
to_pandas_dataframe |
Bu veri kümesi tanımı tarafından tanımlanan dönüştürme işlem hattını yürüterek bir Pandas veri çerçevesi oluşturun. |
to_spark_dataframe |
Bu Veri Akışı tarafından tanımlanan dönüştürme işlem hattını yürütebilen bir Spark DataFrame oluşturun. |
archive
Veri kümesi tanımını arşivle.
archive()
Döndürülenler
Yok.
Dönüş türü
Açıklamalar
Arşivlemeden sonra, veri kümesini alma girişimleri hataya neden olur. Yanlışlıkla arşivlenmişse etkinleştirmek için kullanın reactivate .
create_snapshot
Kayıtlı Veri Kümesinin anlık görüntüsünü oluşturun.
create_snapshot(snapshot_name, compute_target=None, create_data_snapshot=False, target_datastore=None)
Parametreler
- snapshot_name
- str
Anlık görüntü adı. Anlık görüntü adları bir Veri Kümesi içinde benzersiz olmalıdır.
- compute_target
- ComputeTarget veya str
Anlık görüntü profili oluşturmayı gerçekleştirmek için işlem hedefi. Atlanırsa, yerel işlem kullanılır.
- create_data_snapshot
- bool
True ise verilerin gerçekleştirilmiş bir kopyası oluşturulur.
- target_datastore
- Union[<xref:azureml.data.azure_storage_datastore.AbstractAzureStorageDatastore,str>]
Anlık görüntünün kaydedileceği hedef veri deposu. Atlanırsa, anlık görüntü çalışma alanının varsayılan depolama alanında oluşturulur.
Döndürülenler
DatasetSnapshot nesnesi.
Dönüş türü
Açıklamalar
Anlık görüntüler, temel alınan verilerin zaman özet istatistiklerini ve verilerin isteğe bağlı bir kopyasını yakalar. Anlık görüntüler oluşturma hakkında daha fazla bilgi edinmek için adresine https://aka.ms/azureml/howto/createsnapshotsgidin.
deprecate
Yeni Veri Kümesinin işaretçisiyle Veri Kümesini kullanımdan kaldırın.
deprecate(deprecate_by_dataset_id, deprecated_by_definition_version=None)
Parametreler
- deprecate_by_dataset_id
- uuid
Geçerli veri kümesinin kullanımdan kaldırılmasından sorumlu veri kümesi kimliği.
- deprecated_by_definition_version
- str
Geçerli veri kümesi tanımının kullanımdan kaldırılmasından sorumlu olan veri kümesi tanımı sürümü.
Döndürülenler
Yok.
Dönüş türü
Açıklamalar
Kullanım dışı bırakılan veri kümesi tanımları kullanıldığında uyarıları günlüğe kaydeder. Bir veri kümesi tanımının tüketilmesini tamamen engellemek için bunu arşivleyin.
Bir veri kümesi tanımı yanlışlıkla kullanım dışı bırakıldıysa, bunu etkinleştirmek için kullanın reactivate .
reactivate
Veri kümesi tanımını yeniden etkinleştirin.
Kullanım dışı bırakılmış veya arşivlenmiş veri kümesi tanımlarında çalışır.
reactivate()
Döndürülenler
Yok.
Dönüş türü
to_pandas_dataframe
Bu veri kümesi tanımı tarafından tanımlanan dönüştürme işlem hattını yürüterek bir Pandas veri çerçevesi oluşturun.
to_pandas_dataframe()
Döndürülenler
A Pandas DataFrame.
Dönüş türü
Açıklamalar
Bellekte tam olarak gerçekleştirilmiş bir Pandas DataFrame döndürür.
to_spark_dataframe
Bu Veri Akışı tarafından tanımlanan dönüştürme işlem hattını yürütebilen bir Spark DataFrame oluşturun.
to_spark_dataframe()
Döndürülenler
A Spark DataFrame.
Dönüş türü
Açıklamalar
Döndürülen Spark Veri Çerçevesi yalnızca bir yürütme planıdır ve Spark Dataframe'ler lazily olarak değerlendirildiğinden gerçekte herhangi bir veri içermez.
Geri Bildirim
Gönderin ve geri bildirimi görüntüleyin