AutoMLConfig Sınıf

Azure Machine Learning otomatik ML denemenin gönderilmesi için yapılandırmayı temsil eder.

Bu yapılandırma nesnesi, deneme çalıştırmasının yapılandırılması için parametreleri ve çalışma zamanında kullanılacak eğitim verilerini içerir ve devam ettirir. Ayarlarınızı seçme hakkında yönergeler için bkz https://aka.ms/AutoMLConfig ..

Devralma
builtins.object
AutoMLConfig

Oluşturucu

AutoMLConfig(task: str, path: typing.Union[str, NoneType] = None, iterations: typing.Union[int, NoneType] = None, primary_metric: typing.Union[str, NoneType] = None, positive_label: typing.Union[typing.Any, NoneType] = None, compute_target: typing.Union[typing.Any, NoneType] = None, spark_context: typing.Union[typing.Any, NoneType] = None, X: typing.Union[typing.Any, NoneType] = None, y: typing.Union[typing.Any, NoneType] = None, sample_weight: typing.Union[typing.Any, NoneType] = None, X_valid: typing.Union[typing.Any, NoneType] = None, y_valid: typing.Union[typing.Any, NoneType] = None, sample_weight_valid: typing.Union[typing.Any, NoneType] = None, cv_splits_indices: typing.Union[typing.List[typing.List[typing.Any]], NoneType] = None, validation_size: typing.Union[float, NoneType] = None, n_cross_validations: typing.Union[int, NoneType] = None, y_min: typing.Union[float, NoneType] = None, y_max: typing.Union[float, NoneType] = None, num_classes: typing.Union[int, NoneType] = None, featurization: typing.Union[str, azureml.automl.core.featurization.featurizationconfig.FeaturizationConfig] = 'auto', max_cores_per_iteration: int = 1, max_concurrent_iterations: int = 1, iteration_timeout_minutes: typing.Union[int, NoneType] = None, mem_in_mb: typing.Union[int, NoneType] = None, enforce_time_on_windows: bool = True, experiment_timeout_hours: typing.Union[float, NoneType] = None, experiment_exit_score: typing.Union[float, NoneType] = None, enable_early_stopping: bool = True, blocked_models: typing.Union[typing.List[str], NoneType] = None, blacklist_models: typing.Union[typing.List[str], NoneType] = None, exclude_nan_labels: bool = True, verbosity: int = 20, enable_tf: bool = False, model_explainability: bool = True, allowed_models: typing.Union[typing.List[str], NoneType] = None, whitelist_models: typing.Union[typing.List[str], NoneType] = None, enable_onnx_compatible_models: bool = False, enable_voting_ensemble: bool = True, enable_stack_ensemble: typing.Union[bool, NoneType] = None, debug_log: str = 'automl.log', training_data: typing.Union[typing.Any, NoneType] = None, validation_data: typing.Union[typing.Any, NoneType] = None, test_data: typing.Union[typing.Any, NoneType] = None, test_size: typing.Union[float, NoneType] = None, label_column_name: typing.Union[str, NoneType] = None, weight_column_name: typing.Union[str, NoneType] = None, cv_split_column_names: typing.Union[typing.List[str], NoneType] = None, enable_local_managed: bool = False, enable_dnn: bool = False, forecasting_parameters: typing.Union[azureml.automl.core.forecasting_parameters.ForecastingParameters, NoneType] = None, **kwargs: typing.Any) -> None

Parametreler

task
<xref:str> veya Tasks

Çalıştırılacak görevin türü. çözülecek otomatik ML sorununun türüne bağlı olarak değerler ' sınıflandırma ', ' gerileme ' veya ' tahmin ' olabilir.

path
<xref:str>

Azure Machine Learning proje klasörünün tam yolu. Belirtilmemişse, varsayılan olarak geçerli dizini veya "." kullanılır.

iterations
<xref:int>

otomatikleştirilmiş bir ML denemesi sırasında sınanacak farklı algoritma ve parametre birleşimlerinin toplam sayısı. Belirtilmemişse, varsayılan değer 1000 yinelemedir.

primary_metric
<xref:str> veya Metric

otomatik Machine Learning model seçimi için optimize edilecek ölçüm. otomatik Machine Learning, iyileştirebileceğinden daha fazla ölçüm toplar. get_primary_metricsVerilen göreviniz için geçerli ölçümlerin bir listesini almak için kullanabilirsiniz. Ölçümlerin nasıl hesaplandığı hakkında daha fazla bilgi için bkz https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric ..

Belirtilmemişse, Sınıflandırma görevleri için doğruluk kullanılır, tahmin ve gerileme görevleri için normalleştirilmiş kök ortalama kare kareleri kullanılır, görüntü sınıflandırması ve resim çoklu etiket sınıflandırması için doğruluk kullanılır ve görüntü nesnesi algılaması için Ortalama duyarlık kullanılır.

positive_label
<xref:Any>

otomatikleştirilmiş Machine Learning, ile ikili ölçümleri hesaplamak için kullanılacak olan pozitif sınıf etiketi. İkili ölçümler, Sınıflandırma görevleri için iki koşulda hesaplanır:

  1. etiket sütunu, positive_label geçirildiğinde, oto 'nin belirtilen pozitif sınıfı kullandığını gösteren iki sınıftan oluşur. Aksi halde, oto ml, etiket kodlu değere göre pozitif bir sınıf seçer.
  2. positive_label belirtilen çoklu sınıf sınıflandırma görevi

Sınıflandırma hakkında daha fazla bilgi için Sınıflandırma senaryolarına yönelik ölçümlerikullanıma alın.

compute_target
AbstractComputeTarget

Azure Machine Learning işlem hedefi otomatik Machine Learning denemeyi çalıştırmak için. https://docs.microsoft.com/en-us/azure/machine-learning/concept-automated-ml#local-remoteİşlem hedefleri hakkında daha fazla bilgi için bkz..

spark_context
<xref:SparkContext>

Spark bağlamı. Yalnızca Azure Databricks/Spark ortamında kullanıldığında geçerlidir.

X
DataFrame veya ndarray veya Dataset veya TabularDataset

Bir deneme sırasında işlem hatlarını sığdırırken kullanılacak eğitim özellikleri. Bu ayar kullanımdan kaldırılmıştır. Lütfen bunun yerine training_data ve label_column_name kullanın.

y
DataFrame veya ndarray veya Dataset veya TabularDataset

Bir deneme sırasında işlem hatlarını sığdırma sırasında kullanılacak eğitim etiketleri. Bu, modelinizin tahmin edilecek değerdir. Bu ayar kullanımdan kaldırılmıştır. Lütfen bunun yerine training_data ve label_column_name kullanın.

sample_weight
DataFrame veya ndarray veya TabularDataset

Her bir eğitim örneğine verilecek ağırlığa, her bir satırın X ve y verilerinde bir satıra karşılık gelmesi gerekir.

Belirtirken bu parametreyi belirtin X . Bu ayar kullanımdan kaldırılmıştır. Lütfen bunun yerine training_data ve weight_column_name kullanın.

X_valid
DataFrame veya ndarray veya Dataset veya TabularDataset

Bir deneme sırasında işlem hatlarını sığdırırken kullanılacak doğrulama özellikleri.

Belirtilmişse, daha sonra y_valid sample_weight_valid da belirtilmelidir. Bu ayar kullanımdan kaldırılmıştır. Lütfen bunun yerine validation_data ve label_column_name kullanın.

y_valid
DataFrame veya ndarray veya Dataset veya TabularDataset

Bir deneme sırasında işlem hatlarını sığdırma sırasında kullanılacak doğrulama etiketleri.

Her ikisi de X_valid y_valid birlikte belirtilmelidir. Bu ayar kullanımdan kaldırılmıştır. Lütfen bunun yerine validation_data ve label_column_name kullanın.

sample_weight_valid
DataFrame veya ndarray veya TabularDataset

Puanlama işlem hatlarını çalıştırırken her bir satır için verilecek ağırlık, X ve y verileri içindeki bir satıra karşılık gelmelidir.

Belirtirken bu parametreyi belirtin X_valid . Bu ayar kullanımdan kaldırılmıştır. Lütfen bunun yerine validation_data ve weight_column_name kullanın.

cv_splits_indices
<xref:List>[<xref:List>[ndarray]]

Çapraz doğrulama için eğitim verilerinin bölüneceği dizinler. Her satır ayrı bir çapraz katdır ve her çapraz katın içinde, ilk olarak, eğitim verileri için kullanılacak örneklerin indeksleriyle, ikincisi ise doğrulama verileri için kullanılacak dizinlerle birlikte 2 sayısal tuş y dizileri sağlar. Yani, [[T1, v1], [T2, v2],...] burada T1, ilk çapraz katlama ve v1 'nin eğitim dizinleri, ilk katlama için doğrulama dizinliğidir.

Mevcut verileri doğrulama verileri olarak belirtmek için kullanın validation_data . Bunun yerine eğitim verilerinden, oto ml 'nin doğrulama verilerinin ayıklanmasına izin vermek için n_cross_validations ya da belirtin validation_size . cv_split_column_namesİçinde çapraz doğrulama sütunsahipseniz kullanın training_data .

validation_size
<xref:float>

Kullanıcı doğrulama verileri belirtilmediğinde doğrulama için hangi verilerin ne kadar zaman aşımına uğrar. Bu, 0,0 ve 1,0 dahil değildir.

validation_dataDoğrulama verisi sağlamak için belirtin, aksi takdirde n_cross_validations validation_size belirtilen eğitim verilerinden doğrulama verilerini ayıklar veya ayıklayın. Özel çapraz doğrulama katlaması için kullanın cv_split_column_names .

Daha fazla bilgi için bkz. otomatik makine öğreniminde veri bölmelerini ve çapraz doğrulamayı yapılandırma.

n_cross_validations
<xref:int>

Kullanıcı doğrulama verileri belirtilmediğinde kaç tane çapraz doğrulama gerçekleştirilecek.

validation_dataDoğrulama verisi sağlamak için belirtin, aksi takdirde n_cross_validations validation_size belirtilen eğitim verilerinden doğrulama verilerini ayıklar veya ayıklayın. Özel çapraz doğrulama katlaması için kullanın cv_split_column_names .

Daha fazla bilgi için bkz. otomatik makine öğreniminde veri bölmelerini ve çapraz doğrulamayı yapılandırma.

y_min
<xref:float>

Regresyon denemesi için en düşük y değeri. Ve birleşimi, y_min y_max giriş veri aralığına göre test kümesi ölçümlerini normalleştirmek için kullanılır. Bu ayar kullanımdan kaldırılmıştır. Bunun yerine, bu değer verilerden hesaplanır.

y_max
<xref:float>

Regresyon denemesi için en büyük y değeri. Ve birleşimi, y_min y_max giriş veri aralığına göre test kümesi ölçümlerini normalleştirmek için kullanılır. Bu ayar kullanımdan kaldırılmıştır. Bunun yerine, bu değer verilerden hesaplanır.

num_classes
<xref:int>

Bir sınıflandırma denemesinde etiket verilerinde sınıfların sayısı. Bu ayar kullanımdan kaldırılmıştır. Bunun yerine, bu değer verilerden hesaplanır.

featurization
<xref:str> veya FeaturizationConfig

korleştirme adımının otomatik olarak yapılıp yapılmayacağını veya yüklenmediğini veya özelleştirilmiş Niteleştirme kullanılması gerekip gerekmediğini belirtmek için ' Auto '/' off '/FeaturizationConfig göstergesi. Note: giriş verileri seyrek ise, korleştirme açılamaz.

Sütun türü otomatik olarak algılanır. Algılanan sütun türü ön işleme/korleştirme temel alınarak aşağıdaki gibi yapılır:

  • Kategorik: hedef kodlama, bir sık kullanılan kodlama, yüksek kardinalite kategorilerini bırakma, ımpute eksik değerler.

  • Sayısal: ımpute eksik değerler, küme uzaklığı, kanıt ağırlığı.

  • DateTime: gün, saniye, dakika, saat vb. gibi çeşitli özellikler

  • Metin: sözcüklerin çantası, önceden eğitilen kelime ekleme, metin hedefi kodlaması.

Python 'da otomatik ML denemeleri yapılandırmamakalesinde daha fazla ayrıntı bulabilirsiniz.

Korleştirme adımını özelleştirmek için, Korturizationconfig nesnesi sağlayın. Özelleştirilmiş korleştirme Şu anda bir dönüştürücüler kümesini engellemeyi, sütun amacını güncelleştirmeyi, transformatör parametrelerini düzenlemenizi ve sütunları bırakmayı desteklemektedir. Daha fazla bilgi için bkz. özellik Mühendisliği özelleştirme.

Note: timeseries özellikleri, görev türü bu parametreden bağımsız tahmin olarak ayarlandığında ayrı olarak işlenir.

max_cores_per_iteration
<xref:int>

Belirli bir eğitim yinelemesi için kullanılacak en fazla iş parçacığı sayısı. Kabul edilebilir değerler:

  • 1 ' den büyük ve işlem hedefinde en fazla çekirdek sayısına eşit veya daha az.

  • -1 ' e eşit, bu, alt çalışma başına yineleme başına tüm olası çekirdekleri kullanmak anlamına gelir.

  • Varsayılan değer 1 ' e eşittir.

max_concurrent_iterations
<xref:int>

Paralel olarak yürütülecek en fazla yineleme sayısını temsil eder. Varsayılan değer 1’dir.

  • AmlCompute kümeleri düğüm başına çalışan tek bir dağıtımı destekler. Tek bir AmlCompute kümesi üzerinde paralel olarak yürütülen birden çok Recml denemesi üst çalıştırması için, max_concurrent_iterations tüm denemeleri değerlerinin toplamı en fazla düğüm sayısına eşit veya ondan daha az olmalıdır. Aksi takdirde, çalışma düğümleri kullanılabilir olana kadar çalıştırmalar sıraya alınır.

  • DSVM, düğüm başına birden çok yinelemeyi destekler. max_concurrent_iterations DSVM 'deki çekirdek sayısına eşit veya ondan daha az olmalıdır. Tek bir DSVM üzerinde paralel olarak birden çok denemeleri çalıştırması için, max_concurrent_iterations tüm denemeleri değerlerinin toplamı en fazla düğüm sayısından küçük veya buna eşit olmalıdır.

  • Databricks- max_concurrent_iterations databricks üzerindeki çalışan düğümlerinin sayısından küçük veya buna eşit olmalıdır.

max_concurrent_iterations Yerel çalıştırmalar için uygulanmaz. Bu parametre daha önce adlandırılmıştı concurrent_iterations .

iteration_timeout_minutes
<xref:int>

Her yinelemenin sonlandırılmadan önce çalışacağı en uzun süre (dakika cinsinden). Belirtilmemişse, 1 ay veya 43200 dakikalık bir değer kullanılır.

mem_in_mb
<xref:int>

Her yinelemenin sonlandırılmadan önce çalıştırabilmesi için en fazla bellek kullanımı. Belirtilmemişse, 1 PB veya 1073741824 MB bir değer kullanılır.

enforce_time_on_windows
<xref:bool>

Windows her yinelemede model eğitimi üzerinde bir zaman sınırı uygulanıp zorlanmayacağı. Varsayılan değer true 'dur. Bir Python betik dosyasından (. Kopyala) çalışıyorsa, Windows kaynak sınırlarına izin vermeye yönelik belgelere bakın.

experiment_timeout_hours
<xref:float>

Deneme sona ermeden önce tüm yinelemelerin birleştirilebilmesi için en fazla saat cinsinden süre. 15 dakikayı temsil eden 0,25 gibi bir ondalık değer olabilir. Belirtilmemişse, varsayılan deneme zaman aşımı 6 gündür. 1 saatten küçük veya buna eşit bir zaman aşımı belirtmek için veri kümenizin boyutunun 10.000.000 (satır sayısı sütunu) veya hata sonuçlarından büyük olmadığından emin olun.

experiment_exit_score
<xref:float>

Deneme için hedef puanı. Deneme bu puana ulaşıldıktan sonra sona erer. Belirtilmemişse (ölçüt yoksa), deneme, birincil ölçümde başka bir ilerleme yapılıncaya kadar çalışır. Çıkış kriterleri hakkında daha fazla bilgi için bu makaleyebakın.

enable_early_stopping
<xref:bool>

Puan, kısa vadede iyileştirilmediğini erken sonlandırmanın etkinleştirilip etkinleştirilmeyeceğini belirtir. Varsayılan değer true 'dur.

Erken durdurma mantığı:

  • İlk 20 yineleme (landiþaretleri) için erken durdurma yok.

  • Erken durdurulan pencere, 21 yinelemesi üzerinde başlar ve early_stopping_n_iters yinelemelerini arar

    (Şu anda 10 olarak ayarlanmıştır). Bu, durdurma işleminin gerçekleşebileceği ilk yinelemenin 31st olduğu anlamına gelir.

  • Oto, erken durdurulduktan sonra 2 ensebir yinelemeyi zamanlamayı hala zamanlar

    daha yüksek puanlar.

  • En iyi puanın mutlak değeri geçmişte hesaplanıyorsa, erken durdurma tetiklenir

    early_stopping_n_iters yinelemeler, diğer bir deyişle, early_stopping_n_iters yinelemeleri için puan artışı yoktur.

blocked_models
<xref:list>(<xref:str>) veya <xref:list>(Classification)<xref: for classification task,> veya <xref:list>(Regression)<xref: for regression task,> veya <xref:list>(Forecasting)<xref: for forecasting task>

Bir deneme için yoksayılacak algoritmaların listesi. enable_tfYanlış ise, TensorFlow modelleri içine dahil edilir blocked_models .

blacklist_models
<xref:list>(<xref:str>) veya <xref:list>(Classification)<xref: for classification task,> veya <xref:list>(Regression)<xref: for regression task,> veya <xref:list>(Forecasting)<xref: for forecasting task>

Kullanım dışı bırakılmış parametre, bunun yerine blocked_models kullanın.

exclude_nan_labels
<xref:bool>

Etikette NaN değeri olan satırların dışlanıp dışlanmayacağı. Varsayılan değer true 'dur.

verbosity
<xref:int>

Günlük dosyasına yazmak için ayrıntı düzeyi. Varsayılan değer BILGI veya 20 ' dir. Kabul edilebilir değerler, Python günlük kitaplığındatanımlanmıştır.

enable_tf
<xref:bool>

TensorFlow algoritmalarını etkinleştirmek/devre dışı bırakmak için kullanım dışı parametresi. Varsayılan değer false 'dur.

model_explainability
<xref:bool>

Tüm Oto ml eğitim yinelemelerinin sonunda en iyi bir oto modeli 'nin açıklanıp etkinleştirilmeyeceğini belirtir. Varsayılan değer true 'dur. Daha fazla bilgi için bkz. otomatik makine öğreniminde Yorumlenebilirlik: model açıklamaları.

allowed_models
<xref:list>(<xref:str>) veya <xref:list>(Classification)<xref: for classification task,> veya <xref:list>(Regression)<xref: for regression task,> veya <xref:list>(Forecasting)<xref: for forecasting task>

Bir deneme için aranacak model adlarının listesi. Belirtilmezse, görev için desteklenen tüm modeller, belirtilen blocked_models veya kullanım dışı olan TensorFlow modelleriyle eksi kullanılır. Her görev türü için desteklenen modeller SupportedModels sınıfında açıklanmıştır.

whitelist_models
<xref:list>(<xref:str>) veya <xref:list>(Classification)<xref: for classification task,> veya <xref:list>(Regression)<xref: for regression task,> veya <xref:list>(Forecasting)<xref: for forecasting task>

Kullanım dışı bırakılmış parametre, bunun yerine allowed_models kullanın.

enable_onnx_compatible_models
<xref:bool>

ONNX uyumlu modellerin zorlanıp etkinleştirilmeyeceğini veya devre dışı bırakılacağını belirtir. Varsayılan değer false 'dur. Open sinir Network Exchange (onnx) ve Azure Machine Learning hakkında daha fazla bilgi için bu makaleyebakın.

forecasting_parameters
ForecastingParameters

Tahmin edilen tüm parametreleri tutacak bir Forebir InParameters nesnesi.

time_column_name
<xref:str>

Zaman sütununun adı. Bu parametre, zaman serisini oluşturmak için kullanılan giriş verilerinde tarih saat sütununu belirlemek için tahmin edildiğinde ve sıklığını göstermek için gereklidir. Bu ayar kullanımdan kaldırılmıştır. Lütfen bunun yerine forecasting_parameters kullanın.

max_horizon
<xref:int>

Süre serisi sıklığında, istenen maksimum tahmin ufku. Varsayılan değer 1’dir.

Birimler, eğitim verilerinizin zaman aralığına göre yapılır, örneğin, aylık, haftalık, öngörülebilir bir şekilde tahmin etmelidir. Görev türü tahmin edildiğinde, bu parametre gereklidir. Tahmin parametreleri ayarlama hakkında daha fazla bilgi için bkz. bir zaman serisi tahmin modelini otomatik eğitme. Bu ayar kullanımdan kaldırılmıştır. Lütfen bunun yerine forecasting_parameters kullanın.

grain_column_names
<xref:str> veya <xref:list>(<xref:str>)

Bir timeseries 'i gruplandırmak için kullanılan sütunların adları. Bu, birden çok seri oluşturmak için kullanılabilir. Gren tanımlanmazsa, veri kümesinin bir adet zaman serisi olduğu varsayılır. Bu parametre, tahmin görev türü ile kullanılır. Bu ayar kullanımdan kaldırılmıştır. Lütfen bunun yerine forecasting_parameters kullanın.

target_lags
<xref:int> veya <xref:list>(<xref:int>)

Hedef sütundan gecikme için geçen dönemlerin sayısı. Varsayılan değer 1'dir. Bu ayar kullanımdan kaldırılmıştır. Lütfen bunun yerine forecasting_parameters kullanın.

Tahmin edildiğinde, bu parametre, verilerin sıklığından sonra hedef değerlerin gecikmesi için satır sayısını temsil eder. Bu bir liste veya tek tamsayı olarak temsil edilir. Bağımsız değişkenler ve bağımlı değişken arasındaki ilişki, varsayılan olarak eşleşmediğinden veya ilişkilendiribir şekilde eşleşmediği zaman, gecikme kullanılmalıdır. Örneğin, bir ürün için talebi tahmin edilmeye çalışırken, herhangi bir ay içindeki talep, önceki Commodities 3 ayın fiyatına göre değişebilir. Bu örnekte, modelin doğru ilişki üzerinde eğitim olması için hedefi (istek), 3 aya kadar bir süre sonra gecikme yapmak isteyebilirsiniz. Daha fazla bilgi için bkz. bir zaman serisi tahmin modelini otomatik eğitme.

feature_lags
<xref:str>

Sayısal özellikler için lags oluşturmaya yönelik bayrak. Bu ayar kullanımdan kaldırılmıştır. Lütfen bunun yerine forecasting_parameters kullanın.

target_rolling_window_size
<xref:int>

Hedef sütunun hareketli pencere ortalamasını oluşturmak için kullanılan geçmiş dönem sayısı. Bu ayar kullanımdan kaldırılmıştır. Lütfen bunun yerine forecasting_parameters kullanın.

Tahmin edildiğinde, bu parametre tahmin edilen değerler oluşturmak için kullanılan n geçmiş dönemi temsil eder <= eğitim kümesi boyutu. Atlanırsa, n tam eğitim kümesi boyutudur. Modele eğitim yaparken yalnızca belirli bir geçmişi düşünmek istediğinizde bu parametreyi belirtin.

country_or_region
<xref:str>

Tatil özellikleri oluşturmak için kullanılan ülke/bölge. Bunlar ISO 3166 2-harf ülke/bölge kodunu, örneğin ' US ' veya ' GB ' olmalıdır. Bu ayar kullanımdan kaldırılmıştır. Lütfen bunun yerine forecasting_parameters kullanın.

use_stl
<xref:str>

Zaman serisi hedef sütununun STL ayrıştırma yapılandırın. use_stl üç değer alabilir: hiçbiri (varsayılan)-STL ayrıştırma yok, ' mevsim '-yalnızca mevsim bileşeni oluşturma ve season_trend-hem mevsimi hem de eğilim bileşenlerini oluşturma. Bu ayar kullanımdan kaldırılmıştır. Lütfen bunun yerine forecasting_parameters kullanın.

seasonality
<xref:int> veya <xref:str>

Zaman serisi mevsimsellik ayarlayın. Mevsimsellik ' Auto ' olarak ayarlandıysa, bu algılanır. Bu ayar kullanımdan kaldırılmıştır. Lütfen bunun yerine forecasting_parameters kullanın.

short_series_handling_configuration
<xref:str>

Oto ml 'nin kısa zaman serisini nasıl işleyebileceğini tanımlayan parametre.

Olası değerler: ' Auto ' (varsayılan), ' Pad ', ' Drop ' ve None.

  • Otomatik kısa seri, uzun seri yoksa doldurulur, aksi takdirde kısa seriler bırakılır.
  • tüm kısa seriler doldurulur.
  • Tüm kısa serileri bırakma bırakılır ".
  • Hiçbiri kısa seri değiştirilmez. 'pad' olarak ayarlanırsa, tablo regresörler için sıfırlar ve boş değerlerle ve verilen zaman serisi kimliği için hedef değer ortana eşit olan hedef için rastgele değerlerle dolgulanır. Orta değer sıfırdan büyükse veya sıfıra eşitse, en küçük dolgulu değer sıfıra göre kırpılır: Giriş:

En az sayıda değerin dört olduğunu varsayarak çıktı:

Not: Hem eski hem de short_series_handling_configuration iki parametremiz short_series_handling. Her iki parametre de ayar olduğunda, bunları aşağıdaki tabloda gösterildiği gibi eşitleriz (kısa short_series_handling_configuration ve short_series_handling sırasıyla handling_configuration olarak işaretlenir).

freq
<xref:str> veya <xref:None>

Tahmin sıklığı.

Tahminde bulunurken, bu parametre tahminin isteneceği dönemi (örneğin günlük, haftalık, yıllık vb.) temsil eder. Tahmin sıklığı varsayılan olarak veri kümesi sıklığıdır. İsteğe bağlı olarak bunu veri kümesi sıklığından daha büyük (ancak daha küçük değil) olarak ayarlayabilirsiniz. Verileri topacak ve tahmin sıklığında sonuçları oluşturacak. Örneğin günlük veriler için sıklığı günlük, haftalık veya aylık olarak ancak saatlik olarak ayarlayabilirsiniz. Sıklığın bir pandas uzaklık diğer adı olması gerekir. Daha fazla bilgi için lütfen pandas belgelerine bakın: https://pandas.pydata.org/pandas-docs/stable/user_guide/timeseries.html#dateoffset-objects

target_aggregation_function
<xref:str> veya <xref:None>

Zaman serisi hedef sütununu kullanıcı tarafından belirtilen sıklıkla uyumlu olacak şekilde toplamak için kullanılacak işlev. Target_aggregation_function ancak küme parametresi ayarlanmazsa hata ortaya çıkar. Olası hedef toplama işlevleri: "sum", "max", "min" ve "mean".

enable_voting_ensemble
<xref:bool>

Voting'i etkinleştirme/devre dışı bırakma Yinelemeyi benzetme. Varsayılan değer True'dır. Grup grubu hakkında daha fazla bilgi için bkz. Grup yapılandırması.

enable_stack_ensemble
<xref:bool>

StackEnsemble yinelemesini etkinleştirme/devre dışı bırakma. Varsayılan değer Yok'dır. Enable_onnx_compatible_models bayrağı ayarlanırsa StackEnsemble yinelemesi devre dışı bırakılır. Benzer şekilde, Zaman zamanları görevleri için StackEnsemble yinelemesi, meta öğreniciyi sığdırmada kullanılan küçük eğitim kümesi nedeniyle fazla uygunlık risklerini önlemek için varsayılan olarak devre dışı bırakılır. Grup grubu hakkında daha fazla bilgi için bkz. Grup yapılandırması.

debug_log
<xref:str>

Hata ayıklama bilgilerini yazmak için günlük dosyası. Belirtilmezse, 'automl.log' kullanılır.

training_data
DataFrame veya Dataset veya DatasetDefinition veya TabularDataset

Deneme içinde kullanılacak eğitim verileri. Hem eğitim özelliklerini hem de etiket sütununu (isteğe bağlı olarak bir örnek ağırlık sütunu) içermesi gerekir. training_databelirtilirse, parametresi label_column_name de belirtilmelidir.

training_data 1.0.81 sürümünde tanıtıldı.

validation_data
DataFrame veya Dataset veya DatasetDefinition veya TabularDataset

Deneme içinde kullanılacak doğrulama verileri. Hem eğitim özelliklerini hem de etiket sütununu (isteğe bağlı olarak bir örnek ağırlık sütunu) içermesi gerekir. validation_databelirtilirse ve training_data label_column_name parametreleri belirtilmelidir.

validation_data 1.0.81 sürümünde tanıtıldı. Daha fazla bilgi için bkz. Otomatik makine öğrenmesinde veri bölmelerini ve çapraz doğrulamayı yapılandırma.

test_data
Dataset veya TabularDataset

Model eğitimi tamamlandıktan sonra otomatik olarak başlatlanacak bir test çalıştırması için kullanılacak test verileri. Test çalıştırması en iyi modeli kullanarak tahminler elde edilir ve bu tahminlere göre ölçümleri hesaplar.

Bu parametre veya parametre test_size belirtilmezse, model eğitimi tamamlandıktan sonra hiçbir test çalıştırması otomatik olarak yürütülmez. Test verileri hem özellikleri hem de etiket sütununu içermeli. test_databelirtilirse parametresi label_column_name belirtilmelidir.

test_size
<xref:float>

Model eğitimi tamamlandıktan sonra otomatik olarak başlatlanacak bir test çalıştırması için test verileri için hangi eğitim veri kesirini tutabilirsiniz? Test çalıştırması en iyi modeli kullanarak tahminler elde edilir ve bu tahminlere göre ölçümleri hesaplar.

Bu, kapsayıcı olmayan 0,0 ile 1,0 arasında olmalıdır. ile test_size aynı zamanda belirtilirse, doğrulama verileri bölünmeden önce validation_size test verileri training_data 'den ayrılır. Örneğin, ve özgün eğitim verisi validation_size=0.1 1000 satır içeriyorsa, test verileri 100 satıra sahip olur, doğrulama verileri 90 satır içerir ve eğitim verisi test_size=0.1 810 satır içerir.

Regresyon tabanlı görevler için rastgele örnekleme kullanılır. Sınıflandırma görevleri için, katmanlanmış örnekleme kullanılır. Tahmin, şu anda eğitim/test bölme kullanılarak test veri kümesi belirtmeyi desteklemez.

Bu parametre veya parametre test_data belirtilmezse, model eğitimi tamamlandıktan sonra hiçbir test çalıştırması otomatik olarak yürütülmez.

label_column_name
<xref:typing.Union>[<xref:str>, <xref:int>]

Etiket sütunlarının adı. Giriş verileri bir pandas'tan ise. Sütun adları olmayan DataFrame, bunun yerine tamsayı olarak ifade etmek için sütun dizinleri kullanılabilir.

Bu parametre , ve training_data validation_data parametreleri için test_data geçerlidir. label_column_name 1.0.81 sürümünde tanıtıldı.

weight_column_name
<xref:typing.Union>[<xref:str>, <xref:int>]

Örnek ağırlık sütunlarının adı. Otomatik ML, ağırlıklı bir sütunu giriş olarak destekler ve bu da veri satırlarının ağırlıklarını yukarı veya aşağı doğru toplamasına neden olur. Giriş verileri bir pandas'tan ise. Sütun adları olmayan DataFrame, bunun yerine tamsayı olarak ifade etmek için sütun dizinleri kullanılabilir.

Bu parametre ve parametreleri training_data validation_data için geçerlidir. weight_column_names 1.0.81 sürümünde tanıtıldı.

cv_split_column_names
<xref:list>(<xref:str>)

Özel çapraz doğrulama bölme içeren sütunların adlarının listesi. CV bölme sütunlarının her biri, her satırın eğitim için 1 veya doğrulama için 0 olarak işaretlenen bir CV bölmeyi temsil eder.

Bu parametre, özel çapraz training_data doğrulama amacıyla parametresi için geçerlidir. cv_split_column_names sürüm 1.6.0'da tanıtıldı

veya cv_split_column_names cv_splits_indices kullanın.

Daha fazla bilgi için bkz. Otomatik makine öğrenmesinde veri bölmelerini ve çapraz doğrulamayı yapılandırma.

enable_local_managed
<xref:bool>

Devre dışı parametresi. Yerel yönetilen çalıştırmalar şu anda etkinleştirilenemli değildir.

enable_dnn
<xref:bool>

Model seçimi sırasında DNN tabanlı modellerin dahil olup olmadığı. Varsayılan değer False'tır.

Açıklamalar

Aşağıdaki kod, AutoMLConfig nesnesi oluşturma ve regresyon için deneme göndermenin temel bir örneğini gösterir:


   automl_settings = {
       "n_cross_validations": 3,
       "primary_metric": 'r2_score',
       "enable_early_stopping": True,
       "experiment_timeout_hours": 1.0,
       "max_concurrent_iterations": 4,
       "max_cores_per_iteration": -1,
       "verbosity": logging.INFO,
   }

   automl_config = AutoMLConfig(task = 'regression',
                               compute_target = compute_target,
                               training_data = train_data,
                               label_column_name = label,
                               **automl_settings
                               )

   ws = Workspace.from_config()
   experiment = Experiment(ws, "your-experiment-name")
   run = experiment.submit(automl_config, show_output=True)

Regresyonda tam bir örnek mevcuttur

Tahmin için AutoMLConfig kullanma örnekleri şu not defterleri içinde verilmiştir:

Tüm görev türleri için AutoMLConfig kullanma örnekleri bu otomatikleştirilmiş ML bulunabilir.

Otomatikleştirilmiş veri sistemleri hakkında ML için şu makalelere bakın:

Otomatik makine öğrenmesi, AutoML ve denemeler için eğitim/doğrulama veri bölmelerini ve çapraz doğrulamayı yapılandırmaya ilişkin farklı seçenekler hakkında daha fazla bilgi için bkz. Otomatik makine öğrenmesinde veri bölmelerini ve çapraz doğrulamayı yapılandırma.

Yöntemler

get_supported_dataset_languages

Desteklenen dilleri ve karşılık gelen dil kodlarını ISO 639-3 ile elde edin.

get_supported_dataset_languages

Desteklenen dilleri ve karşılık gelen dil kodlarını ISO 639-3 ile elde edin.

get_supported_dataset_languages(use_gpu: bool) -> typing.Dict[typing.Any, typing.Any]

Parametreler

cls

sınıf AutoMLConfig nesnesi.

use_gpu

gpu işlem kullan mı yoksa kullanılma mı olduğunu gösteren boole.

Döndürülenler

biçim sözlüğü { : }. Dil kodu ISO 639-3 standardını karşılar, lütfen bkz. https://en.wikipedia.org/wiki/List_of_ISO_639-3_codes