ReinforcementLearningEstimator Kelas
Tunjukkan penghitung untuk melatih eksperimen Pembelajaran Penguatan.
- Warisan
-
azureml.contrib.train.rl._rl_base_estimator._RLBaseEstimatorReinforcementLearningEstimator
Konstruktor
ReinforcementLearningEstimator(source_directory, *, environment=None, entry_script=None, script_params=None, compute_target=None, use_gpu=None, pip_packages=None, conda_packages=None, environment_variables=None, rl_framework=ray-0.8.0, cluster_coordination_timeout_seconds=None, max_run_duration_seconds=None, worker_configuration=None, conda_dependencies_file=None, pip_requirements_file=None, shm_size=None, inputs=None)
Parameter
- environment
- Environment
Definisi lingkungan untuk percobaan. Ini termasuk PythonSection, DockerSection, dan variabel lingkungan. Opsi lingkungan apa pun yang tidak secara langsung terpapar melalui parameter lain ke konstruksi Penghitung dapat diatur menggunakan parameter ini. Jika parameter ini ditentukan, itu akan digunakan sebagai dasar di mana paket yang ditentukan dalam pip_packages dan conda_packages akan ditambahkan.
- script_params
- dict
Kamus argumen baris perintah untuk diteruskan ke skrip pelatihan yang ditentukan dalam entry_script.
- compute_target
- AbstractComputeTarget atau str
Target komputasi tempat skrip kepala akan dijalankan. Ini bisa berupa objek atau nama target komputasi. AmlWindowsCompute hanya mendukung Azure Files sebagai penyimpanan terpasang dan tidak mendukung definisi lingkungan.
- use_gpu
- bool
Menentukan apakah lingkungan harus mendukung GPU.
Jika true, gambar Docker default berbasis GPU akan digunakan di lingkungan. Jika salah, gambar berbasis CPU akan digunakan. Gambar docker default (CPU atau GPU) hanya akan digunakan jika parameter environment tidak diatur.
- conda_packages
- list
Daftar string yang menunjukkan paket conda yang akan ditambahkan ke lingkungan Python kepala untuk eksperimen.
- pip_packages
- list
Daftar string yang menunjukkan paket pip yang akan ditambahkan ke lingkungan Python kepala untuk eksperimen.
- rl_framework
- RLFramework
Kerangka kerja orkestrasi yang akan digunakan dalam percobaan. Defaultnya adalah Ray versi 0.8.0
- cluster_coordination_timeout_seconds
- int
Waktu maksimum dalam hitungan detik yang dapat dihabiskan pekerjaan untuk memulai setelah pekerjaan melewati status dalam antrean.
- max_run_duration_seconds
- int
Waktu maksimum yang diizinkan untuk eksekusi dalam hitungan detik. Azure Machine Learning akan mencoba untuk membatalkan pekerjaan secara otomatis jika membutuhkan waktu yang lebih lama dari nilai ini.
- pip_requirements_file
- str
Jalur relatif ke file teks persyaratan pip kepala.
Ini dapat diberikan bersama dengan parameter pip_packages.
- environment_variables
- dict
Kamus nama dan nilai variabel lingkungan.
Variabel lingkungan ini diatur pada proses kepala, tempat entry_script dieksekusi.
- shm_size
- str
Ukuran blok memori bersama kontainer Docker. Jika tidak diatur, default azureml.core.environment._DEFAULT_SHM_SIZE akan digunakan. Untuk informasi selengkapnya, lihat Referensi eksekusi Docker.
- inputs
- list
Daftar objek DataReference atau DatasetConsumptionConfig yang akan digunakan sebagai input.
Keterangan
Saat mengirimkan pekerjaan pelatihan, Azure Machine Learning menjalankan skrip Anda di lingkungan conda dalam kontainer Docker. Kontainer Pembelajaran Penguatan memiliki dependensi berikut yang dipasang.
Dependensi | Ray 0.8.0 | Ray 0.8.3 | ————————————–| —————– | —————– | Python | 3.6.2 | 3.6.2 | CUDA (khusus gambar GPU) | 10.0 | 10.0 | cuDNN (khusus gambar GPU) | 7.5 | 7.5 | NCCL (khusus gambar GPU) | 2.4.2 | 2.4.2 | azureml-defaults | Terbaru | Terbaru | azureml-contrib-reinforcementlearning | Terbaru | Terbaru | ray[rllib,dashboard] | 0.8.0 | 0.8.3 | tensorflow | 1.14.0 | 1.14.0 | psutil | Terbaru | Terbaru | setproctitle | Terbaru | Terbaru | gym[atari] | Terbaru | Terbaru |
Gambar Docker memperluas Ubuntu 16.04.
Untuk memasang dependensi tambahan di kontainer docker kepala, Anda dapat menggunakan pip_packages atau conda_packages. Atau, Anda dapat membangun gambar Anda sendiri, dan meneruskannya dalam parameter lingkungan sebagai bagian dari objek Lingkungan.
Penghitung Pembelajaran Penguatan mendukung pelatihan terdistribusi di seluruh kluster CPU dan GPU menggunakan Ray, kerangka kerja sumber terbuka untuk menangani pelatihan terdistribusi.
Atribut
DEFAULT_FRAMEWORK
DEFAULT_FRAMEWORK = ray-0.8.0
Saran dan Komentar
Kirim dan lihat umpan balik untuk