ReinforcementLearningEstimator 类
表示用于训练强化学习试验的估算器。
- 继承
-
azureml.contrib.train.rl._rl_base_estimator._RLBaseEstimatorReinforcementLearningEstimator
构造函数
ReinforcementLearningEstimator(source_directory, *, environment=None, entry_script=None, script_params=None, compute_target=None, use_gpu=None, pip_packages=None, conda_packages=None, environment_variables=None, rl_framework=ray-0.8.0, cluster_coordination_timeout_seconds=None, max_run_duration_seconds=None, worker_configuration=None, conda_dependencies_file=None, pip_requirements_file=None, shm_size=None, inputs=None)
参数
- environment
- Environment
试验的环境定义。 它包括 PythonSection、DockerSection 和环境变量。 使用此参数可以设置不通过其他参数直接公开到估算器构造的任何环境选项。 如果指定此参数,将基于此参数添加 pip_packages 和 conda_packages 中指定的包。
- compute_target
- AbstractComputeTarget 或 str
将运行头脚本的计算目标。 这可以是一个对象或计算目标名称。 AmlWindowsCompute 仅支持将 Azure 文件存储用作装载的存储,且不支持环境定义。
- use_gpu
- bool
指定环境是否应支持 GPU。
如果为 true,则将在环境中使用基于 GPU 的默认 Docker 映像。 如果为 false,则使用基于 CPU 的映像。 仅当未设置 environment 参数时,才会使用默认 docker 映像(CPU 或 GPU)。
- shm_size
- str
Docker 容器的共享内存块的大小。 如果未设置,则使用默认的 azureml.core.environment._DEFAULT_SHM_SIZE。 有关详细信息,请参阅 Docker 运行参考。
注解
提交训练作业时,Azure ML 会在 Docker 容器内的 conda 环境中运行脚本。 强化学习容器中已安装以下依赖项。
依赖项 | Ray 0.8.0 | Ray 0.8.3 | ————————————–| —————– | —————– | Python | 3.6.2 | 3.6.2 | CUDA(仅限 GPU 映像)| 10.0 | 10.0 | cuDNN(仅限 GPU 映像)| 7.5 | 7.5 | NCCL(仅限 GPU 映像)| 2.4.2 | 2.4.2 | azureml-defaults | 最新 | 最新 | azureml-contrib-reinforcementlearning | 最新 | 最新 | ray[rllib,dashboard] | 0.8.0 | 0.8.3 | tensorflow | 1.14.0 | 1.14.0 | psutil | 最新 | 最新 | setproctitle | 最新 | 最新 | gym[atari] | 最新 | 最新 |
Docker 映像可扩展 Ubuntu 16.04。
若要在头节点 docker 容器中安装其他依赖项,可以使用 pip_packages 或 conda_packages。 或者,你可以生成自己的映像,并将其作为环境对象的一部分传入环境参数。
强化学习估算器支持使用 Ray(一种用于处理分布式训练的开源框架)进行跨 CPU 和 GPU 群集的分布式训练。
属性
DEFAULT_FRAMEWORK
DEFAULT_FRAMEWORK = ray-0.8.0
反馈
提交和查看相关反馈