RScriptStep Kelas
Catatan
Ini adalah kelas eksperimental, dan dapat berubah kapan saja. Lihat https://aka.ms/azuremlexperimental untuk mengetahui informasi selengkapnya.
Membuat langkah Alur Azure ML yang menjalankan skrip R.
- Warisan
-
azureml.pipeline.core._python_script_step_base._PythonScriptStepBaseRScriptStep
Konstruktor
RScriptStep(script_name, name=None, arguments=None, compute_target=None, runconfig=None, runconfig_pipeline_params=None, inputs=None, outputs=None, params=None, source_directory=None, use_gpu=False, custom_docker_image=None, cran_packages=None, github_packages=None, custom_url_packages=None, allow_reuse=True, version=None)
Parameter
- arguments
- list
Argumen baris perintah untuk file skrip R. Argumen akan diteruskan ke komputasi melalui parameter arguments di RunConfiguration.
Untuk detail selengkapnya tentang cara menangani argumen seperti simbol khusus, lihat RunConfiguration.
- compute_target
- Union[<xref:azureml.core.compute.DsvmCompute,azureml.core.compute.AmlCompute,azureml.core.compute.RemoteCompute,azureml.core.compute.HDInsightCompute,str,tuple>]
[Wajib] Target komputasi yang akan digunakan. Jika tidak ditentukan, target dari runconfig digunakan. Parameter ini dapat ditentukan sebagai objek target komputasi atau nama string target komputasi di ruang kerja.
Secara opsional jika target komputasi tidak tersedia pada waktu pembuatan alur, Anda dapat menentukan tuple ('nama target komputasi', 'jenis target komputasi') untuk menghindari pengambilan objek target komputasi (jenis AmlCompute adalah 'AmlCompute' dan jenis RemoteCompute adalah 'VirtualMachine').
- runconfig
- RunConfiguration
[Wajib] Konfigurasi eksekusi yang merangkum informasi yang diperlukan untuk mengirimkan eksekusi pelatihan dalam eksperimen. Hal ini diperlukan untuk menentukan konfigurasi eksekusi R yang dapat ditentukan di RSection. RSection diperlukan untuk langkah ini.
- runconfig_pipeline_params
- dict[str, PipelineParameter]
Mengganti properti runconfig saat runtime menggunakan pasangan kunci-nilai masing-masing dengan nama properti runconfig dan PipelineParameter untuk properti tersebut.
Nilai yang didukung: 'NodeCount', 'MpiProcessCountPerNode', 'TensorflowWorkerCount', 'TensorflowParameterServerCount'
- inputs
- list[Union[<xref:azureml.pipeline.core.graph.InputPortBinding,azureml.data.data_reference.DataReference,azureml.pipeline.core.PortDataReference,azureml.pipeline.core.builder.PipelineData,azureml.pipeline.core.pipeline_output_dataset.PipelineOutputFileDataset,azureml.pipeline.core.pipeline_output_dataset.PipelineOutputTabularDataset,azureml.data.dataset_consumption_config.DatasetConsumptionConfig>]]
Daftar pengikatan port input.
- outputs
- list[Union[<xref:azureml.pipeline.core.builder.PipelineData,azureml.data.output_dataset_config.OutputDatasetConfig,azureml.pipeline.core.pipeline_output_dataset.PipelineOutputAbstractDataset,azureml.pipeline.core.graph.OutputPortBinding>]]
Daftar pengikatan port output.
- params
- dict
Kamus pasangan nama-nilai yang terdaftar sebagai variabel lingkungan dengan "AML_PARAMETER_".
- source_directory
- str
Folder yang berisi skrip R, conda env, dan sumber daya lain yang digunakan dalam langkah tersebut.
- use_gpu
- bool
Menunjukkan apakah lingkungan untuk menjalankan eksperimen harus mendukung GPU.
Jika True, gambar Docker default berbasis GPU akan digunakan di lingkungan. Jika False, gambar berbasis CPU akan digunakan. Gambar docker default (CPU atau GPU) hanya akan digunakan jika pengguna tidak mengatur parameter base_image dan base_dockerfile.
Pengaturan ini hanya diaktifkan di target komputasi yang mendukung Docker.
Lihat https://docs.microsoft.com/en-us/python/api/azureml-core/azureml.core.environment.dockersection untuk detail selengkapnya tentang base_image.
- custom_docker_image
- str
Nama gambar Docker dari gambar yang digunakan untuk pelatihan yang akan dibuat. Jika tidak diatur, gambar berbasis CPU default akan digunakan sebagai gambar dasar. Gambar ini sudah tidak digunakan lagi dan akan dihapus di rilis mendatang. Gunakan base_image di DockerSection sebagai gantinya.
- cran_packages
- list
Paket CRAN yang akan diinstal. Gambar ini sudah tidak digunakan lagi dan akan dihapus di rilis mendatang. Gunakan RSection.cran_packages sebagai gantinya.
- github_packages
- list
Paket GitHub yang akan diinstal. Gambar ini sudah tidak digunakan lagi dan akan dihapus di rilis mendatang. Gunakan RSection.github_packages sebagai gantinya.
- custom_url_packages
- list
Paket yang akan diinstal dari URL lokal, direktori, atau kustom. Gambar ini sudah tidak digunakan lagi dan akan dihapus di rilis mendatang. Gunakan RSection.custom_url_packages sebagai gantinya.
- allow_reuse
- bool
Menunjukkan apakah langkah tersebut harus menggunakan kembali hasil sebelumnya saat dijalankan lagi dengan pengaturan yang sama. Penggunaan kembali diaktifkan secara default. Jika konten langkah (skrip/dependensi) serta input dan parameter tetap tidak berubah, output dari langkah ini sebelumnya digunakan kembali. Saat menggunakan kembali langkah tersebut, hasil dari eksekusi sebelumnya segera tersedia untuk langkah selanjutnya, bukan mengirimkan pekerjaan untuk komputasi. Jika Anda menggunakan himpunan data Azure Machine Learning sebagai input, penggunaan ulang ditentukan oleh apakah definisi himpunan data telah berubah, bukan oleh apakah data yang mendasarinya telah berubah.
- version
- str
Tag versi opsional untuk menunjukkan perubahan fungsionalitas untuk langkah tersebut.
Keterangan
RScriptStep adalah langkah dasar bawaan untuk menjalankan skrip R pada target komputasi. Dibutuhkan nama skrip dan parameter opsional lainnya seperti argumen untuk skrip, target komputasi, input dan output. Anda harus menggunakan RunConfiguration untuk menentukan persyaratan RScriptStep, seperti gambar docker kustom, paket cran/github yang diperlukan.
Praktik terbaik untuk bekerja dengan RScriptStep adalah menggunakan folder terpisah untuk skrip dan file dependen apa pun yang terkait dengan langkah, dan tentukan folder tersebut dengan parameter source_directory.
Mengikuti praktik terbaik ini memiliki dua keuntungan. Pertama, membantu mengurangi ukuran snapshot yang dibuat untuk langkah tersebut karena yang perlu dilakukan hanyalah melakukan snapshot. Kedua, output langkah dari eksekusi sebelumnya dapat digunakan kembali jika tidak ada perubahan pada source_directory yang akan memicu unggahan ulang snapshot.
Contoh kode berikut menunjukkan cara menggunakan RScriptStep dalam skenario pelatihan pembelajaran mesin.
from azureml.core.runconfig import RunConfiguration
from azureml.core.environment import Environment, RSection, RCranPackage
from azureml.pipeline.steps import RScriptStep
rc = RunConfiguration()
rc.framework='R'
rc.environment.r = RSection() # R details with required packages
rc.environment.docker.enabled = True # to enable docker image
rc.environment.docker.base_image = '<custom user image>' # to use custom image
cran_package1 = RCranPackage()
cran_package1.name = "ggplot2"
cran_package1.repository = "www.customurl.com"
cran_package1.version = "2.1"
rc.environment.r.cran_packages = [cran_package1]
trainStep = RScriptStep(script_name="train.R",
arguments=["--input", blob_input_data, "--output", output_data1],
inputs=[blob_input_data],
outputs=[output_data1],
compute_target=compute_target,
use_gpu=False,
runconfig=rc,
source_directory=project_folder)
Lihat https://aka.ms/pl-first-pipeline untuk detail selengkapnya tentang membuat alur secara umum. Lihat https://docs.microsoft.com/en-us/python/api/azureml-core/azureml.core.environment.rsection untuk detail selengkapnya tentang RSection.
Metode
| create_node |
Buat node untuk RScriptStep dan tambahkan ke grafik yang ditentukan. TIDAK DIGUNAKAN LAGI. Gunakan CommandStep sebagai gantinya. Misalnya lihat Cara menjalankan skrip R di alur dengan CommandStep. Metode ini tidak dimaksudkan untuk digunakan secara langsung. Ketika alur dibuat dengan langkah ini, Azure Machine Learning secara otomatis meneruskan parameter yang diperlukan melalui metode ini sehingga langkah tersebut dapat ditambahkan ke grafik alur yang mewakili alur kerja. |
create_node
Buat node untuk RScriptStep dan tambahkan ke grafik yang ditentukan.
TIDAK DIGUNAKAN LAGI. Gunakan CommandStep sebagai gantinya. Misalnya lihat Cara menjalankan skrip R di alur dengan CommandStep.
Metode ini tidak dimaksudkan untuk digunakan secara langsung. Ketika alur dibuat dengan langkah ini, Azure Machine Learning secara otomatis meneruskan parameter yang diperlukan melalui metode ini sehingga langkah tersebut dapat ditambahkan ke grafik alur yang mewakili alur kerja.
create_node(graph, default_datastore, context)
Parameter
- default_datastore
- Union[<xref:azureml.data.azure_storage_datastore.AbstractAzureStorageDatastore,azureml.data.azure_data_lake_datastore.AzureDataLakeDatastore>]
Penyimpanan data default.
- context
- <xref:azureml.pipeline.core._GraphContext>
Konteks grafik.
Mengembalikan
Node yang dibuat.
Tipe hasil
Saran dan Komentar
Kirim dan lihat umpan balik untuk