databricks_step Moduł

Zawiera funkcje tworzenia kroku potoku usługi Azure ML w celu uruchomienia notesu usługi Databricks lub skryptu języka Python w systemie plików DBFS.

Klasy

DatabricksStep

Tworzy krok potoku usługi Azure ML w celu dodania notesu usługi DataBricks, skryptu języka Python lub pliku JAR jako węzła.

Aby zapoznać się z przykładem użycia usługi DatabricksStep, zobacz notes https://aka.ms/pl-databricks.

Utwórz krok potoku usługi Azure ML, aby dodać notes usługi DataBricks, skrypt języka Python lub plik JAR jako węzeł.

Aby zapoznać się z przykładem użycia usługi DatabricksStep, zobacz notes https://aka.ms/pl-databricks.

:p aram python_script_name:[Required] Nazwa skryptu języka Python względem .source_directory Jeśli skrypt przyjmuje dane wejściowe i wyjściowe, zostaną one przekazane do skryptu jako parametry. Jeśli python_script_name parametr jest określony, source_directory musi być też.

Określ dokładnie jedną z notebook_pathwartości , python_script_path, python_script_namelub main_class_name.

Jeśli określisz obiekt DataReference jako dane wejściowe z data_reference_name=input1 i obiekt PipelineData jako dane wyjściowe o nazwie =output1, dane wejściowe i wyjściowe zostaną przekazane do skryptu jako parametry. W ten sposób będą wyglądać tak i należy przeanalizować argumenty w skrypcie, aby uzyskać dostęp do ścieżek poszczególnych danych wejściowych i wyjściowych: "-input1","wasbs://test@storagename.blob.core.windows.net/test","-output1", "wasbs://test@storagename.blob.core.windows.net/b3e26de1-87a4-494d-a20f-1988d22b81a2/output1"

Ponadto w skrycie będą dostępne następujące parametry:

  • AZUREML_RUN_TOKEN: token AML do uwierzytelniania za pomocą usługi Azure Machine Learning.
  • AZUREML_RUN_TOKEN_EXPIRY: czas wygaśnięcia tokenu AML.
  • AZUREML_RUN_ID: Identyfikator przebiegu usługi Azure Machine Learning dla tego przebiegu.
  • AZUREML_ARM_SUBSCRIPTION: subskrypcja platformy Azure dla obszaru roboczego usługi AML.
  • AZUREML_ARM_RESOURCEGROUP: grupa zasobów platformy Azure dla obszaru roboczego usługi Azure Machine Learning.
  • AZUREML_ARM_WORKSPACE_NAME: nazwa obszaru roboczego usługi Azure Machine Learning.
  • AZUREML_ARM_PROJECT_NAME: nazwa eksperymentu usługi Azure Machine Learning.
  • AZUREML_SERVICE_ENDPOINT: adres URL punktu końcowego dla usług AML.
  • AZUREML_WORKSPACE_ID: identyfikator obszaru roboczego usługi Azure Machine Learning.
  • AZUREML_EXPERIMENT_ID: identyfikator eksperymentu usługi Azure Machine Learning.
  • AZUREML_SCRIPT_DIRECTORY_NAME: ścieżka katalogu w systemie plików DBFS, w której skopiowano source_directory.
  (This parameter is only populated when `python_script_name` is used.  See more details below.)

Podczas wykonywania skryptu języka Python z komputera lokalnego w usłudze Databricks przy użyciu parametrów source_directory DatabricksStep i python_script_namesource_directory jest kopiowany do systemu plików DBFS, a ścieżka katalogu w systemie plików DBFS jest przekazywana jako parametr do skryptu po rozpoczęciu wykonywania. Ten parametr jest oznaczony jako –AZUREML_SCRIPT_DIRECTORY_NAME. Należy go prefiksować za pomocą ciągu "dbfs:/" lub "/dbfs/" w celu uzyskania dostępu do katalogu w systemie plików DBFS.