ParallelComponent Klasse

Parallele Komponentenversion, die zum Definieren einer parallelen Komponente verwendet wird.

Vererbung
azure.ai.ml.entities._component.component.Component
ParallelComponent
azure.ai.ml.entities._job.parallel.parameterized_parallel.ParameterizedParallel
ParallelComponent
azure.ai.ml.entities._component.code.ComponentCodeMixin
ParallelComponent

Konstruktor

ParallelComponent(*, name: str | None = None, version: str | None = None, description: str | None = None, tags: Dict[str, Any] | None = None, display_name: str | None = None, retry_settings: RetrySettings | None = None, logging_level: str | None = None, max_concurrency_per_instance: int | None = None, error_threshold: int | None = None, mini_batch_error_threshold: int | None = None, task: ParallelTask | None = None, mini_batch_size: str | None = None, partition_keys: List | None = None, input_data: str | None = None, resources: JobResourceConfiguration | None = None, inputs: Dict | None = None, outputs: Dict | None = None, code: str | None = None, instance_count: int | None = None, is_deterministic: bool = True, **kwargs: Any)

Parameter

Name Beschreibung
name
Erforderlich
str

Der Name der Komponente. Standardwert auf "Keine"

version
Erforderlich
str

Version der Komponente. Standardwert auf "Keine"

description
Erforderlich
str

Die Beschreibung der Komponente Standardwert auf "Keine"

tags
Erforderlich

Tagwörterbuch. Tags können hinzugefügt, entfernt und aktualisiert werden. Standardwert auf "Keine"

display_name
Erforderlich
str

Anzeigename der Komponente. Standardwert auf "Keine"

retry_settings
Erforderlich

Fehler beim Ausführen der parallelen Komponente. Standardwert auf "Keine"

logging_level
Erforderlich
str

Eine Zeichenfolge des Namens der Protokollierungsebene. Standardwert auf "Keine"

max_concurrency_per_instance
Erforderlich
int

Die maximale Parallelität, die jede Compute-instance aufweist. Standardwert auf "Keine"

error_threshold
Erforderlich
int

Die Anzahl der Fehler bei der Elementverarbeitung sollte ignoriert werden. Standardwert auf "Keine"

mini_batch_error_threshold
Erforderlich
int

Die Anzahl von Minibatchverarbeitungsfehlern sollte ignoriert werden. Standardwert auf "Keine"

task
Erforderlich

Die parallele Aufgabe. Standardwert auf "Keine"

mini_batch_size
Erforderlich
str

Bei der FileDataset-Eingabe ist dieses Feld die Anzahl der Dateien, die ein Benutzerskript in einem run()-Aufruf verarbeiten kann. Bei einer TabularDataset-Eingabe ist dieses Feld die ungefähre Größe der Daten, die ein Benutzerskript in einem run()-Aufruf verarbeiten kann. Beispielwerte sind 1.024, 1.024 KB, 10 MB und 1 GB. (optional, der Standardwert ist 10 Dateien für FileDataset und 1 MB für TabularDataset.) Dieser Wert kann über PipelineParameter festgelegt werden.

partition_keys
Erforderlich

Die Schlüssel, die zum Partitionieren von Datasets in Minibatches verwendet werden. Standardwert: Keine Wenn angegeben, werden die Daten mit demselben Schlüssel in denselben Minibatch partitioniert. Wenn sowohl partition_keys als auch mini_batch_size angegeben werden, wird partition_keys wirksam. Damit dies funktioniert, müssen die Eingaben partitionierte Datasets sein, und die partition_keys müssen eine Teilmenge der Schlüssel jedes Eingabedatasets sein.

input_data
Erforderlich
str

Die Eingabedaten. Standardwert auf "Keine"

resources
Erforderlich

Computeressourcenkonfiguration für die Komponente. Standardwert auf "Keine"

inputs
Erforderlich

Eingaben der Komponente. Standardwert auf "Keine"

outputs
Erforderlich

Ausgaben der Komponente. Standardwert auf "Keine"

code
Erforderlich
str

Heraufgestufte Eigenschaft aus task.code

instance_count
Erforderlich
int

Höhergestufte Eigenschaft aus resources.instance_count. Standardwert auf "Keine"

is_deterministic
Erforderlich

Gibt an, ob die parallele Komponente deterministisch ist. Der Standardwert ist „True“.

Keyword-Only Parameter

Name Beschreibung
name
Erforderlich
version
Erforderlich
description
Erforderlich
tags
Erforderlich
display_name
Erforderlich
retry_settings
Erforderlich
logging_level
Erforderlich
max_concurrency_per_instance
Erforderlich
error_threshold
Erforderlich
mini_batch_error_threshold
Erforderlich
task
Erforderlich
mini_batch_size
Erforderlich
partition_keys
Erforderlich
input_data
Erforderlich
resources
Erforderlich
inputs
Erforderlich
outputs
Erforderlich
code
Erforderlich
instance_count
Erforderlich
is_deterministic
Standardwert: True

Methoden

dump

Speichern Sie den Komponenteninhalt in einer Datei im yaml-Format.

dump

Speichern Sie den Komponenteninhalt in einer Datei im yaml-Format.

dump(dest: str | PathLike | IO, **kwargs: Any) -> None

Parameter

Name Beschreibung
dest
Erforderlich
Union[<xref:PathLike>, str, IO[AnyStr]]

Das Ziel, um den Inhalt dieser Komponente zu empfangen. Muss entweder ein Pfad zu einer lokalen Datei oder ein bereits geöffneter Dateistream sein. Wenn dest ein Dateipfad ist, wird eine neue Datei erstellt, und eine Ausnahme wird ausgelöst, wenn die Datei vorhanden ist. Wenn dest eine geöffnete Datei ist, wird die Datei direkt in geschrieben, und eine Ausnahme wird ausgelöst, wenn die Datei nicht beschreibbar ist.

Attribute

base_path

Der Basispfad der Ressource.

Gibt zurück

Typ Beschreibung
str

Der Basispfad der Ressource.

code

Gibt den Wert der heraufgestuften Eigenschaft task.code zurück, bei der es sich um einen lokalen Oder Remotepfad handelt, der auf den Quellcode verweist.

Gibt zurück

Typ Beschreibung

Wert von task.code.

creation_context

Der Erstellungskontext der Ressource.

Gibt zurück

Typ Beschreibung

Die Erstellungsmetadaten für die Ressource.

display_name

Anzeigename der Komponente.

Gibt zurück

Typ Beschreibung
str

Anzeigename der Komponente.

environment

Gibt den Wert der heraufgestuften Eigenschaft task.environment zurück, geben Sie die Umgebung an, in der der Trainingsauftrag ausgeführt wird.

Gibt zurück

Typ Beschreibung

Wert von task.environment.

id

Die Ressourcen-ID.

Gibt zurück

Typ Beschreibung

Die globale ID der Ressource, eine Arm-ID (Azure Resource Manager).

inputs

Eingaben der Komponente.

Gibt zurück

Typ Beschreibung

Eingaben der Komponente.

instance_count

Rückgabewert der höhergestuften Eigenschaft resources.instance_count.

Gibt zurück

Typ Beschreibung

Wert von resources.instance_count.

is_deterministic

Gibt an, ob die Komponente deterministisch ist.

Gibt zurück

Typ Beschreibung

Gibt an, ob die Komponente deterministisch ist

outputs

Ausgaben der Komponente.

Gibt zurück

Typ Beschreibung

Ausgaben der Komponente.

resources

retry_settings

task

type

Typ der Komponente, Standardwert ist "Command".

Gibt zurück

Typ Beschreibung
str

Typ der Komponente.

version

Version der Komponente.

Gibt zurück

Typ Beschreibung
str

Version der Komponente.