ExpressionEstimator Klasse

Referenz

Definition

Namespace:: Microsoft.ML.Transforms

Assembly:: Microsoft.ML.Transforms.dll

Paket:: Microsoft.ML v3.0.1

Paket:: Microsoft.ML v1.5.5

Paket:: Microsoft.ML v1.6.0

Paket:: Microsoft.ML v1.7.0

Paket:: Microsoft.ML v2.0.0

Wichtig

Einige Informationen beziehen sich auf Vorabversionen, die vor dem Release ggf. grundlegend überarbeitet werden. Microsoft übernimmt hinsichtlich der hier bereitgestellten Informationen keine Gewährleistungen, seien sie ausdrücklich oder konkludent.

Dieser Schätzer wendet einen vom Benutzer bereitgestellten Ausdruck (angegeben als Zeichenfolge) an, um Spaltenwerte einzugeben, um neue Ausgabespaltenwerte zu erzeugen.

public sealed class ExpressionEstimator : Microsoft.ML.IEstimator<Microsoft.ML.Transforms.ExpressionTransformer>

type ExpressionEstimator = class
    interface IEstimator<ExpressionTransformer>

Public NotInheritable Class ExpressionEstimator
Implements IEstimator(Of ExpressionTransformer)

Vererbung: Object
ExpressionEstimator

Implementiert: IEstimator<ExpressionTransformer>

Hinweise

Schätzereigenschaften


Muss sich dieser Schätzer die Daten ansehen, um seine Parameter zu trainieren?	No
Eingabespaltendatentyp	float, double, int, long, bool oder text.
Datentyp der Ausgabespalte	Je nach Ausdruck kann es sich um float, double, int, long, bool oder text handeln.

Der resultierende ExpressionTransformer erstellt eine neue Spalte mit dem Namen, wie in den Parametern des Ausgabespaltennamens angegeben, in der der Ausdruck auf die Eingabewerte angewendet wird. Höchstens eine der Eingabespalten kann vom Typ VectorDataViewType sein, und wenn die Eingabe eine Vektorspalte enthält, wird der Ausdruck unabhängig für jedes Element des Vektors berechnet, um eine Vektorausgabe mit der gleichen Länge wie diese Eingabe zu erstellen.

Ausdruckssprache

Die Sprache für den Ausdrucksschätzer sollte für eine breite Palette von Benutzern komfortabel sein. Es hat viele Ähnlichkeiten mit einigen beliebten Sprachen. Sie berücksichtigt die Groß-/Kleinschreibung, unterstützt mehrere Typen und verfügt über einen umfangreichen Satz von Operatoren und Funktionen. Es ist rein funktional, in dem Sinne, dass es keine veränderlichen Werte oder mutierenden Vorgänge in der Sprache gibt. Es verfügt weder über einen Ausnahmemechanismus noch benötigt es einen Ausnahmemechanismus, sondern erzeugt NA-Werte, wenn ein Normalwert nicht geeignet ist. Es ist statisch typisiert, aber alle Typen werden vom Compiler abgeleitet.

Syntax

Die Syntax für das Lambda besteht aus einer Parameterliste gefolgt von einem Doppelpunkt (:) oder Pfeil (=>) gefolgt von einem Ausdruck. Die Parameterliste kann entweder ein einzelner Bezeichner oder eine durch Trennzeichen getrennte Liste mit einem oder mehreren Bezeichnern sein, die von Klammern umgeben sind.

Lambda:

parameter-list : ausdruck
parameter-list => ausdruck

parameter-list:

identifier
(Parameternamen)

Parameternamen:

identifier
Bezeichner , Parameternamen

Der Ausdruck kann Parameter, Literale, Operatoren, with-expressions und Funktionen verwenden.

Literale

Die booleschen Literale sind true und false.
Ganzzahlige Literale können dezimal oder hexadezimal sein (z. B. 0x1234ABCD). Sie können mit Ihnen oder U suffixiert werden, was unsigniert angibt, sowie l oder L, was long (Int64) angibt. Die Verwendung von Sie oder U ist selten und wirkt sich nur auf die Heraufstufung bestimmter hexadezimaler 32-Bit-Werte aus, wobei bestimmt wird, ob die Konstante als negativer Int32-Wert oder als positiver Int64-Wert betrachtet wird.
Gleitkommaliterale verwenden die Standardsyntax, einschließlich der exponentiellen Notation (123.45e-37). Sie können mit f oder F versehen sein, was eine einzelne Genauigkeit angibt, oder d oder D, die doppelte Genauigkeit angibt. Im Gegensatz zu C# ist die Standardgenauigkeit eines Gleitkommaliterals eine einzelne Genauigkeit. Fügen Sie d oder D an, um die doppelte Genauigkeit anzugeben.
Textliterale sind in doppelte Anführungszeichen eingeschlossen und unterstützen die Standard-Escapemechanismen.

Operatoren

Die Operatoren der Ausdruckssprache werden in der folgenden Tabelle in der reihenfolge der Abhängigkeit aufgeführt. Sofern nicht anders angegeben, werden binäre Operatoren assoziativ belassen und NA-Werte weitergegeben (wenn einer der Operandenwerte NA ist, ist das Ergebnis NA). Im Allgemeinen führt ein Überlauf ganzzahliger Werte zu NA, während ein Überlauf von Gleitkommawerten unendlich erzeugt.

Operator	Bedeutung	Arity	Kommentare
? :	Bedingte	Ternären	Die Ausdrucksbedingung ? value1 : value2 löst in value1 auf, wenn bedingung true ist, und wert2, wenn bedingung false ist. Die Bedingung muss boolesch sein, während value1 und value2 vom kompatiblen Typ sein müssen.
??	Coalesce	Binäre	Der Ausdruck x ?? y löst in x auf, wenn x nicht NA ist, und wird andernfalls in y aufgelöst. Die Operanden müssen sowohl Singles als auch Doubles sein. Dieser Operator ist rechtsassoziativ.
\| \| Oder	logische oder	Binäre	Die Operanden und das Ergebnis sind boolesch. Wenn ein Operand true ist, ist das Ergebnis true, andernfalls ist es false.
&& und	logische und	Binäre	Die Operanden und das Ergebnis sind boolesch. Wenn ein Operand false ist, ist das Ergebnis false, andernfalls ist es true.
==, = !=, <> <, <= >, >=	Ist gleich nicht gleich Kleiner oder gleich Größer oder gleich	Mehrere	- Die Vergleichsoperatoren sind multi arity, d. h. sie können auf zwei oder mehr Operanden angewendet werden. Beispielsweise ergibt ein == b == c true, wenn a, b und c den gleichen Wert haben. Der operator not equal erfordert, dass alle Operanden unterschiedlich sind, sodass 1 != 2 != 1 false ist. Um zu testen, ob x nicht negativ, aber kleiner als 10 ist, verwenden Sie 0 <= x < 10. Es ist nicht erforderlich, 0 <= x && x < 10 zu schreiben, und dies funktioniert nicht so gut. Operatoren, die in derselben Zeile aufgeführt sind, können in einem einzelnen Ausdruck kombiniert werden, sodass ein > b >= c legal ist, aber ein < b >= c nicht. - Gleich und nicht gleich gilt für jeden Operandentyp, während die geordneten Operatoren numerische Operanden erfordern.
+ -	Addition und Subtraktion	Binäre	Numerische Addition und Subtraktion mit NA-Weitergabe.
* / %	Multiplikation, Division und Modul	Binäre	Numerische Multiplikation, Division und Modulus mit NA-Weitergabe.
- ! not	numerische Negation und logische Nichtverhandlung	Unäre	Dabei handelt es sich um unäre Präfixoperatoren, negieren (-), die einen numerischen Operanden erfordern und nicht (!) einen booleschen Operanden erfordern.
^	Macht	Binäre	Dies ist die richtige assoziative Exponentiation. Es erfordert numerische Operanden. Für ganzzahlige Operanden erzeugen 0^0 1.
( )	Klammergruppierung	Unäre	Standard-Bedeutung.

Der Mit-Ausdruck

Die Syntax für den mit-Ausdruck lautet:

with-expression:

with( assignment-list ; ausdruck )

assignment-list:

Zuweisung
assignment , assignment-list

Zuordnung:

Bezeichnerausdruck =

Der With-Ausdruck führt einen oder mehrere benannte Werte ein. Der folgende Ausdruck konvertiert z. B. eine Celciustemperatur in Fahrenheit und erzeugt dann eine Nachricht basierend darauf, ob die Fahrenheit zu niedrig oder hoch ist.

c => with(f = c * 9 / 5 + 32 ; f < 60 ? "Too Cold!" : f > 90 ? "Too Hot!" : "Just Right!")

Der Ausdruck für eine Zuweisung kann auf die Bezeichner verweisen, die von früheren Zuweisungen eingeführt wurden, wie in diesem Beispiel, das anstelle der Meldungen -1, 0 oder 1 zurückgibt:

c : with(f = c * 9 / 5 + 32, cold = f < 60, hot = f > 90 ; -float(cold) + float(hot))

Wie oben gezeigt, ist der With-Ausdruck nützlich, wenn ein Ausdruckswert in einem größeren Ausdruck mehrmals benötigt wird. Es ist auch nützlich, wenn es um komplizierte oder signifikante Konstanten geht:

    ticks => with(
        ticksPerSecond = 10000000L,
        ticksPerHour = ticksPerSecond \* 3600,
        ticksPerDay = ticksPerHour \* 24,
        day = ticks / ticksPerDay,
        dayEpoch = 1 ;
        (day + dayEpoch) % 7)

Dadurch wird der Wochentag aus der Anzahl der Ticks (als Int64) seit der .Net-Standardzeitpoche (01/01/0001 im idealisierten gregorianischen Kalender) berechnet. Zuweisungen werden für die Anzahl der Ticks in einer Sekunde, die Anzahl der Ticks in einer Stunde, die Anzahl der Ticks in einem Jahr und den Wochentag für die Epoche verwendet. In diesem Beispiel möchten wir den Sonntag auf 0 zuordnen. Da die Epoche ein Montag ist, legen wir dayEpoch auf 1 fest. Wenn die Epoche geändert würde oder wir einen anderen Wochentag auf 0 zuordnen wollten, würden wir einfach den Tag ÄndernEpoch. Beachten Sie, dass ticksPerSecond als 10000000L definiert ist, um einen Int64-Wert (8 Byte integer) zu machen. Ohne das Suffix L überläuft ticksPerDay den Bereich von Int32.

Functions

Die Ausdruckstransformation unterstützt viele nützliche Funktionen.

Allgemeine unäre Funktionen, die einen Operanden eines beliebigen Typs akzeptieren können, sind in der folgenden Tabelle aufgeführt.

Namen	Bedeutung	Kommentare
Isna	test for na	Gibt einen booleschen Wert zurück, der angibt, ob der Operand ein NA-Wert ist.
Na	der na-Wert	Gibt den NA-Wert desselben Typs zurück wie der Operand (entweder float oder double). Beachten Sie, dass dadurch der Operand nicht ausgewertet wird, nur der Operand verwendet wird, um den Typ der zurückzugebenden NA zu bestimmen, und diese Bestimmung erfolgt zur Kompilierzeit.
Standard	Der Standardwert	Gibt den Standardwert desselben Typs wie der Operand zurück. Zum Zuordnen von NA-Werten zu Standardwerten verwenden Sie beispielsweise x ?? default(x). Beachten Sie, dass dadurch der Operand nicht ausgewertet wird, nur der Operand verwendet wird, um den Typ des zurückgegebenen Standardwerts zu bestimmen, und dass die Ermittlung zur Kompilierzeit erfolgt. Bei numerischen Typen ist der Standardwert 0. Für Boolean ist der Standardwert false. Für Text ist der Standardwert leer.

Die unären Konvertierungsfunktionen sind in der folgenden Tabelle aufgeführt. Ein NA-Operand erzeugt eine NA oder löst aus, wenn der Typ sie nicht unterstützt. Eine Konvertierung, die nicht erfolgreich ist, oder ein Überlauf führt auch zu NA oder einer Ausnahme. Der häufigste Fall ist dies bei der Konvertierung aus Text, die die Standardkonvertierungsanalyse verwendet. Beim Konvertieren von einem Gleitkommawert (float oder double) in einen ganzzahligen Wert (Int32 oder Int64) führt die Konvertierung einen Abschneidenvorgang aus (auf 0 gerundet).

Namen	Bedeutung	Kommentare
Bool	Konvertieren in Boolesch	Der Operand muss Text oder boolescher Wert sein.
Int	konvertieren in Int32	Die Eingabe kann von einem beliebigen Typ sein.
Lange	konvertieren in Int64	Die Eingabe kann von einem beliebigen Typ sein.
single, float	konvertieren in Single	Die Eingabe kann von einem beliebigen Typ sein.
Doppel	konvertieren in Double	Die Eingabe kann von einem beliebigen Typ sein.
Text	In Text konvertieren	Die Eingabe kann von einem beliebigen Typ sein. Dadurch wird eine Standardtextdarstellung erzeugt.

Die unären Funktionen, die einen numerischen Operanden erfordern, sind in der folgenden Tabelle aufgeführt. Der Ergebnistyp ist mit dem Operandentyp identisch. Ein NA-Operandenwert erzeugt NA.

Namen	Bedeutung	Kommentare
Abs	absoluter Wert	Erzeugt den absoluten Wert des Operanden.
Zeichen	Zeichen (-1, 0, 1)	Erzeugt -1, 0 oder 1, je nachdem, ob der Operand negativ, null oder positiv ist.

Die binären Funktionen, die numerische Operanden erfordern, sind in der folgenden Tabelle aufgeführt. Wenn die Operandentypen nicht identisch sind, werden die Operanden zu einem geeigneten Typ heraufgestuft. Der Ergebnistyp ist identisch mit dem höhergestuften Operandentyp. Ein NA-Operandenwert erzeugt NA.

Namen	Bedeutung	Kommentare
Min	Minimale	Erzeugt das Minimum der Operanden.
Max	maximum	Erzeugt das Maximum der Operanden.

Die unären Funktionen, die einen Gleitkommaopernden erfordern, sind in der folgenden Tabelle aufgeführt. Der Ergebnistyp ist identisch mit dem Operandentyp. Overflow erzeugt unendlich. Ungültige Eingabewerte erzeugen na.

Namen	Bedeutung	Kommentare
Sqrt	Quadratwurzel	Negative Operanden erzeugen NA.
abschneiden, abschneiden	Abschneiden auf eine ganze Zahl	Rundet auf null auf den nächsten ganzzahligen Wert.
Boden	Boden	Rundet auf negative Unendlichkeit auf den nächsten ganzzahligen Wert.
Ceil, Decke	Decke	Rundet auf positive Unendlichkeit auf den nächsten ganzzahligen Wert.
Runde	Unvoreingenommenes Runden	Rundet auf den nächsten ganzzahligen Wert. Wenn sich der Operand auf halbem Weg zwischen zwei ganzzahligen Werten befindet, erzeugt dies die gerade ganze Zahl.
Exp	Exponentiellen	Löst e auf den Operanden aus.
ln, protokollieren	Logarithmus	Erzeugt den natürlichen Logarithmus (Basis e). Es gibt auch eine zwei Operandenversion des Protokolls für die Verwendung einer anderen Basis.
deg, grad	Bogenmaß bis Grad	Karten vom Bogenmaß bis zum Grad.
rad, bogenmaß	Grad bis Bogenmaß	Karten von Grad bis Bogenmaß.
sin, sind	Sinus	Nimmt den Sinus eines Winkels an. Die Sin-Funktion geht davon aus, dass sich der Operand im Bogenmaß befindet, während die Sind-Funktion davon ausgeht, dass der Operand in Graden ist.
cos, cosd	Kosinus	Nimmt den Kosinus eines Winkels. Die Cos-Funktion geht davon aus, dass der Operand im Bogenmaß liegt, während die Cosd-Funktion davon ausgeht, dass der Operand in Graden ist.
tan, tand	Tangente	Nimmt den Tangens eines Winkels an. Die Tan-Funktion geht davon aus, dass sich der Operand im Bogenmaß befindet, während die gerbte Funktion davon ausgeht, dass der Operand in Grad ist.
Sinh	hyperbolischer Sinus	Nimmt den hyperbolischen Sinus seines Operanden.
Cosh	hyperbolischer Kosinus	Nimmt den hyperbolischen Kosinus seines Operanden.
Tanh	Hyperbolischer Tangens	Nimmt den hyperbolischen Tangens seines Operanden.
Asin	inverser Sinus	Nimmt den umgekehrten Sinus seines Operanden.
Acos	umgekehrter Kosinus	Nimmt den umgekehrten Kosinus seines Operanden.
Atan	inverse Tangens	Nimmt den umgekehrten Tangens seines Operanden.

Die binären Funktionen, die Gleitkommaopernden erfordern, sind in der folgenden Tabelle aufgeführt. Wenn die Operandentypen nicht identisch sind, werden die Operanden zu einem geeigneten Typ heraufgestuft. Der Ergebnistyp ist identisch mit dem höhergestuften Operandentyp. Ein NA-Operandenwert erzeugt NA.

Namen	Bedeutung	Kommentare
Protokoll	Logarithmus mit angegebener Basis	Der zweite Operand ist die Basis. Die erste ist der Wert, von dem der Logarithmus verwendet werden soll.
atan2, atanyx	Bestimmen des Winkels	Bestimmt den Winkel zwischen -pi und pi aus den angegebenen y- und x-Werten. Beachten Sie, dass y der erste Operand ist.

Die Textfunktionen sind in der folgenden Tabelle aufgeführt.

Namen	Bedeutung	Kommentare
len(x)	Länge des Texts	Der Operand muss Text sein. Das Ergebnis ist ein I4, der die Länge des Operanden angibt. Wenn der Operand NA ist, ist das Ergebnis NA.
lower(x), upper(x)	Klein- oder Großbuchstaben	Ordnet den Text Klein- oder Großbuchstaben zu.
left(x, k), right(x, k)	Teilzeichenfolge	Der erste Operand muss Text sein, und der zweite Operand muss Int32 sein. Wenn der zweite Operand negativ ist, wird er als Offset vom Ende des Texts behandelt. Dieser angepasste Index wird dann auf 0 bis len(x) geklemmt. Das Ergebnis sind die Zeichen links oder rechts von der resultierenden Position.
mid(x, a, b)	Teilzeichenfolge	Der erste Operand muss Text sein, und die anderen beiden Operanden müssen Int32 sein. Die Indizes werden auf die gleiche Weise transformiert wie für die linke und rechte Funktion: negative Werte werden als Offsets vom Ende des Texts behandelt; diese angepassten Indizes werden auf 0 bis len(x) eingespannt. Der zweite eingespannte Index wird ebenfalls unten an den ersten eingespannten Index geklemmt. Das Ergebnis sind die Zeichen zwischen diesen beiden eingeklemmten Indizes.
concat(x1, x2, ..., xn)	Verkettung	Dies akzeptiert eine beliebige Anzahl von Operanden (einschließlich 0). Alle Operanden müssen Text sein. Das Ergebnis ist die Verkettung aller Operanden in der Reihenfolge.

Methoden

Fit(IDataView)	Dieser Schätzer wendet einen vom Benutzer bereitgestellten Ausdruck (angegeben als Zeichenfolge) an, um Spaltenwerte einzugeben, um neue Ausgabespaltenwerte zu erzeugen.
GetOutputSchema(SchemaShape)	Dieser Schätzer wendet einen vom Benutzer bereitgestellten Ausdruck (angegeben als Zeichenfolge) an, um Spaltenwerte einzugeben, um neue Ausgabespaltenwerte zu erzeugen.

Erweiterungsmethoden

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

Fügen Sie der Schätzungskette einen Zwischenspeicherungsprüfpunkt an. Dadurch wird sichergestellt, dass die nachgelagerten Schätzer für zwischengespeicherte Daten trainiert werden. Es ist hilfreich, vor Trainern, die mehrere Datendurchläufe durchführen, einen Zwischenspeicherungsprüfpunkt zu haben.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

Geben Sie bei einem Schätzer ein umschließendes Objekt zurück, das nach Fit(IDataView) dem Aufruf einen Delegaten aufruft. Es ist oft wichtig, dass ein Schätzer Informationen darüber zurückgibt, was geeignet war. Daher gibt die Fit(IDataView) Methode ein speziell typisiertes Objekt zurück, anstatt nur ein allgemeines ITransformer. Zur gleichen Zeit IEstimator<TTransformer> werden jedoch häufig Pipelines mit vielen Objekten gebildet, sodass wir möglicherweise eine Kette von Schätzern erstellen müssen, über EstimatorChain<TLastTransformer> die der Schätzer, für den wir den Transformator erhalten möchten, irgendwo in dieser Kette vergraben ist. Für dieses Szenario können wir über diese Methode einen Delegaten anfügen, der aufgerufen wird, sobald fit aufgerufen wird.

Gilt für:

Weitere Informationen

Expression(TransformsCatalog, String, String, String[])

Share via