Share via


TextLoader.Options Klasse

Definition

Die Einstellungen für TextLoader

public class TextLoader.Options
type TextLoader.Options = class
Public Class TextLoader.Options
Vererbung
TextLoader.Options

Konstruktoren

TextLoader.Options()

Die Einstellungen für TextLoader

Felder

AllowQuoting

Gibt an, ob die Eingabe Werte in doppelter Anführungszeichen enthalten darf. Dieser Parameter wird verwendet, um Trennzeichen in einem Eingabewert von tatsächlichen Trennzeichen zu unterscheiden. Wenn true, werden Trennzeichen in doppelten Anführungszeichen als Teil des Eingabewerts behandelt. Wenn false, werden alle Trennzeichen, auch die in Anführungszeichen, als Trennzeichen für eine neue Spalte behandelt.

AllowSparse

Gibt an, ob die Eingabe Sparsedarstellungen enthalten kann. Beispielsweise bedeutet eine Zeile mit "5 2:6 4:3", dass es fünf Spalten gibt, und die einzigen Spalten ungleich Null sind die Spalten 2 und 4, die die Werte 6 bzw. 3 aufweisen. Spaltenindizes sind nullbasiert, sodass die Spalten 2 und 4 die 3. und 5. Spalte darstellen. Eine Spalte kann auch dichte Werte aufweisen, gefolgt von Sparsewerten, die auf diese Weise dargestellt werden. Beispielsweise stellt eine Zeile mit "1 2 5 2:6 4:3" zwei dichte Spalten mit den Werten 1 und 2 dar, gefolgt von 5 spär dargestellten Spalten mit den Werten 0, 0, 6, 0 und 3. Die Indizes der Sparsespalten beginnen bei 0, obwohl 0 die dritte Spalte darstellt.

Darüber hinaus sollte verwendet werden, InputSize wenn die Anzahl der Sparseelemente (in diesem Beispiel 5) nicht in jeder Zeile vorhanden ist. Es sollte die Gesamtgröße angeben, nicht nur die Größe des Sparseteils. Die Indizes des Spars-Teils sind jedoch relativ zum Anfang des Sparseteils. Wenn InputSize auf 7 festgelegt ist, wird die Zeile "1 2 2:6 4:3" "1 2 0 0 0 6 0 4" zugeordnet, aber wenn auf 10 festgelegt ist, wird dieselbe Zeile "1 2 0 0 6 0 4 0 0 0" zugeordnet.

Columns

Gibt die Eingabespalten an IDataView , die Spalten zugeordnet werden sollen.

DecimalMarker

Das Zeichen, das als Dezimalmarkierung verwendet werden soll. Der Standardwert ist ".". Nur "." und "," dürfen Dezimalmarkierungen sein.

EscapeChar

Zeichen, das verwendet werden soll, um Anführungszeichen in Anführungszeichen zu escapen. Es darf kein Zeichen sein, das als Trennzeichen verwendet wird.

HasHeader

Gibt an, ob die Datei über einen Header mit Featurenamen verfügt. Wenn true, überspringt das Ladeprogramm die erste Zeile, wenn Load(IMultiStreamSource) aufgerufen wird. Das Beispiel kann verwendet werden, um Anmerkungen zum Slotnamen abzuleiten, falls vorhanden.

HeaderFile

Datei, die einen Header mit Featurenamen enthält. Wenn angegeben, wird der in der Datendatei definierte Header unabhängig von HasHeaderignoriert.

InputSize

Anzahl der Quellspalten in den Textdaten. Der Standardwert ist, dass Sparsezeilen ihre Größeninformationen enthalten.

MaxRows

Maximale Anzahl der zu erzeugenden Zeilen.

MissingRealsAsNaNs

Wenn true, werden fehlende reale Felder (d. h. doppel oder einzelne Felder) als NaN geladen. Wenn false, werden sie als 0 geladen. Der Standardwert ist "false". Ein Feld wird als "fehlend" betrachtet, wenn es leer ist, wenn es nur Leerzeichen enthält oder wenn am Ende einer bestimmten Zeile Spalten fehlen.

ReadMultilines

Wenn true, sind neue Zeilenzeichen innerhalb eines Felds in Anführungszeichen zulässig, sodass ein Feld mehrere Textzeilen enthalten kann. Wenn AllowQuoting false ist, wird diese Option ignoriert.

Separators

Die Zeichen, die als Trennzeichen verwendet werden sollen.

TrimWhitespace

Wheter, um nachfolgende Leerzeichen von Zeilen zu entfernen.

UseThreads

Gibt an, ob separate Analysethreads verwendet werden sollen.

Gilt für: