TextLoader.Options Classe

Definizione

Impostazioni per TextLoader

public class TextLoader.Options
type TextLoader.Options = class
Public Class TextLoader.Options
Ereditarietà
TextLoader.Options

Costruttori

TextLoader.Options()

Impostazioni per TextLoader

Campi

AllowQuoting

Indica se l'input può includere valori con virgolette doppie. Questo parametro viene usato per distinguere i caratteri separatori in un valore di input dai separatori effettivi. Quando true, i separatori all'interno delle virgolette doppie vengono considerati come parte del valore di input. Quando false, tutti i separatori, anche quelli racchiusi tra virgolette, vengono considerati come delimitatori di una nuova colonna.

AllowSparse

Indica se l'input può includere rappresentazioni di tipo sparse. Ad esempio, una riga contenente "5 2:6 4:3" indica che sono presenti 5 colonne e l'unico valore diverso da zero sono le colonne 2 e 4, che hanno rispettivamente valori 6 e 3. Gli indici di colonna sono in base zero, quindi le colonne 2 e 4 rappresentano le colonne 3 e 5. Una colonna può anche avere valori densi seguiti da valori sparse rappresentati in questo modo. Ad esempio, una riga contenente "1 2 5 2:6 4:3" rappresenta due colonne dense con valori 1 e 2, seguite da 5 colonne di tipo sparse con valori 0, 0, 6, 0 e 3. Gli indici delle colonne di tipo sparse iniziano da 0, anche se 0 rappresenta la terza colonna.

Inoltre, InputSize deve essere usato quando il numero di elementi sparse (5 in questo esempio) non è presente in ogni riga. Deve specificare le dimensioni totali, non solo le dimensioni della parte di tipo sparse. Tuttavia, gli indici della parte spars sono relativi a dove inizia la parte sparse. Se InputSize è impostato su 7, la riga "1 2 2:6 4:3" verrà mappata a "1 2 0 0 6 0 4", ma se impostata su 10, la stessa riga verrà mappata a "1 2 0 0 6 0 4 0 0 0".

Columns

Specifica le colonne di input di cui eseguire il mapping alle IDataView colonne.

DecimalMarker

Carattere da utilizzare come marcatore decimale. Il valore predefinito è '.'. Solo '.' e ',' sono autorizzati a essere marcatori decimali.

EscapeChar

Carattere da utilizzare per utilizzare le virgolette all'interno di campi racchiusi tra virgolette. Non può essere un carattere usato come separatore.

HasHeader

Indica se il file ha un'intestazione con nomi di funzionalità. Quando true, il caricatore ignora la prima riga quando Load(IMultiStreamSource) viene chiamata. L'esempio può essere usato per dedurre le annotazioni del nome dello slot, se presente.

HeaderFile

File contenente un'intestazione con nomi di funzionalità. Se specificato, l'intestazione definita nel file di dati viene ignorata indipendentemente da HasHeader.

InputSize

Numero di colonne di origine nei dati di testo. Il valore predefinito è che le righe di tipo sparse contengono le informazioni sulle dimensioni.

MaxRows

Numero massimo di righe da produrre.

MissingRealsAsNaNs

Se true, i campi reali mancanti (ad esempio i campi double o singoli) verranno caricati come NaN. Se false, verranno caricati come 0. L'impostazione predefinita è false. Un campo viene considerato "mancante" se è vuoto, se contiene solo spazi vuoti o se mancano colonne alla fine di una determinata riga.

ReadMultilines

Se true, i nuovi caratteri di riga sono accettabili all'interno di un campo tra virgolette e pertanto un campo può contenere più righe di testo all'interno di esso Se AllowQuoting è false, questa opzione viene ignorata.

Separators

Caratteri da utilizzare come separatore di colonna.

TrimWhitespace

Wheter per rimuovere gli spazi vuoti finali dalle linee.

UseThreads

Indica se usare thread di analisi separati.

Si applica a