DataOperationsCatalog Klasse

Definition

Die Klasse, die zum Erstellen von Komponenten verwendet wird, die auf Daten ausgeführt werden, sind jedoch nicht Teil der Modellschulungspipeline. Enthält Komponenten zum Laden, Speichern, Cache, Filtern, Shuffle und Teilen von Daten.

public sealed class DataOperationsCatalog
type DataOperationsCatalog = class
Public NotInheritable Class DataOperationsCatalog
Vererbung
DataOperationsCatalog

Methoden

BootstrapSample(IDataView, Nullable<Int32>, Boolean)

Nehmen Sie ein ungefähres Bootstrapbeispiel von input.

Cache(IDataView, String[])

Erstellt einen lazyigen Speichercache von input.

CreateEnumerable<TRow>(IDataView, Boolean, Boolean, SchemaDefinition)

Konvertieren Sie eine IDataView in eine stark eingegebene IEnumerable<T>.

CrossValidationSplit(IDataView, Int32, String, Nullable<Int32>)

Teilen Sie das Dataset in Kreuzüberprüfungsfalten von Train-Set und Testsatz. Respektiert die samplingKeyColumnName sofern angegeben.

FilterRowsByColumn(IDataView, String, Double, Double)

Filtern Sie das Dataset nach den Werten einer numerischen Spalte.

FilterRowsByKeyColumnFraction(IDataView, String, Double, Double)

Filtern Sie das Dataset nach den Werten einer KeyDataViewType Spalte.

FilterRowsByMissingValues(IDataView, String[])

Geben Sie Zeilen ab, in denen jede Spalte columns einen fehlenden Wert enthält.

LoadFromEnumerable<TRow>(IEnumerable<TRow>, DataViewSchema)

Erstellen Sie eine neue IDataView Aufzählung der Elemente des benutzerdefinierten Typs mithilfe des angegebenen DataViewSchemaTyps, der möglicherweise mehr Informationen über das Schema enthält, als der Typ erfassen kann.

LoadFromEnumerable<TRow>(IEnumerable<TRow>, SchemaDefinition)

Erstellen Sie eine neue IDataView Aufzählung der Elemente des benutzerdefinierten Typs. Der Benutzer verwaltet den Besitz der data und der resultierenden Datenansicht wird den Inhalt der dataDatei nie ändern. Da angenommen IDataView wird, dass der Benutzer unveränderlich ist, wird erwartet, dass mehrere Aufzählungen data der gleichen Ergebnisse zurückgegeben werden, es sei denn, der Benutzer weiß, dass die Daten nur einmal cursort werden.

Eine typische Verwendung für die Streamingdatenansicht könnte sein: Erstellen Sie die Datenansicht, die Daten nach Bedarf lazily lädt, und wenden Sie dann vorab trainierte Transformationen auf sie an und cursorn sie für Transformationsergebnisse.

ShuffleRows(IDataView, Nullable<Int32>, Int32, Boolean)

Schränken Sie die Zeilen von input.

SkipRows(IDataView, Int64)

Überspringen Sie count Zeilen in input.

TakeRows(IDataView, Int64)

Nehmen Sie count Zeilen aus input.

TrainTestSplit(IDataView, Double, String, Nullable<Int32>)

Teilen Sie das Dataset in den Zugsatz und den Testsatz nach dem angegebenen Bruch. Respektiert die samplingKeyColumnName sofern angegeben.

Erweiterungsmethoden

LoadFromBinary(DataOperationsCatalog, IMultiStreamSource)

Laden Sie eine IDataView Aus einer binärdatei aus.IMultiStreamSource Beachten Sie, dass IDataView"s lazy" ist, sodass hier keine tatsächliche Ladevorgang erfolgt, nur schemaüberprüfung.

LoadFromBinary(DataOperationsCatalog, String)

Laden Sie eine IDataView Binärdatei aus. Beachten Sie, dass IDataView"s lazy" ist, sodass hier keine tatsächliche Ladevorgang erfolgt, nur schemaüberprüfung.

SaveAsBinary(DataOperationsCatalog, IDataView, Stream, Boolean)

Speichern Sie das IDataView Objekt in einem binärdatenstrom.

FilterByCustomPredicate<TSrc>(DataOperationsCatalog, IDataView, Func<TSrc,Boolean>)

Drop-Zeilen, in denen ein angegebenes Prädikat true zurückgibt.

FilterByStatefulCustomPredicate<TSrc,TState>(DataOperationsCatalog, IDataView, Func<TSrc,TState,Boolean>, Action<TState>)

Drop-Zeilen, in denen ein angegebenes Prädikat true zurückgibt. Dieser Filter ermöglicht es, einen Cursorzustand beizubehalten.

CreateSvmLightLoader(DataOperationsCatalog, Nullable<Int64>, Int32, Boolean, IMultiStreamSource)

Erstellt einen Loader, der SVM-Light-Formatdateien lädt. SvmLightLoader.

CreateSvmLightLoaderWithFeatureNames(DataOperationsCatalog, Nullable<Int64>, IMultiStreamSource)

Erstellt einen Ladevorgang, der SVM-light wie Dateien lädt, wobei Features von ihren Namen angegeben werden.

LoadFromSvmLightFile(DataOperationsCatalog, String, Nullable<Int64>, Int32, Boolean)

Laden Sie eine Textdatei mithilfe SvmLightLoadereiner IDataView Textdatei.

LoadFromSvmLightFileWithFeatureNames(DataOperationsCatalog, String, Nullable<Int64>)

Laden Sie eine IDataView Textdatei aus einer Textdatei, die Features enthält, die von Featurenamen angegeben sind, mithilfe SvmLightLoadervon .

SaveInSvmLightFormat(DataOperationsCatalog, IDataView, Stream, Boolean, Boolean, String, String, String, String)

Speichern Sie das IDataView IN SVM-Light-Format. Vier Spalten können gespeichert werden: eine Bezeichnung und eine Featuresspalte und optional eine Gruppen-ID-Spalte und eine Beispielgewichtsspalte.

CreateDatabaseLoader(DataOperationsCatalog, DatabaseLoader+Column[])

Erstellen Sie einen Datenbanklaster DatabaseLoader.

CreateDatabaseLoader(DataOperationsCatalog, DatabaseLoader+Options)

Erstellen Sie einen Datenbanklaster DatabaseLoader.

CreateDatabaseLoader<TInput>(DataOperationsCatalog)

Erstellen Sie einen Datenbanklaster DatabaseLoader.

CreateTextLoader(DataOperationsCatalog, TextLoader+Column[], Char, Boolean, IMultiStreamSource, Boolean, Boolean, Boolean)

Erstellen Sie einen Textlaster TextLoader.

CreateTextLoader(DataOperationsCatalog, TextLoader+Options, IMultiStreamSource)

Erstellen Sie einen Textlaster TextLoader.

CreateTextLoader<TInput>(DataOperationsCatalog, TextLoader+Options, IMultiStreamSource)

Erstellen Sie ein Textladeprogramm TextLoader , indem Sie das Datasetschema aus einem Datentyp abgeleitet haben.

CreateTextLoader<TInput>(DataOperationsCatalog, Char, Boolean, IMultiStreamSource, Boolean, Boolean, Boolean)

Erstellen Sie ein Textladeprogramm TextLoader , indem Sie das Datasetschema aus einem Datentyp abgeleitet haben.

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Column[], Char, Boolean, Boolean, Boolean, Boolean)

Laden Sie eine Textdatei mithilfe TextLoadereiner IDataView Textdatei. Beachten Sie, dass IDataView"s lazy" ist, sodass hier keine tatsächliche Ladevorgang erfolgt, nur schemaüberprüfung.

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Options)

Laden Sie eine Textdatei mithilfe TextLoadereiner IDataView Textdatei. Beachten Sie, dass IDataView"s lazy" ist, sodass hier keine tatsächliche Ladevorgang erfolgt, nur schemaüberprüfung.

LoadFromTextFile<TInput>(DataOperationsCatalog, String, TextLoader+Options)

Laden Sie eine Textdatei mithilfe TextLoadereiner IDataView Textdatei. Beachten Sie, dass IDataView"s lazy" ist, sodass hier keine tatsächliche Ladevorgang erfolgt, nur schemaüberprüfung.

LoadFromTextFile<TInput>(DataOperationsCatalog, String, Char, Boolean, Boolean, Boolean, Boolean)

Laden Sie eine Textdatei mithilfe TextLoadereiner IDataView Textdatei. Beachten Sie, dass IDataView"s lazy" ist, sodass hier keine tatsächliche Ladevorgang erfolgt, nur schemaüberprüfung.

SaveAsText(DataOperationsCatalog, IDataView, Stream, Char, Boolean, Boolean, Boolean, Boolean)

Speichern Sie den IDataView Text als Text.

Gilt für: