Datentabelle

Wichtig

Der Support für Machine Learning Studio (klassisch) endet am 31. August 2024. Es wird empfohlen, bis zu diesem Datum auf Azure Machine Learning umzustellen.

Ab dem 1. Dezember 2021 können Sie keine neuen Ressourcen in Machine Learning Studio (klassisch) mehr erstellen. Bis zum 31. August 2024 können Sie die vorhandenen Ressourcen in Machine Learning Studio (klassisch) weiterhin verwenden.

Die Dokumentation zu ML Studio (klassisch) wird nicht mehr fortgeführt und kann künftig nicht mehr aktualisiert werden.

Datentabellenklasse

Bei einem Dataset handelt es sich um Daten, die in Machine Learning Studio (klassisch) hochgeladen wurden, damit sie für den Modellierungsprozess zur Verfügung stehen. Auch wenn Sie Daten in einem anderen Format hochladen oder ein Speicherformat wie CSV, ARFF oder TSV angeben, werden die Daten stets implizit in ein DataTable-Objekt umgewandelt, wenn sie von einem Modul in einem Experiment verwendet werden.

Hinweis

Gilt für: Machine Learning Studio (klassisch)

Ähnliche Drag & Drop-Module sind im Azure Machine Learning-Designer verfügbar.

Das Dataset basiert auf der . NET-Datentabelle.

Spaltentypen

Ein DataTable-Objekt besteht aus einer Auflistung von Spalten mit dazugehörigen Metadaten. Mit diesen Spalten wird die IArray-Schnittstelle implementiert. Datenspalten in Machine Learning Studio (klassisch) werden als eindimensionale Arrays verstanden, d. h. Vektoren.

Die .NET Array-Klasse implementiert diese generischen Schnittstellen: System.Collections.Generic.IList<T>, System.Collections.Generic.ICollection<T>und System.Collections.Generic.IEnumerable<T>.

Spalten der Typen int, doubleund Boolean werden in der Regel als numerische dichte Arrays dargestellt. Wenn eine dichte Spalte fehlende Werte enthält, wird sie entweder als Array mit fehlenden Werten oder als objektdichtes Array behandelt, das NULL-Werte zugibt.

Spalten mit Zeichenfolgen werden als dichte Arrays mit Objekten behandelt. Wenn Werte fehlen, werden die fehlenden Werte entweder als NULL-Werte oder als Typ dargestellt MissingValuesObjectArray<string>.

Weitere Informationen finden Sie unter Array-Klasse (MSDN Library).

Abrufen von Spalten in einer DataTable

Sie können eine Spalte erhalten, indem Sie die -Methode GetColumn für die DataTable aufrufen. Die GetColumn -Methode verfügt über zwei Überladungen:

  • GetColumn(<Int64>) ruft eine Spalte anhand ihres Indexes ab.

  • GetColumn(<string>) ruft eine Spalte anhand ihres Namens ab.

Andere Schnittstellen in Studio (klassisch)

In diesem Abschnitt werden auch die folgenden Schnittstellen für Machine Learning Studio (klassisch) beschrieben:

Type Beschreibung
ICluster-Schnittstelle Die ICluster-Schnittstelle definiert die Struktur von Clusteringmodellen.
IFilter-Schnittstelle Die IFilter-Schnittstelle definiert die Struktur der Filter für die Digitale Signalverarbeitung, die auf eine ganze Reihe numerischer Werte angewendet werden. Filter können erstellt und anschließend gespeichert und auf eine neue Reihe angewendet werden.
ILearner-Schnittstelle Die ILearner-Schnittstelle stellt eine generische Struktur zum Definieren und Speichern analytischer Modelle bereit, mit Ausnahme einiger spezieller Typen wie Clusteringmodelle.
ITransform-Schnittstelle Die ITransform-Schnittstelle stellt eine generische Struktur zum Definieren und Speichern von Transformationen bereit. Sie können eine iTransform mithilfe von Machine Learning Studio (klassisch) erstellen und dann die Transformation auf neue Datasets anwenden.

Siehe auch

Moduldatentypen