Datentabelle

Datentabellenklasse

Bei einem DataSet handelt es sich um Daten, die in Azure Machine Learning Studio (klassisch) hochgeladen wurden, damit Sie im Modellierungsprozess verwendet werden können. Auch wenn Sie Daten in einem anderen Format hochladen oder ein Speicherformat wie CSV, ARFF oder TSV angeben, werden die Daten stets implizit in ein DataTable-Objekt umgewandelt, wenn sie von einem Modul in einem Experiment verwendet werden.

Hinweis

Gilt für: Machine Learning Studio (klassisch)

Dieser Inhalt bezieht sich nur auf Studio (klassisch). Ähnliche Drag & Drop-Module wurden Azure Machine Learning-Designer hinzugefügt. Weitere Informationen finden Sie in diesem Artikel zum Vergleich der beiden Versionen.

Das DataSet basiert auf der .net- Datentabelle .

Spaltentypen

Ein DataTable-Objekt besteht aus einer Auflistung von Spalten mit dazugehörigen Metadaten. Mit diesen Spalten wird die IArray-Schnittstelle implementiert. Spalten von Daten in Machine Learning Studio (klassisch) werden als eindimensionale Arrays verstanden – d. h. Vektoren.

Die .net- Array Klasse implementiert diese generischen Schnittstellen: System.Collections.Generic.IList<T> , System.Collections.Generic.ICollection<T> und System.Collections.Generic.IEnumerable<T> .

Spalten vom Typ int , double und Boolean werden in der Regel als numerische, Dichte Arrays dargestellt. Wenn eine Dichte Spalte fehlende Werte enthält, wird Sie entweder als Array fehlender Werte oder als Array mit einem dichten Objekt behandelt, das auf NULL festgelegt werden kann.

Spalten mit Zeichenfolgen werden als dichte Arrays mit Objekten behandelt. Wenn fehlende Werte vorhanden sind, werden die fehlenden Werte entweder als Nullen oder als Typ dargestellt MissingValuesObjectArray<string> .

Weitere Informationen finden Sie unter Array-Klasse (MSDN Library).

Erhalten von Spalten in einer Datentabelle

Sie können eine Spalte abrufen, indem Sie die- GetColumn Methode für die Datentabelle aufrufen. Die- GetColumn Methode verfügt über zwei über Ladungen:

  • GetColumn(<Int64>) ruft eine Spalte anhand ihres Indexes ab.

  • GetColumn(<string>) ruft eine Spalte anhand ihres Namens ab.

Andere Schnittstellen in Studio (klassisch)

In diesem Abschnitt werden auch die folgenden Schnittstellen für Azure Machine Learning beschrieben:

type Beschreibung
ICluster-Schnittstelle Die icluster-Schnittstelle definiert die Struktur von Clustering-Modellen.
IFilter-Schnittstelle Die IFilter-Schnittstelle definiert die Struktur digitaler Signal Verarbeitungs Filter, die auf eine ganze Reihe von numerischen Werten angewendet werden. Filter können erstellt und dann gespeichert und auf eine neue Reihe angewendet werden.
ILearner-Schnittstelle Die ilearner-Schnittstelle bietet eine generische Struktur zum Definieren und Speichern von analytischen Modellen, ausgenommen einige besondere Typen, z. b. Clustering-Modelle.
ITransform-Schnittstelle Die itransform-Schnittstelle stellt eine generische Struktur zum Definieren und Speichern von Transformationen bereit. Sie können eine itransform mithilfe Machine Learning Studio (klassisch) erstellen und dann die Transformation auf neue Datasets anwenden.

Weitere Informationen

Moduldatentypen