Data tabell

Data tabell klass

En data uppsättning är data som har överförts till Azure Machine Learning Studio (klassisk) så att de kan användas i modellerings processen. Även om du överför data i ett annat format eller anger ett lagrings format som CSV, ARFF eller TSV, konverteras data implicit till ett DataTable objekt när de används av en modul i ett experiment.

Anteckning

Gäller för: Machine Learning Studio (klassisk)

Det här innehållet gäller endast Studio (klassisk). Liknande dra-och släpp moduler har lagts till i Azure Machine Learning designer. Mer information i den här artikeln är att jämföra de två versionerna.

Data uppsättningen baseras på .NET- data tabellen

Kolumn typer

En DataTable består av en samling kolumner med associerade metadata. Dessa kolumner implementerar IArray gränssnittet. Kolumner med data i Machine Learning Studio (klassisk) anses vara endimensionella matriser – det vill säga vektorer.

Klassen .NET- matris implementerar dessa generiska gränssnitt: System.Collections.Generic.IList<T> , System.Collections.Generic.ICollection<T> och System.Collections.Generic.IEnumerable<T> .

Kolumner av typen int , double och visas Boolean vanligt vis som numeriska kompakta matriser. Om en kompakt kolumn innehåller värden som saknas hanteras den antingen som en matris med saknade värden eller som en objekt sträng som kan ha värdet null.

Kolumner som innehåller strängar hanteras som objekt tätare matriser. Om det saknas värden visas de saknade värdena antingen som null-värden eller som typ MissingValuesObjectArray<string> .

Mer information finns i klassen Array (MSDN-bibliotek).

Hämta kolumner i en DataTable

Du kan hämta en kolumn genom att anropa- GetColumn metoden i DataTable. GetColumnMetoden har två överbelastningar:

  • GetColumn(<Int64>) hämtar en kolumn med hjälp av indexet.

  • GetColumn(<string>) hämtar en kolumn med hjälp av namnet.

Andra gränssnitt i Studio (klassisk)

I det här avsnittet beskrivs även följande gränssnitt för Azure Machine Learning:

Typ Description
ICluster-gränssnitt ICluster-gränssnittet definierar strukturen för kluster modeller.
IFilter-gränssnitt IFilter-gränssnittet definierar strukturen för de digitala signal bearbetnings filter som tillämpas på en hel serie av numeriska värden. Filter kan skapas och sedan sparas och tillämpas på en ny serie.
ILearner-gränssnitt ILearner-gränssnittet är en allmän struktur för att definiera och spara analys modeller, förutom vissa särskilda typer, till exempel kluster modeller.
ITransform-gränssnitt ITransform-gränssnittet tillhandahåller en allmän struktur för att definiera och spara transformeringar. Du kan skapa en iTransform med hjälp av Machine Learning Studio (klassisk) och sedan använda omvandlingen på nya data uppsättningar.

Se även

Modulens data typer