Tabulka dat
Třída tabulky dat
Datová sada je data, která byla nahrána do Azure Machine Learning Studio (Classic), aby ji bylo možné použít v procesu modelování. I když odesíláte data v jiném formátu nebo zadáte formát úložiště, jako je CSV, ARFF nebo TSV, data se implicitně převedou na objekt, DataTable
když ho modul v experimentu používá.
Poznámka
Platí pro: Machine Learning Studio (Classic)
Tento obsah se týká pouze studia (Classic). Podobné moduly přetažení byly přidány do návrháře Azure Machine Learning. Další informace najdete v tomto článku porovnávající tyto dvě verze.
Datová sada je založena na tabulce dat .NET.
Typy sloupců
DataTable
Obsahuje kolekci sloupců s přidruženými metadaty. Tyto sloupce implementují IArray
rozhraní. Sloupce dat v Machine Learning Studio (klasické) se považují za jednorozměrné pole – to znamená vektory.
Třída pole .NET implementuje Tato obecná rozhraní: System.Collections.Generic.IList<T>
, System.Collections.Generic.ICollection<T>
a System.Collections.Generic.IEnumerable<T>
.
Sloupce typů int
, double
a Boolean
jsou obvykle reprezentovány jako číselná zhuštěná pole. Pokud sloupec zhuštěného sloupce obsahuje chybějící hodnoty, bude zpracován buď jako pole chybějících hodnot, nebo jako husté pole objektu s možnou hodnotou null.
Sloupce obsahující řetězce jsou zpracovávány jako hustá pole objektů. Pokud chybějí hodnoty, chybějící hodnoty jsou reprezentovány buď jako null, nebo jako typ MissingValuesObjectArray<string>
.
Další informace naleznete v tématu Třída Array (MSDN Library).
Získávání sloupců v objektu DataTable
Sloupec můžete získat voláním GetColumn
metody v objektu DataTable. GetColumn
Metoda má dvě přetížení:
GetColumn(<Int64>)
Získá sloupec podle jeho indexu.GetColumn(<string>)
Získá sloupec podle jeho názvu.
Další rozhraní v studiu (klasické)
Tato část také popisuje následující rozhraní pro Azure Machine Learning:
Typ | Description |
---|---|
Rozhraní ICluster | Rozhraní ICluster definuje strukturu modelů clusteringu. |
Rozhraní IFilter | Rozhraní IFilter definuje strukturu filtrů pro zpracování digitálního signálu používaných pro celou řadu číselných hodnot. Filtry je možné vytvořit a následně uložit a použít na novou řadu. |
Rozhraní ILearner | Rozhraní ILearner poskytuje obecnou strukturu pro definování a ukládání analytických modelů s výjimkou některých speciálních typů, jako jsou modely clusteringu. |
Rozhraní ITransform | Rozhraní ITransform poskytuje obecnou strukturu pro definování a ukládání transformací. ITransform můžete vytvořit pomocí Machine Learning Studio (Classic) a pak použít transformaci na nové datové sady. |