Tabulka dat

Třída tabulky dat

Datová sada je data, která byla nahrána do Azure Machine Learning Studio (Classic), aby ji bylo možné použít v procesu modelování. I když odesíláte data v jiném formátu nebo zadáte formát úložiště, jako je CSV, ARFF nebo TSV, data se implicitně převedou na objekt, DataTable když ho modul v experimentu používá.

Poznámka

Platí pro: Machine Learning Studio (Classic)

Tento obsah se týká pouze studia (Classic). Podobné moduly přetažení byly přidány do návrháře Azure Machine Learning. Další informace najdete v tomto článku porovnávající tyto dvě verze.

Datová sada je založena na tabulce dat .NET.

Typy sloupců

DataTableObsahuje kolekci sloupců s přidruženými metadaty. Tyto sloupce implementují IArray rozhraní. Sloupce dat v Machine Learning Studio (klasické) se považují za jednorozměrné pole – to znamená vektory.

Třída pole .NET implementuje Tato obecná rozhraní: System.Collections.Generic.IList<T> , System.Collections.Generic.ICollection<T> a System.Collections.Generic.IEnumerable<T> .

Sloupce typů int , double a Boolean jsou obvykle reprezentovány jako číselná zhuštěná pole. Pokud sloupec zhuštěného sloupce obsahuje chybějící hodnoty, bude zpracován buď jako pole chybějících hodnot, nebo jako husté pole objektu s možnou hodnotou null.

Sloupce obsahující řetězce jsou zpracovávány jako hustá pole objektů. Pokud chybějí hodnoty, chybějící hodnoty jsou reprezentovány buď jako null, nebo jako typ MissingValuesObjectArray<string> .

Další informace naleznete v tématu Třída Array (MSDN Library).

Získávání sloupců v objektu DataTable

Sloupec můžete získat voláním GetColumn metody v objektu DataTable. GetColumnMetoda má dvě přetížení:

  • GetColumn(<Int64>) Získá sloupec podle jeho indexu.

  • GetColumn(<string>) Získá sloupec podle jeho názvu.

Další rozhraní v studiu (klasické)

Tato část také popisuje následující rozhraní pro Azure Machine Learning:

Typ Description
Rozhraní ICluster Rozhraní ICluster definuje strukturu modelů clusteringu.
Rozhraní IFilter Rozhraní IFilter definuje strukturu filtrů pro zpracování digitálního signálu používaných pro celou řadu číselných hodnot. Filtry je možné vytvořit a následně uložit a použít na novou řadu.
Rozhraní ILearner Rozhraní ILearner poskytuje obecnou strukturu pro definování a ukládání analytických modelů s výjimkou některých speciálních typů, jako jsou modely clusteringu.
Rozhraní ITransform Rozhraní ITransform poskytuje obecnou strukturu pro definování a ukládání transformací. ITransform můžete vytvořit pomocí Machine Learning Studio (Classic) a pak použít transformaci na nové datové sady.

Viz také

Datové typy modulů