データ テーブル

データ テーブル クラス

データセットは、モデリングプロセスで使用できるように Azure Machine Learning Studio (クラシック) にアップロードされたデータです。 データが別の形式でアップロードされている場合や、CSV、ARFF、TSV などのストレージ形式が指定されている場合でも、実験においてモジュールに使用されるときには常に DataTable オブジェクトに暗黙的に変換されます。

注意

適用対象: Machine Learning Studio (クラシック)

このコンテンツは、Studio (クラシック) のみに関連しています。 Azure Machine Learning デザイナーに同様のドラッグアンドドロップモジュールが追加されました。 この記事では、2つのバージョンの比較について詳しく説明します。

データセットは .NETデータテーブルに基づいています。

列の型

DataTable は、関連するメタデータが格納された列のコレクションで構成されます。 これらの列には IArray インターフェイスが実装されています。 Machine Learning Studio (クラシック) のデータ列は、1次元配列 (つまり、 ベクトル) として認識されます。

.NET 配列 クラスは System.Collections.Generic.IList<T> 、、、およびのジェネリックインターフェイスを実装します System.Collections.Generic.ICollection<T> System.Collections.Generic.IEnumerable<T>

型、型、および型の列 int double は、通常、数値の Boolean 高密度配列として表されます。 高密度列に欠損値が含まれている場合は、欠損値配列として、または null 許容型オブジェクトの高密度配列として処理されます。

文字列を含む列は、オブジェクトの密な配列として処理されます。 欠損値がある場合、欠損値は null または型として表され MissingValuesObjectArray<string> ます。

詳細については、「 Array クラス (MSDN ライブラリ)」を参照してください。

DataTable 内の列の取得

列を取得するには、 GetColumn DataTable でメソッドを呼び出します。 GetColumnメソッドには、次の2つのオーバーロードがあります。

  • GetColumn(<Int64>) は列をインデックスで取得します。

  • GetColumn(<string>) は列を名前で取得します。

Studio のその他のインターフェイス (クラシック)

このセクションには、Azure 機械学習の次のインターフェイスに関する説明もあります。

Type 説明
ICluster インターフェイス ICluster インターフェイスは、クラスターモデルの構造を定義します。
IFilter インターフェイス IFilter インターフェイスは、一連の数値の全体に適用されるデジタルシグナル処理フィルターの構造を定義します。 フィルターを作成して保存し、新しい系列に適用できます。
ILearner インターフェイス Ilのインターフェイスは、クラスターモデルなどの特殊な型を除く、分析モデルを定義および保存するためのジェネリックな構造を提供します。
ITransform インターフェイス ITransform インターフェイスは、変換を定義および保存するためのジェネリック構造体を提供します。 Machine Learning Studio (クラシック) を使用して iTransform を作成し、その変換を新しいデータセットに適用できます。

関連項目

モジュールのデータ型