列の分布 (データ マイニング)

適用対象: Azure Analysis Services Power BI Premiumを SQL Server Analysis Servicesする

重要

データ マイニングは、SQL Server 2017 Analysis Services で非推奨となり、SQL Server 2022 Analysis Services で廃止されました。 非推奨および廃止された機能については、ドキュメントは更新されません。 詳細については、 Analysis Services の下位互換性に関するページを参照してください。

Microsoft SQL Server SQL Server Analysis Servicesでは、マイニング構造で列分布を定義して、マイニング モデルの作成時にそれらの列のデータをアルゴリズムで処理する方法に影響を与えることができます。 いくつかのアルゴリズムは、列が値の一般的な分布を含むことが認識された場合、モデルを処理する前にすべての連続列の分布を定義するために使用されます。 分布が定義されない場合、アルゴリズムが持つデータを解釈するための情報が少ないため、分布が定義されたときよりも、マイニング モデルの結果が実際の予測より小さくなる場合があります。

SQL Server Analysis Servicesで使用できるアルゴリズムは、次の配布の種類をサポートします。

標準
連続列の値は、正規分布のヒストグラムを形成します。

Histogram with normal distribution

Log Normal
連続列の値は、曲線が上端で長くなり、下端に向かってスキューされるヒストグラムを形成します。

Histogram with log normal distribution

均一
連続列の値はフラット曲線を形成し、すべての値が等しくなります。

Histogram with uniform distribution

SQL Server Analysis Servicesが提供するアルゴリズムの詳細については、「データ マイニング アルゴリズム (Analysis Services - データ マイニング)」を参照してください。

関連項目

コンテンツの種類 (データ マイニング)
マイニング構造 (Analysis Services - データ マイニング)
分離メソッド (データ マイニング)
分布 (DMX)
マイニング構造列