データマイニングアルゴリズム (Analysis Services - データマイニング)

[アーティクル]
10/31/2023

適用対象:SQL Server 2019 以前の Analysis Services Azure Analysis Services Fabric/Power BI Premium

重要

データマイニングは SQL Server 2017 Analysis Services で非推奨となり、SQL Server 2022 Analysis Services で停止されました。非推奨および停止された機能については、ドキュメントの更新は行われません。詳細については、「Analysis Services 下位互換性」を参照してください。

データマイニング (機械学習) の アルゴリズム は、データからモデルを作成するヒューリスティクスと計算のセットです。モデルを作成するために、データマイニングアルゴリズムは、まず提供されたデータを分析し、特定の種類のパターンまたは傾向を探します。この分析を繰り返し実行した結果を使用して、マイニングモデルを作成するための最適化されたパラメーターが定義されます。これらのパラメーターはデータセット全体に適用され、実用的なパターンおよび詳細な統計情報が抽出されます。

アルゴリズムによってデータから作成されるマイニングモデルは、次のようにさまざまな形式を取ります。

データセット内のケースの関係を説明するクラスターのセット
結果を予測し、基準を変更するとその結果がどのように影響を受けるのかを示すデシジョンツリー
売上を予想する数学的モデル
複数の製品を 1 つのトランザクションにグループ化する方法、およびそれらの製品がまとめて購入される確率を示すルールのセット

SQL Server データマイニングで提供されるアルゴリズムは、データからパターンを派生する最も一般的で、よく研究された方法です。一例を挙げるには、K-means クラスタリングは最も古いクラスタリングアルゴリズムの 1 つであり、さまざまなツールやさまざまな実装とオプションで広く使用できます。ただし、SQL Server データマイニングで使用される K-Means クラスタリングの特定の実装は、Microsoft Research によって開発され、SQL Server Analysis Servicesによるパフォーマンスのために最適化されました。 Microsoft データマイニングアルゴリズムはすべて、提供された API を使用して広範にカスタマイズしたり、十分にプログラムすることができます。 Integration Services のデータマイニングコンポーネントを使用して、モデルの作成、トレーニング、再トレーニングを自動化することもできます。

また、OLE DB for Data Mining 仕様に準拠するサードパーティ製アルゴリズムを使用することも、またはサービスとして登録してから SQL Server データマイニングフレームワーク内で使用できるカスタムアルゴリズムを開発することもできます。

適切なアルゴリズムの選択

特定の分析タスクに使用する最適なアルゴリズムを選択するのが困難な場合があります。異なるアルゴリズムを使用して同じビジネスタスクを実行できる一方、各アルゴリズムによって異なる結果が生成されたり、一部のアルゴリズムでは複数の種類の結果が生成されたりする場合があります。たとえば、Microsoft デシジョンツリーアルゴリズムは、予測だけでなく、データセット内の列の数を減らす方法としても使用できます。これは、デシジョンツリーが、最終的なマイニングモデルに影響を与えない列を識別できるためです。

種類別アルゴリズムの選択

SQL Server データマイニングには、次のアルゴリズムの種類が含まれます。

分類アルゴリズム 。データセット内の他の属性に基づいて、1 つまたは複数の離散変数を予測します。
回帰アルゴリズム 。データセット内の他の属性に基づいて、利益や損失などの 1 つまたは複数の連続数値変数を予測します。
分割アルゴリズム 。データを、類似したプロパティを持つアイテムのグループまたはクラスターに分割します。
アソシエーションアルゴリズム 。データセット内の異なる属性間の相関関係を検出します。この種類のアルゴリズムの最も一般的な使用例は、マーケットバスケット分析で使用するアソシエーションルールの作成です。
シーケンス分析アルゴリズム 。Web サイトの一連のクリック、マシン保守に先行するログイベントなど、データ内の頻度の高いシーケンスまたはエピソードを要約します。

ただし、ソリューションが複数ある中で、1 つのアルゴリズムに限定される必要はありません。経験豊富なアナリストであれば、ある 1 つのアルゴリズムを使用して最も効果的な入力 (つまり変数) を判断し、次に別のアルゴリズムを適用してそのデータに基づいて特定の結果を予測するものです。 SQL Server データマイニングを使用すると、1 つのマイニング構造で複数のモデルを構築できるため、1 つのデータマイニングソリューション内でクラスタリングアルゴリズム、デシジョンツリーモデル、Naïve Bayes モデルを使用して、データに対して異なるビューを取得できます。また、1 つのソリューション内で複数のアルゴリズムを使用して、個別のタスクを実行することもできます。たとえば、回帰を使用して財務予測を取得したり、ニューラルネットワークアルゴリズムを使用して予測に影響を及ぼす因子を分析したりできます。

タスク別アルゴリズムの選択

特定のタスクで使用するアルゴリズムの選択の参考として、各アルゴリズムが長年使用されてきたタスクを次の表に示します。

タスクの例	使用する Microsoft アルゴリズム
不連続属性の予測: 見込み客リスト内の顧客について、見込みがあるかないかをフラグで示します。あるサーバーに半年以内に障害が発生する確率を計算します。患者の転帰を分類し、関連因子を探ります。	Microsoft デシジョンツリーアルゴリズム Microsoft Naive Bayes アルゴリズム Microsoft クラスタリングアルゴリズム Microsoft ニューラルネットワークアルゴリズム
連続属性の予測: 翌年の売上を予測します。過去の歴史的、季節的傾向を考慮に入れて、来場者を予測します。人口統計を考慮に入れて、リスクスコアを生成します。	Microsoft デシジョンツリーアルゴリズム Microsoft Time Series アルゴリズム Microsoft 線形回帰アルゴリズム
シーケンスの予測: ある企業の Web サイトのクリックストリーム分析を実行します。サーバーの障害につながる要因を分析します。外来患者の来院中の一連の行動を把握し分析して、共通する行動に関するベストプラクティスを組み立てます。	Microsoft シーケンスクラスタリングアルゴリズム
トランザクション内の共通アイテムのグループの検出: マーケットバスケット分析を使用して、製品の配置を決定します。ある顧客に追加購入を勧める製品を提案します。ある 1 件のイベントへの来場者の調査データを分析して、相関関係のある行動またはブースを特定し、今後の活動計画を立てます。	Microsoft アソシエーションアルゴリズム Microsoft デシジョンツリーアルゴリズム
類似アイテムのグループの検出: 人口統計や行動などの属性に基づいて、患者リスクプロファイルグループを作成します。ユーザーを閲覧パターンと購買パターンで分析します。同じような使用状況特性を持つサーバーを特定します。	Microsoft クラスタリングアルゴリズム Microsoft シーケンスクラスタリングアルゴリズム

次のセクションでは、SQL Server データマイニングで提供される各データマイニングアルゴリズムの学習リソースへのリンクを示します。

基本的なアルゴリズムの説明: アルゴリズムの機能とそのしくみについて説明し、アルゴリズムが役立つ可能性のあるビジネスシナリオの概要を示します。
テクニカルリファレンス: アルゴリズムの実装に関する技術的な詳細と、必要に応じて学術的な参照を提供します。アルゴリズムの動作を制御したり、モデルの結果をカスタマイズしたりするために設定できるパラメーターを列挙します。データ要件について説明し、可能であればパフォーマンスのヒントを提供します。
モデルコンテンツ: 各種類のデータマイニングモデル内で情報がどのように構造化されるかについて説明し、各ノードに格納されている情報を解釈する方法について説明します。
データマイニングクエリ: モデルの種類ごとに使用できる複数のクエリを提供します。たとえば、モデル内のパターンをさらに理解できるようにするコンテンツクエリや、それらのパターンに基づいて予測できるよう支援する予測クエリなどがあります。

トピック	説明
あるデータマイニングモデルで使用されるアルゴリズムを判断します。	マイニングモデルの作成に使用されたパラメーターのクエリ
カスタムプラグインアルゴリズムを作成します。	プラグインアルゴリズム
アルゴリズム固有のビューアーを使用して、モデルを調査します。	データマイニングモデルビューアー
汎用のテーブルフォーマットを使用して、モデルのコンテンツを表示します。	Microsoft 汎用コンテンツツリービューアーを使用したモデルの参照
データをセットアップし、アルゴリズムを使用してモデルを作成する方法について学びます。	マイニング構造 (Analysis Services - データマイニング) マイニングモデル (Analysis Services - データマイニング)

参照

データマイニングツール

データマイニングアルゴリズム (Analysis Services - データマイニング)

適切なアルゴリズムの選択

種類別アルゴリズムの選択

タスク別アルゴリズムの選択

参照

フィードバック

フィードバック

その他のリソース

データ マイニング アルゴリズム (Analysis Services - データ マイニング)

適切なアルゴリズムの選択

種類別アルゴリズムの選択

タスク別アルゴリズムの選択

関連コンテンツ

Related Tasks

参照

フィードバック

フィードバック

その他のリソース

データマイニングアルゴリズム (Analysis Services - データマイニング)