マイニングモデルのフィルター選択 (Analysis Services - データマイニング)

[アーティクル]
10/31/2023

適用対象:SQL Server 2019 以前の Analysis Services Azure Analysis Services Fabric/Power BI Premium

重要

データマイニングは SQL Server 2017 Analysis Services で非推奨となり、SQL Server 2022 Analysis Services で停止されました。非推奨および停止された機能については、ドキュメントの更新は行われません。詳細については、「Analysis Services 下位互換性」を参照してください。

データに基づくモデルフィルターは、マイニング構造内のデータのサブセットを使用するマイニングモデルを作成するのに役立ちます。フィルターを使用すると、包括的なデータソースビューに基づいて 1 つのマイニング構造を作成できるため、マイニング構造とデータソースを柔軟に設計できます。つまり、さまざまなモデルのトレーニングとテストを行う場合に、データの各サブセットに対して個別の構造と関連モデルを作成する代わりに、データの一部だけを使用するためのフィルターを作成することができます。

たとえば、Customers テーブルと関連テーブルに、データソースビューを定義します。次に、必要とするすべてのフィールドを含むマイニング構造を 1 つ定義します。最後に、Region などの特定の顧客属性に基づいてフィルター処理されるモデルを作成します。その後、このモデルをコピーし、フィルター条件を変更するだけで、別の地域に基づく新しいモデルを生成できます。

この機能が役立つ実際的なシナリオには、次のような場合があります。

性別や地域など、複数の不連続値に対して個別のモデルを作成する場合。たとえば、衣料品店では、1 つのデータソースにすべての顧客の売上データが含まれていても、顧客の統計区分を使用して性別に基づく個別のモデルを作成できます。
20 ～ 30 才、20 ～ 40 才、20 ～ 25 才など、同じデータの複数のグループ分けを作成およびテストして、モデルを試す場合。
特定の品目を 2 個以上購入した顧客のケースのみをモデルに含めるようにするなど、入れ子になったテーブルの内容に複雑なフィルターを指定する場合。

ここでは、マイニングモデルのフィルターを作成、使用、および管理する方法について説明します。

モデルフィルターの作成

フィルターは、次の方法で作成および適用できます。

データマイニングデザイナーの [マイニングモデル] タブで、フィルターエディターのダイアログボックスを利用して条件を作成します。
マイニングモデルの Filter プロパティにフィルター式を直接入力します。
AMO を使用して、モデルのフィルター条件をプログラムによって設定します。

データマイニングデザイナーによるモデルフィルターの作成

データマイニングデザイナーでは、マイニングモデルの Filter プロパティを変更することによってモデルをフィルター処理します。 [プロパティ] ペインにフィルター式を直接入力することも、フィルターのダイアログボックスを開いて条件を作成することもできます。

フィルターのダイアログボックスは 2 つあります。最初のダイアログボックスでは、ケーステーブルに適用する条件を作成できます。データソースに複数のテーブルが含まれる場合は、まずテーブルを選択してから列を選択し、その列に適用する演算子と条件を指定します。 AND/OR 演算子を使用して、複数の条件をリンクできます。値の定義に使用できる演算子は、列に含まれている値が不連続値か連続値かによって異なります。たとえば、連続値には、 greater than 演算子および less than 演算子を使用できます。一方、不連続値に対しては、 = (等しい)演算子、 != (等しくない)演算子、および is null 演算子のみを使用できます。

注意

LIKE キーワードはサポートされません。複数の不連続属性を含める場合は、個々の条件を作成し、それらを OR 演算子で結合する必要があります。

条件が複雑な場合、2 番目のフィルターダイアログボックスを使用して、一度に 1 つのテーブルを処理するように設定できます。 2 番目のフィルターダイアログボックスを閉じると、式が評価された後、ケーステーブルの他の列で設定されたフィルター条件と結合されます。

入れ子になったテーブルに対するフィルターの作成

入れ子になったテーブルがデータソースビューに含まれている場合は、2 番目のフィルターダイアログボックスを使用して、入れ子になったテーブル内の行に対する条件を作成できます。

たとえば、顧客に関連したケーステーブルがあり、入れ子になったテーブルに顧客が購入した製品が表示されている場合、入れ子になったテーブルのフィルターで [ProductName]='Water Bottle' OR ProductName='Water Bottle Cage'という構文を使用すると、特定の品目を購入した顧客を選択するフィルターを作成できます。

また、 EXISTS または NOT EXISTS のキーワードとサブクエリを使用すると、入れ子になったテーブルに特定の値があるかどうかに基づいてフィルター処理を行うことができます。これにより、 EXISTS (SELECT * FROM Products WHERE ProductName='Water Bottle')のような条件を作成できます。入れ子になったテーブルに値 EXISTS SELECT(<subquery>) を持つ行が 1 つ以上含まれている場合、から true Water Bottleが返されます。

ケーステーブルに対する条件と入れ子になったテーブルに対する条件は、結合することができます。たとえば、次の構文には、ケーステーブルに対する条件 (Age > 30 )、入れ子になったテーブルに対するサブクエリ (EXISTS (SELECT * FROM Products))、および入れ子になったテーブルに対する複数の条件 (WHERE ProductName='Milk' AND Quantity>2) が含まれています。

(Age > 30 AND EXISTS (SELECT * FROM Products WHERE ProductName='Milk'  AND Quantity>2) )

フィルターの構築が完了すると、フィルターテキストはSQL Server Analysis Servicesによって評価され、DMX 式に変換され、モデルと共に保存されます。

SQL Server Data Toolsでフィルターダイアログボックスを使用する方法については、「マイニングモデルにフィルターを適用する」を参照してください。

マイニングモデルのフィルターの管理

データに基づくモデルフィルターを使用すると、同一の構造に基づく複数のモデルを簡単に作成できるため、マイニング構造とマイニングモデルの管理作業が大幅に簡素化されます。既存のマイニングモデルをすばやくコピーして、フィルター条件だけを変更することもできます。ただし、フィルターは混乱を招くこともあります。

ここでは、マイニングモデルに対するフィルターを管理し解釈する方法について、よくされる質問とその回答を示します。

フィルターが使用されているかどうか確認する方法は?

フィルターがモデルに適用されているかどうか判断する方法はいくつかあります。

デザイナーで、 [マイニングモデル] タブをクリックし、 [プロパティ]を開いて、マイニングモデルの Filter プロパティを確認します。
DMV (DMSCHEMA_MINING_MODELS) はフィルターのテキストを含む列を出力します。 DMV に対して次のクエリを使用して、モデルとフィルターの名前を返すことができます。
```
SELECT MODEL_NAME, [FILTER]   
FROM $SYSTEM.DMSCHEMA_MINING_MODELS  
```
AMO で MiningModel オブジェクトの Filter プロパティの値を取得するか、XMLA で Filter 要素を検査することができます。

フィルターの内容を反映するように、モデルの名前付け規則を決めることもできます。こうすると、関連する複数のモデルどうしを区別しやすくなります。

フィルターを保存する方法は?

フィルター式はスクリプトとして保存され、関連付けられたマイニングモデルまたは入れ子になったテーブルと共に格納されます。フィルターテキストを削除した場合、復元するにはフィルター式を手動で再作成するしかありません。このため、複雑なフィルター式を作成する場合は、フィルターテキストのバックアップコピーを作成することをお勧めします。

フィルターから効果が表示されないのはなぜですか?

フィルター式の変更や追加を行った場合、フィルターの効果を確認するには、構造およびモデルを再処理する必要があります。

フィルター選択された属性が予測クエリの結果に表示されるのはなぜですか?

フィルターをモデルに適用すると、フィルターはモデルをトレーニングする際に使用するケースの選択にのみ影響します。フィルターはモデルにとって既知の属性には影響しません。また、データソースに存在するデータを変更したり抑制することもありません。その結果、モデルに対するクエリは、その他の種類のケースに関する予測を返すことができ、モデルで使用される値のドロップダウンリストには、フィルターによって除外された属性値が表示されます。

たとえば、20 ～ 30 歳の女性が関係するケースだけを使用して [Bike Buyer] モデルをトレーニングするとします。その場合でも、自転車を購入する男性の確率を予測する予測クエリを実行したり、年齢が 30 ～ 40 歳の女性の結果を予測することができます。これは、データソースに存在する属性と値は理論的に可能な項目を定義し、ケースはトレーニングに使用される実際に発生した項目を定義するためです。ただし、トレーニングデータにターゲット値を持つケースが含まれないため、このクエリは非常に小さな確率を返します。

モデルの属性値を完全に隠すか匿名化する必要がある場合は、さまざまな選択肢があります。

入力されるデータに、データソースビューまたはリレーショナルデータソースの定義の一部としてフィルターを適用します。
属性値をマスクまたはエンコードします。
除外された値をマイニング構造定義の一部としてカテゴリに折りたたみます。

フィルター構文の詳細とフィルター式の例については、「モデルフィルターの構文と例 (Analysis Services - データマイニング)」を参照してください。

マイニングモデルのテスト時にモデルフィルターを使用する方法については、「精度チャートの種類の選択とグラフのオプションの設定」を参照してください。

参照

モデルフィルターの構文と例 (Analysis Services - データマイニング)
テストおよび検証 (データマイニング)

マイニングモデルのフィルター選択 (Analysis Services - データマイニング)

モデルフィルターの作成

データマイニングデザイナーによるモデルフィルターの作成

入れ子になったテーブルに対するフィルターの作成

マイニングモデルのフィルターの管理

フィルターが使用されているかどうか確認する方法は?

フィルターを保存する方法は?

フィルターから効果が表示されないのはなぜですか?

フィルター選択された属性が予測クエリの結果に表示されるのはなぜですか?

参照

フィードバック

フィードバック

その他のリソース

マイニング モデルのフィルター選択 (Analysis Services - データ マイニング)

モデル フィルターの作成

データ マイニング デザイナーによるモデル フィルターの作成

入れ子になったテーブルに対するフィルターの作成

マイニング モデルのフィルターの管理

フィルターが使用されているかどうか確認する方法は?

フィルターを保存する方法は?

フィルターから効果が表示されないのはなぜですか?

フィルター選択された属性が予測クエリの結果に表示されるのはなぜですか?

関連リソース

参照

フィードバック

フィードバック

その他のリソース

マイニングモデルのフィルター選択 (Analysis Services - データマイニング)

モデルフィルターの作成

データマイニングデザイナーによるモデルフィルターの作成

マイニングモデルのフィルターの管理