モデルのパフォーマンスと公平性

[アーティクル]
2024/09/30

この記事では、Azure Machine Learning におけるモデルのパフォーマンスと公平性を理解するために使用できる方法について説明します。

機械学習の公平性とは

人工知能および機械学習システムでは、不公平な動作が示されることがあります。不公平な動作を定義する方法の 1 つに、それによる人への危害や影響があります。 AI システムは、さまざまな種類の危害を発生させる可能性があります。詳細については、Kate Crawford による NeurIPS 2017 基調講演に関するページを参照してください。

AI によって発生する 2 つの一般的な種類の危害を次に示します。

割り当ての害: AI システムによって、特定のグループの機会、リソース、または情報が増減されます。たとえば、雇用、入学許可、融資などで、特定のグループの人が、他のグループより、適切な候補としてモデルで選択されやすくなる場合があります。
サービス品質の害: AI システムによる対応のよさが、ユーザーのグループによって異なります。たとえば、音声認識システムでは、女性に対する対応が男性より悪くなる場合があります。

AI システムの不公平な動作を減らすには、これらの害を評価し、軽減する必要があります。責任ある AI ダッシュボードの "モデルの概要" コンポーネントは、データセット全体、および識別されたデータのコーホートに対してモデルパフォーマンスメトリックを生成することで、モデルライフサイクルの識別段階に貢献します。センシティブ特徴またはセンシティブ属性の観点から識別されたサブグループ全体に対して、これらのメトリックが生成されます。

注意

公平性は、社会技術に関する課題です。定量的な公平性のメトリックでは、正当性や適正手続きなど、公平性の多くの側面がキャプチャされません。また、多くの定量的な公平性のメトリックをすべて同時に満たすことはできません。

Fairlearn オープンソースパッケージの目的は、人間が影響と軽減策を評価できるようにすることです。最終的には、AI モデルと機械学習モデルを構築する人間が、シナリオに適した妥協点を見つけることになります。

この責任ある AI ダッシュボードのコンポーネントでは、公平性は、"グループ公平性" と呼ばれるアプローチによって概念化されます。このアプローチでは、"損害が発生するリスクがあるのはどのグループか" と質問されます。"センシティブ特徴" という用語は、グループの公平性を評価するときに、システムデザイナーがこれらの特徴に敏感でなければならないことを示しています。

評価段階では、公平性は "不均衡メトリック" によって定量化されます。これらのメトリックでは、比率または相違として、グループ間のモデルの動作を評価および比較できます。責任ある AI ダッシュボードでは、2 つのクラスの不均衡メトリックがサポートされています。

モデルのパフォーマンスにおける不均衡: これらのメトリックのセットでは、データのサブグループ間での、選択されたパフォーマンスメトリックの値の不均衡 (差異) が計算されます。次に例をいくつか示します。
- 正解率の不均衡
- エラー率の不均衡
- 精度の不均衡
- リコールの不均衡
- 平均絶対誤差 (MAE) の不均衡
選択率における不均衡: このメトリックには、サブグループ間での選択率 (好意的な予測) の差が含まれます。この例としては、ローン承認率の不均衡があります。選択率とは、各クラスで 1 として分類されるデータポイントの割合 (二項分類)、または予測値の分散 (回帰) を意味します。

このコンポーネントの公平性評価機能は、Fairlearn パッケージから取得されます。 Fairlearn は、モデルの公平性評価メトリックと不公平軽減アルゴリズムのコレクションを提供します。

注意

公平性の評価は純粋に技術的な行為ではありません。 Fairlearn オープンソースパッケージはモデルの公平性を評価するのに役立つ定量的なメトリックを特定できますが、ユーザーの代わりに評価を実行しません。独自のモデルの公平性を評価するには、定性分析を実行する必要があります。前述のセンシティブ特徴は、このような定性分析の一例です。

不公平性を軽減するための不均衡の制約

モデルの公平性に関する問題を理解したら、Fairlearn オープンソースパッケージの軽減アルゴリズムを使用して、これらの問題を軽減できます。これらのアルゴリズムでは、不均衡の制約または条件と呼ばれる、予測の動作に対する一連の制約がサポートされています。

不均衡の制約では、予測動作の一部の側面が、センシティブ特徴で定義されるグループ (異なる人種など) の間で同等であることが要求されます。 Fairlearn オープンソースパッケージの軽減アルゴリズムでは、このような不均衡の制約を使用して、監視対象の公平性の問題が軽減されます。

注意

Fairlearn オープンソースパッケージの不公平性の軽減アルゴリズムでは、機械学習モデルの不公平性を削減するための推奨される軽減策を提供できますが、これらの対策は不公平性を排除するものではありません。開発者は、機械学習モデルの他の不均衡の制約または条件を考慮する必要がある場合があります。 Azure Machine Learning を使用する開発者は、その軽減策によって、対象となる機械学習モデルの使用およびデプロイでの不公平性が十分に削減されるかどうかを自分で判断する必要があります。

Fairlearn パッケージでは、次の種類の不均衡の制約がサポートされています。

不均衡の制約	目的	機械学習タスク
人口統計の不均衡	割り当ての害を軽減する	二項分類、回帰
均等な確率	割り当てとサービス品質の害を診断する	二項分類
機会均等	割り当てとサービス品質の害を診断する	二項分類
境界グループの損失	サービス品質の害を軽減する	回帰

軽減アルゴリズム

Fairlearn オープンソースパッケージには、2 種類の不公平性軽減アルゴリズムが含まれています。

削減: これらのアルゴリズムでは、標準のブラックボックス機械学習推定器 (LightGBM モデルなど) が利用され、一連の再重み付けされたトレーニングデータセットを使用して、再トレーニングされたモデルのセットが生成されます。

たとえば、特定の性別の応募者について、重みを加減してモデルが再トレーニングされ、性別グループ間での格差が削減されます。その後、ユーザーはビジネスルールとコストの計算に基づいて、精度 (または他のパフォーマンスメトリック) と不均衡の間で最適なトレードオフを提供するモデルを選択できます。
後処理: これらのアルゴリズムは、既存の分類子と微妙な特徴を入力として受け取ります。その後、分類子の予測の変換を導出して、指定された公平性の制約を適用します。後処理アルゴリズムの 1 つである、しきい値の最適化の最大の利点は、モデルを再トレーニングする必要がないことによる、シンプルさと柔軟性です。

アルゴリズム	説明	機械学習タスク	微妙な特徴	サポートされる不均衡の制約	アルゴリズムの種類
`ExponentiatedGradient`	「公平な分類のための削減アプローチ」で説明されている公平な分類のためのブラックボックスアプローチ。	二項分類	Categorical	人口統計の不均衡、均等な確率	削減
`GridSearch`	「公平な分類のための削減アプローチ」で説明されているブラックボックスアプローチ。	二項分類	Binary	人口統計の不均衡、均等な確率	削減
`GridSearch`	境界グループの損失に対するアルゴリズムを使用する公正回帰のグリッド検索バリエーションを実装するブラックボックスアプローチ (「公正回帰: 定量的な定義と削減に基づくアルゴリズム」)。	回帰	Binary	境界グループの損失	削減
`ThresholdOptimizer`	ホワイトペーパー「教師あり学習での機会の均等性」に基づく後処理アルゴリズム。この手法は、既存の分類子と機密センシティブ特徴を入力として受け取ります。その後、指定された不均衡の制約を適用するために、分類子の予測の単調な変換を導出します。	二項分類	Categorical	人口統計の不均衡、均等な確率	後処理

次のステップ

CLI と SDK または Azure Machine Learning スタジオ UI を使用して責任ある AI ダッシュボードを生成する方法について学習します。
サポートされているモデルの概要と、責任ある AI ダッシュボードの公平性評価の視覚化について説明します。
責任ある AI ダッシュボードで観察された分析情報に基づいて責任ある AI スコアカードを生成する方法について説明します。
Fairlearn の GitHub リポジトリ、ユーザーガイド、例、およびサンプルノートブックを確認して、コンポーネントの使用方法を学習します。

その他のリソース

ドキュメント

データセットを理解する - Azure Machine Learning

探索的データ分析を実行し、責任ある AI ダッシュボードのデータ分析を使用して特徴量の偏りと不均衡を把握します。
モデルの解釈可能性 - Azure Machine Learning

Azure Machine Learning CLI と Python SDK を使用したトレーニングと推論の際に機械学習モデルによってどのように予測が行われるのかについて説明します。
データドリブンポリシーを作成し、意思決定に影響を与える - Azure Machine Learning

責任ある AI ダッシュボードに因果分析ツール EconML を統合することによって、データドリブンの意思決定とポリシー作成を行います。
機械学習モデルでエラーを評価する - Azure Machine Learning

責任ある AI ダッシュボードのエラー分析の統合を使用して、データセットのさまざまなコーホート内のモデルエラー分布を評価します。
Azure Machine Learning の責任ある AI ダッシュボードを使用して AI システムを評価し、データドリブンの意思決定を行う - Azure Machine Learning

責任ある AI ダッシュボードで包括的な UI と SDK/YAML コンポーネントを使用して、機械学習モデルをデバッグし、データドリブンの意思決定を行う方法について説明します。
Azure Machine Learning で責任ある AI のスコアカード (プレビュー) を使用する - Azure Machine Learning

PDF の責任ある AI のスコアカードを Azure Machine Learning からエクスポートすることで、技術面以外のビジネス関係者と分析情報を共有します。
Azure Machine Learning スタジオで責任ある AI ダッシュボードを使用する - Azure Machine Learning

Azure Machine Learning のResponsible AI ダッシュボードでさまざまなツールと視覚化グラフを使用する方法について説明します。
スタジオ UI で責任ある AI 分析情報を生成する - Azure Machine Learning

Azure Machine Learning スタジオの UI のコードなしのエクスペリエンスで責任ある AI 分析情報を生成する方法について説明します。

トレーニング

モジュール

学習環境に責任ある AI の原則を適用する - Training

倫理的な AI に対する Microsoft の取り組みを理解します。学習環境に特化して、公平性、信頼性と安全性、プライバシーとセキュリティ、透明性、包括性、説明責任など、責任ある AI の原則について学習します。 AI の開発と使用の将来を導き、形成するために設計された原則。

認定資格

Microsoft Certified: Azure Data Scientist Associate - Certifications

Python、Azure Machine Learning、MLflow を使用して、データのインジェストと準備、モデルのトレーニングとデプロイ、機械学習ソリューションの監視を管理します。

次の方法で共有