Ważność funkcji permutacji

W tym artykule opisano sposób użycia składnika Ważność funkcji permutacji w projektancie Azure Machine Learning w celu obliczenia zestawu wyników ważności funkcji dla zestawu danych. Te wyniki ułatwiają określenie najlepszych funkcji do użycia w modelu.

W tym składniku wartości funkcji są losowo mieszane, jedna kolumna naraz. Wydajność modelu jest mierzona przed i po. Możesz wybrać jedną ze standardowych metryk, aby zmierzyć wydajność.

Wyniki zwracane przez składnik reprezentują zmianę wydajności wytrenowanego modelu po permutacji. Ważne funkcje są zwykle bardziej wrażliwe na proces tasowania, dlatego spowodują zwiększenie ważności wyników.

Ten artykuł zawiera omówienie funkcji permutacji, jej teoretycznej podstawy i jej aplikacji w uczeniu maszynowym: znaczenie funkcji permutacji.

Jak używać ważności funkcji permutacji

Generowanie zestawu wyników funkcji wymaga, aby masz już wytrenowany model, a także testowy zestaw danych.

  1. Dodaj składnik Ważność funkcji permutacji do potoku. Ten składnik można znaleźć w kategorii Wybór funkcji .

  2. Połączenie wytrenowanego modelu do danych wejściowych po lewej stronie. Model musi być modelem regresji lub modelem klasyfikacji.

  3. Po prawej stronie danych wejściowych połącz zestaw danych. Najlepiej wybrać ten, który różni się od zestawu danych używanego do trenowania modelu. Ten zestaw danych jest używany do oceniania na podstawie wytrenowanego modelu. Jest on również używany do oceny modelu po zmianie wartości funkcji.

  4. W polu Inicjator losowy wprowadź wartość, która ma być używana jako inicjator do losowania. W przypadku określenia wartości 0 (wartość domyślna) liczba jest generowana na podstawie zegara systemowego.

    Wartość inicjacji jest opcjonalna, ale należy podać wartość, jeśli chcesz odtworzyć w różnych uruchomieniach tego samego potoku.

  5. W obszarze Metryka do mierzenia wydajności wybierz pojedynczą metrykę do użycia podczas obliczania jakości modelu po permutacji.

    projektant Azure Machine Learning obsługuje następujące metryki w zależności od tego, czy oceniasz model klasyfikacji, czy regresji:

    • Klasyfikacja

      Dokładność, precyzja, kompletność

    • Regresja

      Precyzja, kompletność, błąd bezwzględny średniej średniej, błąd średniokwadratowy, względny błąd bezwzględny, względny błąd kwadratowy, współczynnik determinacji

    Aby uzyskać bardziej szczegółowy opis tych metryk oceny i sposób ich obliczania, zobacz Evaluate Model (Ocena modelu).

  6. Prześlij potok.

  7. Składnik generuje listę kolumn funkcji i skojarzone z nimi wyniki. Lista jest klasyfikowana w kolejności malejącej wyników.

Uwagi techniczne

Ważność funkcji permutacji działa przez losową zmianę wartości każdej kolumny funkcji, jedną kolumnę naraz. Następnie ocenia model.

Rankingi, które udostępnia składnik, często różnią się od tych, które są uzyskiwane z wyboru funkcji opartej na filtrach. Wybór funkcji opartej na filtrach oblicza wyniki przed utworzeniem modelu.

Przyczyną różnicy jest to, że ważność funkcji permutacji nie mierzy skojarzenia między funkcją a wartością docelową. Zamiast tego przechwytuje on wpływ każdej funkcji na przewidywania z modelu.

Następne kroki

Zobacz zestaw składników dostępnych do Azure Machine Learning.