Składnik: Przypisywanie danych do klastrów

W tym artykule opisano sposób używania składnika Przypisywanie danych do klastrów w projektancie usługi Azure Machine Learning. Składnik generuje przewidywania za pomocą modelu klastrowania, który został wytrenowany za pomocą algorytmu klastrowania metodą K-średnich .

Składnik Przypisywanie danych do klastrów zwraca zestaw danych zawierający prawdopodobne przypisania dla każdego nowego punktu danych.

Jak używać funkcji Przypisywanie danych do klastrów

  1. W projektancie usługi Azure Machine Learning znajdź wcześniej wytrenowany model klastrowania. Model klastrowania można utworzyć i wytrenować przy użyciu jednej z następujących metod:

    • Skonfiguruj algorytm klastrowania metodą K-średnich przy użyciu składnika klastrowania metodą K-Średnich i wytrenuj model przy użyciu zestawu danych i składnika Train Clustering Model (Trenowanie modelu klastrowania) (w tym artykule).

    • Możesz również dodać istniejący wytrenowany model klastrowania z grupy Zapisane modele w obszarze roboczym.

  2. Dołącz wytrenowany model do lewego portu wejściowego przypisywania danych do klastrów.

  3. Dołącz nowy zestaw danych jako dane wejściowe.

    W tym zestawie danych etykiety są opcjonalne. Ogólnie rzecz biorąc, klastrowanie to metoda uczenia bez nadzoru. Nie oczekuje się wcześniejszego poznania kategorii. Jednak kolumny wejściowe muszą być takie same jak kolumny używane podczas trenowania modelu klastrowania lub występuje błąd.

    Porada

    Aby zmniejszyć liczbę kolumn zapisywanych w projektancie z przewidywań klastra, użyj pozycji Wybierz kolumny w zestawie danych i wybierz podzbiór kolumn.

  4. Pozostaw zaznaczone pole wyboru Sprawdź, czy chcesz , aby wyniki zawierały pełny wejściowy zestaw danych, w tym kolumnę, która wyświetla wyniki (przypisania klastra).

    Jeśli to pole wyboru zostanie wyczyszczone, zostaną zwrócone tylko wyniki. Ta opcja może być przydatna podczas tworzenia przewidywań w ramach usługi internetowej.

  5. Prześlij potok.

Wyniki

  • Aby wyświetlić wartości w zestawie danych, kliknij prawym przyciskiem myszy składnik, a następnie wybierz polecenie Visualize (Wizualizacja). Możesz też wybrać składnik i przejść do karty Dane wyjściowe w prawym panelu, kliknij ikonę histogramu w danych wyjściowych portów , aby zwizualizować wynik.