Adatok hozzárendelése fürtökhöz

Fontos

A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.

2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.

A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.

Adatok hozzárendelése fürtökhöz meglévő betanított fürtözési modell használatával

Kategória: Pontszám

Megjegyzés

A következőkre vonatkozik: Machine Learning Studio (klasszikus)

Hasonló húzással használható modulok érhetők el Azure Machine Learning tervezőben.

A modul áttekintése

Ez a cikk azt ismerteti, hogyan használható az Adatok hozzárendelése fürtökhöz modul a Machine Learning Studio (klasszikus) eszközben előrejelzések létrehozásához a K-means fürtözési algoritmussal betanított fürtözési modellel.

A modul egy adatkészletet ad vissza, amely tartalmazza az egyes új adatpont valószínű hozzárendelését. Emellett létrehoz egy PCA-gráfot (Fő összetevő elemzése) is, amely segít a fürtök dimenziójának megjelenítésében.

Figyelmeztetés

Ez a modul felváltja a Hozzárendelés fürtökhöz (elavult) modult, amely csak a régebbi kísérletek támogatásához érhető el.

Adatok hozzárendelése fürtökhöz

  1. A Machine Learning Studióban (klasszikus) keresse meg a korábban betanított fürtözési modellt. A következő módszerek bármelyikével létrehozhat és betaníthat egy fürtözési modellt:

    Meglévő betanított csoportosítási modellt is hozzáadhat a munkaterület Mentett modellek csoportjából.

  2. Csatolja a betanított modellt az Adatok hozzárendelése fürtökhöz bal oldali bemeneti portjához.

  3. Új adatkészlet csatolása bemenetként. Ebben az adatkészletben a címkék használata nem kötelező. A fürtözés általában nem felügyelet nélküli tanulási módszer, ezért nem várható, hogy előre ismerni fogja a kategóriákat.

    A bemeneti oszlopoknak ugyanakkorának kell lennie, mint a fürtözési modell betanítása során használt oszlopoknak, különben hiba történik.

    Tipp

    A fürt-előrejelzésekből származó oszlopok számának csökkentéséhez használja az Adathalmaz oszlopainak kijelölése lehetőséget, és jelölje ki az oszlopok egy részhalmazát.

  4. Ha azt szeretné, hogy az eredmények tartalmazzák a teljes bemeneti adathalmazt, hagyja bejelölve az Ellenőrzés a Hozzáfűzés és a Csak eredmény jelölőnégyzet jelölését, valamint az eredményeket (fürt-hozzárendeléseket) jelző oszlopot.

    Ha nem választja ki ezt a beállítást, csak az eredményeket kap vissza. Ez hasznos lehet, ha egy webszolgáltatás részeként hoz létre előrejelzéseket.

  5. Futtassa a kísérletet.

Results (Eredmények)

Az Adatok hozzárendelése fürtökhöz modul két típusú eredményt ad vissza az Eredmény adathalmaz kimenetében :

  • A fürtök modellben való elkülönítésének megjelenítéséhez kattintson a modul kimenetére, és válassza a Képi megjelenítés lehetőséget

    Ez a parancs egy fő összetevő-elemzési (PCA) gráfot jelenít meg, amely leképezi az egyes fürtök értékeinek gyűjteményét két összetevő tengelyre.

    • Az első összetevő tengelye a modell legnagyobb varianciát rögzítő jellemzők kombinált készlete. A rendszer az x tengelyen ábrázolja (1. fő összetevő).
    • A következő összetevő tengelye néhány olyan jellemzőt ábrázol, amely az első összetevővel össze van állítva, és amely a következő legtöbb információt hozzáadja a diagramhoz. A rendszer az y tengelyen (a 2. fő összetevő) ábrázolja.

    A diagramon látható a fürtök elkülönítése, valamint a fürtök eloszlása a fő összetevőket képviselő tengelyek mentén.

  • A bemeneti adatokban található egyes esetekkel kapcsolatos eredmények táblázatának megtekintéséhez csatolja a Convert to Dataset (Konvertálás adatkészlethez) modult, és vizualizálja az eredményeket a Studióban (klasszikus).

    Ez az adatkészlet tartalmazza az egyes esetekben a fürtök hozzárendelését, valamint egy távolsági metrikát, amely jelzi, hogy milyen közel van ez az eset a fürt közepéhez.

    Kimeneti oszlop neve Description
    Hozzárendelések Egy 0-alapú index, amely azt jelzi, hogy az adatpont melyik fürthöz lett hozzárendelve.
    DistancesToClusterCenter nem. n. Ez az érték minden adatpontnál jelzi az adatpont és a hozzárendelt fürt közepétől való távolságot, valamint a többi fürttől való távolságot.

    A távolság kiszámításához használt metrika a K-means fürtözési modell konfigurálásakor lesz meghatározva.

Várt bemenetek

Név Típus Description
Betanított modell ICluster interfész Betanított fürtözési modell
Adathalmaz Adattábla Bemeneti adatforrás

Modulparaméterek

Név Típus Tartomány Választható Alapértelmezett Description
Csak hozzáfűzés vagy eredmény Kötelező IGAZ Jelezze, hogy a kimeneti adatkészletnek tartalmaznia kell-e a bemeneti adatkészletet és az eredményeket, vagy csak az eredményeket
Paraméteres lekérdezési mód megadása Siklott módszerek Lista:Teljes rács| Véletlenszerű sikl Kötelező Véletlenszerű sikl Teljes rács átfutása a paraméterterületen, vagy siklás korlátozott számú mintafutat használatával

Kimenetek

Név Típus Description
Eredményadatkészlet Adattábla Bemeneti adatkészlet csak hozzárendelések vagy hozzárendelések oszlopának adatoszlopa által hozzáfűzve

Kivételek

Kivétel Description
0003-as hiba Kivétel akkor fordul elő, ha egy vagy több bemenet null vagy üres.

Lásd még

K-közép csoportosítás
Pontszám