Adatok hozzárendelése fürtökhöz
Fontos
A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.
2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.
- További információ a gépi tanulási projektek a ML Studióból a klasszikusból a Azure Machine Learning.
- További információ a Azure Machine Learning.
A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.
Adatok hozzárendelése fürtökhöz meglévő betanított fürtözési modell használatával
Kategória: Pontszám
Megjegyzés
A következőkre vonatkozik: Machine Learning Studio (klasszikus)
Hasonló húzással használható modulok érhetők el Azure Machine Learning tervezőben.
A modul áttekintése
Ez a cikk azt ismerteti, hogyan használható az Adatok hozzárendelése fürtökhöz modul a Machine Learning Studio (klasszikus) eszközben előrejelzések létrehozásához a K-means fürtözési algoritmussal betanított fürtözési modellel.
A modul egy adatkészletet ad vissza, amely tartalmazza az egyes új adatpont valószínű hozzárendelését. Emellett létrehoz egy PCA-gráfot (Fő összetevő elemzése) is, amely segít a fürtök dimenziójának megjelenítésében.
Figyelmeztetés
Ez a modul felváltja a Hozzárendelés fürtökhöz (elavult) modult, amely csak a régebbi kísérletek támogatásához érhető el.
Adatok hozzárendelése fürtökhöz
A Machine Learning Studióban (klasszikus) keresse meg a korábban betanított fürtözési modellt. A következő módszerek bármelyikével létrehozhat és betaníthat egy fürtözési modellt:
Konfigurálja a K-means algoritmust a K-means fürtözés modullal, majd betanítsa a modellt egy adatkészlet és a Fürtözési modell betanítása modul használatával.
Konfigurálja a K-means algoritmus számos beállítását a K-means fürtözés használatával, majd a Modell betanítása a Fürtözéses fürtszolgáltatás modullal .
Meglévő betanított csoportosítási modellt is hozzáadhat a munkaterület Mentett modellek csoportjából.
Csatolja a betanított modellt az Adatok hozzárendelése fürtökhöz bal oldali bemeneti portjához.
Új adatkészlet csatolása bemenetként. Ebben az adatkészletben a címkék használata nem kötelező. A fürtözés általában nem felügyelet nélküli tanulási módszer, ezért nem várható, hogy előre ismerni fogja a kategóriákat.
A bemeneti oszlopoknak ugyanakkorának kell lennie, mint a fürtözési modell betanítása során használt oszlopoknak, különben hiba történik.
Tipp
A fürt-előrejelzésekből származó oszlopok számának csökkentéséhez használja az Adathalmaz oszlopainak kijelölése lehetőséget, és jelölje ki az oszlopok egy részhalmazát.
Ha azt szeretné, hogy az eredmények tartalmazzák a teljes bemeneti adathalmazt, hagyja bejelölve az Ellenőrzés a Hozzáfűzés és a Csak eredmény jelölőnégyzet jelölését, valamint az eredményeket (fürt-hozzárendeléseket) jelző oszlopot.
Ha nem választja ki ezt a beállítást, csak az eredményeket kap vissza. Ez hasznos lehet, ha egy webszolgáltatás részeként hoz létre előrejelzéseket.
Futtassa a kísérletet.
Results (Eredmények)
Az Adatok hozzárendelése fürtökhöz modul két típusú eredményt ad vissza az Eredmény adathalmaz kimenetében :
A fürtök modellben való elkülönítésének megjelenítéséhez kattintson a modul kimenetére, és válassza a Képi megjelenítés lehetőséget
Ez a parancs egy fő összetevő-elemzési (PCA) gráfot jelenít meg, amely leképezi az egyes fürtök értékeinek gyűjteményét két összetevő tengelyre.
- Az első összetevő tengelye a modell legnagyobb varianciát rögzítő jellemzők kombinált készlete. A rendszer az x tengelyen ábrázolja (1. fő összetevő).
- A következő összetevő tengelye néhány olyan jellemzőt ábrázol, amely az első összetevővel össze van állítva, és amely a következő legtöbb információt hozzáadja a diagramhoz. A rendszer az y tengelyen (a 2. fő összetevő) ábrázolja.
A diagramon látható a fürtök elkülönítése, valamint a fürtök eloszlása a fő összetevőket képviselő tengelyek mentén.
A bemeneti adatokban található egyes esetekkel kapcsolatos eredmények táblázatának megtekintéséhez csatolja a Convert to Dataset (Konvertálás adatkészlethez) modult, és vizualizálja az eredményeket a Studióban (klasszikus).
Ez az adatkészlet tartalmazza az egyes esetekben a fürtök hozzárendelését, valamint egy távolsági metrikát, amely jelzi, hogy milyen közel van ez az eset a fürt közepéhez.
Kimeneti oszlop neve Description Hozzárendelések Egy 0-alapú index, amely azt jelzi, hogy az adatpont melyik fürthöz lett hozzárendelve. DistancesToClusterCenter nem. n. Ez az érték minden adatpontnál jelzi az adatpont és a hozzárendelt fürt közepétől való távolságot, valamint a többi fürttől való távolságot.
A távolság kiszámításához használt metrika a K-means fürtözési modell konfigurálásakor lesz meghatározva.
Várt bemenetek
Név | Típus | Description |
---|---|---|
Betanított modell | ICluster interfész | Betanított fürtözési modell |
Adathalmaz | Adattábla | Bemeneti adatforrás |
Modulparaméterek
Név | Típus | Tartomány | Választható | Alapértelmezett | Description |
---|---|---|---|---|---|
Csak hozzáfűzés vagy eredmény | Kötelező | IGAZ | Jelezze, hogy a kimeneti adatkészletnek tartalmaznia kell-e a bemeneti adatkészletet és az eredményeket, vagy csak az eredményeket | ||
Paraméteres lekérdezési mód megadása | Siklott módszerek | Lista:Teljes rács| Véletlenszerű sikl | Kötelező | Véletlenszerű sikl | Teljes rács átfutása a paraméterterületen, vagy siklás korlátozott számú mintafutat használatával |
Kimenetek
Név | Típus | Description |
---|---|---|
Eredményadatkészlet | Adattábla | Bemeneti adatkészlet csak hozzárendelések vagy hozzárendelések oszlopának adatoszlopa által hozzáfűzve |
Kivételek
Kivétel | Description |
---|---|
0003-as hiba | Kivétel akkor fordul elő, ha egy vagy több bemenet null vagy üres. |