Egyesítési szám átalakítása

Fontos

A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.

2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.

A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.

Szolgáltatáskészletet hoz létre a counts tábla alapján

Kategória: Tanulás számokkal

Megjegyzés

A következőkre vonatkozik: Machine Learning Studio (klasszikus)

Hasonló húzással használható modulok érhetők el Azure Machine Learning tervezőben.

A modul áttekintése

Ez a cikk azt ismerteti, hogyan kombinálható két darabszámalapú funkció a Machine Learning Studio (klasszikus) Merge Count Transform (Egyesítési szám átalakítása) modulja segítségével. Két kapcsolódó szám és funkció egyesítésével javíthatja a funkciók lefedettségét és terjesztését.

Tanulás nagy számosságú jellemzőket is tartalmaznak, különösen a nagy méretű adatkészletek számlálása. Az a képesség, hogy több adatkészletet számalapú szolgáltatáskészletekbe kombinálhat anélkül, hogy újra fel kell feldolgoznia az adathalmazokat, megkönnyíti a nagyon nagy adathalmazokkal kapcsolatos statisztikák gyűjtése és új adatkészletekre való alkalmazása. A darabszámtáblák segítségével például több terabájtnyi adatot gyűjthet. Ezeket a statisztikákat újra felhasználhatja a kis adatkészletek prediktív modelljeinek pontosságának javításához.

Két darabszámalapú funkciókészlet egyesítéséhez a funkciókat ugyanazokkal a sémával tartalmazó táblákkal kell létrehozni: azaz mindkét készletnek ugyanazt az oszlopot kell használnia, és ugyanazokkal a nevekkel és adattípusokkal kell rendelkezik.

Az Egyesítések száma átalakítás konfigurálása

  1. Az Egyesítési szám átalakítása csak akkor használható, ha létrehozott legalább egy darabszámalapú átalakítást, és ennek az átalakításnak jelen kell lennie a munkaterületen. Ha egy számalapú átalakítást mentett egy másik kísérletből, keresse meg az Átalakítások csoportot . Ha az átalakítást az aktuális kísérletben hozta létre, csatlakoztassa a következő modulok kimenetét:

  2. Adja hozzá a Merge Count Transform (Egyesítési szám átalakítása) modult a kísérlethez, és kösse össze az átalakítást minden bemenettel.

    Tipp

    A második átalakítás egy opcionális bemenet – ugyanazt az átalakítást kétszer is csatlakoztathatja, vagy semmit sem csatlakoztathat a második bemeneti porton.

  3. Ha nem szeretné, hogy a második adatkészlet az elsővel egyenlően legyen súlyozással, adjon meg egy értéket a Factor factor (Csökkenési tényező ) mezőben. A beírt érték azt jelzi, hogyan kell súlyozást beállítani a második átalakítás funkcióinak készletével.

    Az alapértelmezett 1 érték például egyenlően súlyozást állít be mindkét jellemzőkészlethez. A 0,5 érték azt jelenti, hogy a második készlet jellemzői az első készletben találhatóak súlyának felét tartalmazná.

  4. Igény szerint hozzáadhatja az Átalakítás alkalmazása modul egy példányát, és alkalmazhatja az átalakítást egy adatkészletre.

Példák

A modul használatára vonatkozó példákért tekintse meg a következő Azure AI Gallery:

  • Tanulás a Counts: Binary Classification (Darabszámok: Bináris besorolás) használatával: Bemutatja, hogyan hozhat létre funkciókat a bináris besorolási modell kategorikus értékeinek oszlopaiból a tanulási és a counts modulokkal.

  • Tanulás counts: Multiclass classification with NYC taxi data (Többosztályos besorolás NYC taxiadatokkal): Bemutatja, hogyan használható a tanulás a counts modulokkal a nyilvánosan elérhető NYC taxiadatkészleten a többosztályos besorolás végrehajtásához. A minta egy többosztályos logisztikai regressziós tanulót használ a probléma modellezése érdekében.

  • Tanulás a Counts: Binary classification with NYC taxi data (Bináris besorolás NYC taxiadatokkal): Bemutatja, hogyan használható a tanulás a counts modulokkal a nyilvánosan elérhető NYC taxiadatkészlet bináris besorolásának végrehajtásához. A minta egy kétosztályos logisztikai regressziós tanulót használ a probléma modellezése érdekében.

Várt bemenetek

Név Típus Description
Korábbi számláló-átalakítás ITransform interfész A szerkesztésre kijelölt számláló-átalakítás
Új számláló átalakítása ITransform interfész A hozzáadható számláló-átalakítás (nem kötelező)

Modulparaméterek

Név Típus Tartomány Választható Description Alapértelmezett
Az elhalmzó tényező Float Kötelező 1.0f A számlálási transzformációval megszorozni a jobb bemeneti porton

Kimenetek

Név Típus Description
Egyesített számláló átalakítása ITransform interfész Az egyesített átalakítás

Kivételek

Kivétel Description
0003-as hiba Kivétel akkor fordul elő, ha egy vagy több bemenet null vagy üres.
0086-os hiba Kivétel akkor fordul elő, ha egy számláló-átalakítás érvénytelen.

Lásd még

Tanulás a Counts (Darabszámok) számlálással