Táblaparaméterek darabszámának módosítása

Fontos

A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.

2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.

A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.

Módosítja a funkciók számból való létrehozásához használt paramétereket

Kategória: Tanulás számokkal

Megjegyzés

A következőkre vonatkozik: Machine Learning Studio (klasszikus)

Hasonló húzással használható modulok érhetők el Azure Machine Learning tervezőben.

A modul áttekintése

Ez a cikk azt ismerteti, hogyan használható a táblaparaméterek darabszámának módosítása modul a Machine Learning Studióban (klasszikus) a funkciók számlálási táblából való generálására.

A számalapú funkciók létrehozásához általában a Build Count Transform használatával kell feldolgoznia egy adatkészletet és létrehoznia egy darabszámtáblát, és ebből a számlálótáblából új funkciókat kell létrehoznia.

Ha azonban már létrehozott egy darabszámtáblát, a Táblaparaméterek darabszámának módosítása modullal szerkesztheti a számlálási adatok feldolgozásának definícióját. Ez lehetővé teszi, hogy a meglévő adatok alapján különböző számalapú statisztikákat hozzon létre anélkül, hogy újra elemeznie kell az adathalmazt.

A számparaméterek módosításának konfigurálása

  1. Keresse meg a módosítani kívánt átalakítást az Átalakítások csoportban, és adja hozzá a kísérlethez.

    Korábban olyan kísérletet kellett futtatnia, amely számátalakítást hozott létre.

    • Mentett átalakítás módosítása: Keresse meg az átalakítást az Átalakítások csoportban, és adja hozzá a kísérlethez.

    • Egy adott kísérletben létrehozott darabszám-átalakítás módosítása: Ha az átalakítás nem lett mentve, de kimenetként elérhető az aktuális kísérletben (például tekintse meg aBuild Count Transform modul kimenetét), közvetlenül használhatja a modulok csatlakoztatásával.

  2. Adja hozzá a Táblaparaméterek darabszámának módosítása modult, és kösse össze az átalakítást bemenetként.

  3. A Táblaparaméterek darabszámának módosítása modul Tulajdonságok panelén írjon be egy értéket, amely aGarbage bin küszöbértékeként lesz használva.

    Ez az érték határozza meg az egyes szolgáltatásértékek előfordulások minimális számát a darabszámok használatához. Ha az érték gyakorisága kisebb, mint a szemétgyűjtő küszöbértéke, akkor az értékfeliratpár nem számít különálló elemnek; ehelyett minden, a küszöbértéknél alacsonyabb számmal bíró elem egyetlen "szemétgyűjtőbe" kerül.

    Ha kis adatkészletet használ, és ugyanazokon az adatokon számol és betanít, a jó kezdőérték az 1.

  4. További előzetes példapécákhoz írjon be egy számot, amely a további példapécák számát jelzi. Ezeket a példákat nem kell adnia; A pszeudopé-példák az előző eloszlás alapján jönnek létre.

  5. Lapkás zajskála esetében írjon be egy pozitív lebegőpontos értéket, amely a lapnéz eloszlásból vett zaj bevezetéséhez használt skálát jelöli. Skálázható érték beállításakor a rendszer bizonyos elfogadható zajszinteket épít be a modellbe, így a modellt kisebb valószínűséggel érintik az adatokban nem található értékek.

  6. A Kimeneti funkciók között válassza ki azt a módszert, amely az átalakításba belefoglalt, számalapú funkciók létrehozásakor használható.

    • CountsOnly: Funkciók létrehozása darabszámok használatával.

    • LogOddsOnly: Az esélyarány naplóját használva hozhat létre funkciókat.

    • BothCountsAndLogOdds: Funkciók létrehozása a darabszámok és a naplók esélyének használatával.

  7. Ha felül szeretné bírálni a kimenetben található jelölőt a funkciók létrehozásakor, válassza az Ignore back off columnIsBackOff (Oszlop mellőzését) lehetőséget. Ha ezt a lehetőséget választja, a számalapú funkciók akkor is létrejönnek, ha az oszlop nem rendelkezik jelentős darabszámértékekkel.

  8. Futtassa a kísérletet. Ha szeretné, mentheti a Táblaparaméterek darabszámának módosítása kimenetét új átalakításként.

Példák

A modul példáiért tekintse meg a következő Azure AI Gallery:

  • Tanulás a Counts: Binary Classification (Darabszámok: Bináris besorolás) használatával: Bemutatja, hogyan hozhat létre funkciókat a bináris besorolási modell kategorikus értékeinek oszlopaiból a tanulási és a counts modulokkal.

  • Tanulás a Counts: Multiclass classification with NYC taxi data:sample Bemutatja, hogyan használható a tanulás a counts modulokkal a nyilvánosan elérhető NYC taxiadatkészleten a többosztályos besorolás végrehajtásához. A minta egy többosztályos logisztikai regressziós tanulót használ a probléma modellezése érdekében.

  • Tanulás a Counts: Binary classification with NYC taxi data (Bináris besorolás NYC taxiadatokkal): Bemutatja, hogyan használható a tanulás a counts modulokkal a nyilvánosan elérhető NYC taxiadatkészlet bináris besorolásának végrehajtásához. A minta egy kétosztályos logisztikai regressziós tanulót használ a probléma modellezése érdekében.

Technikai megjegyzések

Ez a szakasz az implementáció részleteit, a tippeket és a gyakori kérdésekre adott válaszokat tartalmazza.

Statisztikailag biztonságosan megszámolható és betanítható ugyanazon az adathalmazon, ha be van állítva a lapparaméter.

Várt bemenetek

Név Típus Description
Számlálási átalakítás ITransform interfész Az alkalmazandó számláló-átalakítás

Modulparaméterek

Név Típus Tartomány Választható Alapértelmezett Description
Szemétgyűjtő küszöbértéke Float >=0,0f Kötelező 10.0f Az a küszöbérték, amely alatt egy oszlopérték a szemétgyűjtőre lesz kivetve
További korábbi példapécék Float >=0,0f Kötelező 42.0f A korábbi disztribúciókat követő további pszeudopé-példák
Laplaszoszi zajskála Float >=0,0f Kötelező 0,0f A lapnéz eloszlás skálája, amelyből a zaj mintavétele történt
A kimeneti funkciók közé tartoznak a következők: OutputFeatureType (Kimenet típusa) Kötelező BothCountsAndLogOdds A kimenetben található funkciók
Oszlop visszafejtését figyelmen kívül hagyva Logikai Kötelező hamis Azt határozza meg, hogy figyelmen kívül hagyja-e az IsBackOff oszlopot a kimenetben

Kimenetek

Név Típus Description
Módosított átalakítás ITransform interfész A módosított átalakítás

Kivételek

Kivétel Description
0003-as hiba Kivétel akkor fordul elő, ha egy vagy több bemenet null vagy üres.
0086-os hiba Kivétel akkor fordul elő, ha egy számláló-átalakítás érvénytelen.

A Studio (klasszikus) moduljaival kapcsolatos hibák listájáért tekintse meg a Machine Learning hibakódokat.

Az API-kivételek listáját a hibakódok Machine Learning REST API.

Lásd még

Tanulás a Counts (Darabszámok) számlálással