Adatátalakítás
Fontos
A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.
2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.
- További információ a gépi tanulási projektek a ML Studióból a klasszikusból a Azure Machine Learning.
- További információ a Azure Machine Learning.
A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.
Ez a cikk felsorolja a Machine Learning Studio (klasszikus) adatátalakításhoz biztosított moduljait. Gépi tanulás esetén az adatátalakítás néhány nagyon általános feladatot is magában foglalja, például az adatkészletek összepárosodása vagy az oszlopnevek módosítása. Ugyanakkor számos, a gépi tanulásra jellemző feladatot is magában foglal, például a normalizálást, a kitűzését és csoportosítását, valamint a hiányzó értékek következtetését.
Megjegyzés
A következőkre vonatkozik: Machine Learning Studio (klasszikus)
Hasonló húzással használható modulok érhetők el Azure Machine Learning tervezőben.
Fontos
A Machine Learning Studióban (klasszikus) használt adatok általában "rendezettek" lesznek, mielőtt importálja őket a Machine Learning Studio (klasszikus) alkalmazásba. Az adatelőkészítés magában foglalhatja például annak biztosítását, hogy az adatok a megfelelő kódolást használják, és ellenőrizze, hogy az adatok konzisztens sémával rendelkezik-e.
Az adatátalakítási modulok a következő feladatalapú kategóriákba vannak csoportosítva:
- Szűrők létrehozása digitális jelfeldolgozáshoz: A digitális jelszűrők numerikus adatokra alkalmazhatók olyan gépi tanulási feladatok támogatásához, mint a képfelismerés, a hangfelismerés és a hullámformaelemzés.
- Számalapú funkciók létrehozása és használata: A számalapú jellemzősítési modulok segítségével kompakt funkciókat fejleszthet a gépi tanuláshoz.
- Általános adatkezelés és -előkészítés: Adatkészletek egyesítése, hiányzó értékek megtisztítása, adatok csoportosítása és összegzése, oszlopnevek és adattípusok módosítása, illetve annak jelzése, hogy melyik oszlop címke vagy jellemző.
- Mintavételezés és adathalmazok felosztása: Ossza fel az adatokat betanítás és tesztelési készletekre, ossza fel az adathalmazokat százalék vagy szűrőfeltétellel, vagy végezzen mintavételezést.
- Adatok skálázása és csökkentése: Numerikus adatok előkészítése elemzéshez normalizálás vagy skálázás alkalmazásával. Az adatokat csoportokba kell betárolódni, eltávolítani vagy lecserélni a kiadatokat, vagy fő összetevő-elemzést (PCA) kell végezni.
Modulok listája
A következő modulkategóriák szerepelnek az Adatátalakítás kategóriában :
- Adatátalakítás – Szűrő
- Tanulás a Counts (Darabszámok) számlálással
- Adatátalakítás – Manipuláció
- Adatátalakítás – Minta és felosztás
- Adatátalakítás – Méretezés és csökkentés