Adatátalakítás

Fontos

A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.

2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.

A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.

Ez a cikk felsorolja a Machine Learning Studio (klasszikus) adatátalakításhoz biztosított moduljait. Gépi tanulás esetén az adatátalakítás néhány nagyon általános feladatot is magában foglalja, például az adatkészletek összepárosodása vagy az oszlopnevek módosítása. Ugyanakkor számos, a gépi tanulásra jellemző feladatot is magában foglal, például a normalizálást, a kitűzését és csoportosítását, valamint a hiányzó értékek következtetését.

Megjegyzés

A következőkre vonatkozik: Machine Learning Studio (klasszikus)

Hasonló húzással használható modulok érhetők el Azure Machine Learning tervezőben.

Fontos

A Machine Learning Studióban (klasszikus) használt adatok általában "rendezettek" lesznek, mielőtt importálja őket a Machine Learning Studio (klasszikus) alkalmazásba. Az adatelőkészítés magában foglalhatja például annak biztosítását, hogy az adatok a megfelelő kódolást használják, és ellenőrizze, hogy az adatok konzisztens sémával rendelkezik-e.

Az adatátalakítási modulok a következő feladatalapú kategóriákba vannak csoportosítva:

  • Szűrők létrehozása digitális jelfeldolgozáshoz: A digitális jelszűrők numerikus adatokra alkalmazhatók olyan gépi tanulási feladatok támogatásához, mint a képfelismerés, a hangfelismerés és a hullámformaelemzés.
  • Számalapú funkciók létrehozása és használata: A számalapú jellemzősítési modulok segítségével kompakt funkciókat fejleszthet a gépi tanuláshoz.
  • Általános adatkezelés és -előkészítés: Adatkészletek egyesítése, hiányzó értékek megtisztítása, adatok csoportosítása és összegzése, oszlopnevek és adattípusok módosítása, illetve annak jelzése, hogy melyik oszlop címke vagy jellemző.
  • Mintavételezés és adathalmazok felosztása: Ossza fel az adatokat betanítás és tesztelési készletekre, ossza fel az adathalmazokat százalék vagy szűrőfeltétellel, vagy végezzen mintavételezést.
  • Adatok skálázása és csökkentése: Numerikus adatok előkészítése elemzéshez normalizálás vagy skálázás alkalmazásával. Az adatokat csoportokba kell betárolódni, eltávolítani vagy lecserélni a kiadatokat, vagy fő összetevő-elemzést (PCA) kell végezni.

Modulok listája

A következő modulkategóriák szerepelnek az Adatátalakítás kategóriában :

Lásd még