Adatformátum-átalakítások

Fontos

A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.

2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.

A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.

Megjegyzés

A következőkre vonatkozik: Machine Learning Studio (klasszikus)

Hasonló húzással használható modulok érhetők el Azure Machine Learning tervezőben.

Ez a cikk felsorolja a Machine Learning Studio (klasszikus) moduljait az adatok a gépi tanulásban használt különböző fájlformátumok közötti átalakításához.

A támogatott formátumok a következők:

  • A teljes adattitkok által használt Machine Learning.
  • A Weka által használt ARFF-formátum. A Weka gépi tanulási algoritmusok nyílt forráskódú Java-alapú készlete.
  • Az SVMLight formátum. Az SVMLight formátumot az SVMlight gépi tanulási keretrendszerhez fejlesztették ki. A Vowpal Wabbit is használhatja.
  • A legtöbb relációs adatbázis által támogatott tabulátott (TSV) és vesszővel elválasztott (CSV) fájlformátumok. Ezeket a formátumokat az R és a Python is széles körben támogatja.

Amikor ilyen formátumba konvertálja az adatokat, könnyebben áthelyezheti az eredményeket és az adatokat a különböző gépi tanulási keretrendszerek vagy tárolási mechanizmusok között.

Megjegyzés

Ezek az adatkonverziós modulok csak a teljes adatkészletet alakítják át egy megadott formátumra. Ha bármilyen konverziót, csonkítást, dátum- és időformátumok átalakítását vagy az értékek más módon történő manipulálását kell elvégeznie, használja az adatátalakítás moduljait , vagy tekintse meg a kapcsolódó feladatok listáját.

Gyakori adatkonverziós forgatókönyvek

Az adatkonverziós modulokat általában akkor használja, ha adatokat kell áthelyezni egy Machine Learning egy másik gépi tanulási eszközre vagy platformra. A modulokkal adatokat exportálhat a Machine Learning egy adatbázis vagy más eszközök által használható formátumban. Például:

Feladat Használja ezt a
Mentenie kell egy köztes adatkészletet, hogy a Excel vagy adatbázisba importálni tudja. A CSV modul vagy a TSV modul használatával készítse elő az adatokat a megfelelő formátumban. Ezután töltse le az adatokat, vagy mentse őket az Azure Storage.
R- vagy Python-kódban szeretné újra felhasználni a kísérletből származó adatokat. Az adatok előkészítéséhez használja a CSV-modult vagy a TSV-modult . Ezután kattintson a jobb gombbal a konvertált adatkészletre az adatkészlet eléréséhez szükséges Python-kód lekértéhez.
A kísérletet és az adatokat a Weka és a Machine Learning. Az ARFF modullal készítse elő az adatokat. Ezután töltse le az eredményeket.
Elő kell készítenie az adatokat az SVMlight keretrendszerben. Az adatok előkészítéséhez használja a Convert to SVMLight (Átalakítás SVMLightká ) modult. Ezután töltse le az eredményül kapott adatokat.
Hozzon létre adatokat a Vowpal Wabbithez. Használja az SVMLight formátumot . Ezután módosítsa a fájlokat a cikkben leírtak szerint. Mentse a fájlt az Azure Blob Storage-ba, hogy az a Vowpal Wabbit modullal használva Machine Learning.
Az adatok nem táblázatos formátumúak. A Convert to Dataset (Adatkészlet konvertálása) modullal alakítsa át adatkészlet-formátumra .

Ha adatokat kell importálni a Machine Learning vagy egyes oszlopokban kell átalakítania az adatokat, az adatkonverzió végrehajtása előtt használja ezeket a modulokat:

Feladat Használja ezt a
Importálja az adatokat a számítógépemből a Machine Learning. Töltse fel az adatkészleteket CSV formátumban a betanítás adatainak importálása a Machine Learning Studióba (klasszikus).
Adatok importálása felhőbeli adatforrásból, beleértve a Hadoopot vagy az Azure-t. Használja az Adatok importálása modult .
Gépi tanulási adatkészletek mentése Azure Blob Storage-ba, Hadoop-fürtbe vagy más felhőalapú tárolóba. Használja az Adatok exportálása modult .
Az oszlopok adattípusának módosítása vagy oszlopok átváltása más formátumra vagy típusra. A Machine Learning használja a Metaadatok szerkesztése vagy az Átalakítás SQL modulokat. Ha jártas az R vagy a Python nyelvben, próbálja ki a Python-szkript végrehajtása vagy az R-szkript végrehajtása modulokat .
Numerikus adatok kerekítése, csoportosítása vagy normalizálása. Használhatja a Matematikai műveletek alkalmazása, az Adatok csoportosítása lomtárba vagy az Adatok normalizálása modult .

Modulok listája

Az Adatformátum-átalakítások kategória a következő modulokat tartalmazza:

Lásd még