(Klasszikus) Studio-adathalmaz migrálása az Azure Machine Learningbe
Fontos
Az Azure Machine Tanulás Studio (klasszikus) támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy a dátumig váltson az Azure Machine Tanulás.
2021. december 1-től nem hozhat létre új Machine Tanulás Studio-erőforrásokat (munkaterület- és webszolgáltatás-csomagot). 2024. augusztus 31-ig továbbra is használhatja a machine Tanulás Studio (klasszikus) kísérleteket és webszolgáltatásokat. További információkért lásd:
- Migrálás az Azure Machine Tanulás a Machine Tanulás Studióból (klasszikus)
- Mi az Azure Machine Learning?
A Machine Tanulás Studio (klasszikus) dokumentációja kivezetés alatt áll, és előfordulhat, hogy a jövőben nem frissül.
Ebből a cikkből megtudhatja, hogyan migrálhat egy Studio (klasszikus) adatkészletet az Azure Machine Tanulás. A Studióból (klasszikus) való migrálással kapcsolatos további információkért tekintse meg a migrálás áttekintéséről szóló cikket.
Három lehetőség közül választhat, hogy migráljon egy adathalmazt az Azure Machine Tanulás. Olvassa el az egyes szakaszokat, és állapítsa meg, hogy melyik lehetőség a legmegfelelőbb a forgatókönyvhöz.
Hol vannak az adatok? | Áttelepítési lehetőség |
---|---|
A Studióban (klasszikus) | 1. lehetőség: Töltse le az adathalmazt a Studióból (klasszikus), és töltse fel az Azure Machine Tanulás. |
Felhőtárhely | 2. lehetőség: Adathalmaz regisztrálása felhőbeli forrásból. 3. lehetőség: Az Adatok importálása modullal lekérheti az adatokat egy felhőbeli forrásból. |
Feljegyzés
Az Azure Machine Tanulás az adathalmazok létrehozására és kezelésére szolgáló kódelső munkafolyamatokat is támogatja.
Előfeltételek
- Egy Azure-fiók, aktív előfizetéssel. Fiók ingyenes létrehozása.
- Egy Azure Machine Learning-munkaterület. Munkaterületi erőforrások létrehozása.
- Egy (klasszikus) studio-adatkészlet migrálásához.
Az adathalmaz letöltése a Studióból (klasszikus)
A Studio (klasszikus) adatkészletek Azure Machine-Tanulás való migrálásának legegyszerűbb módja az adathalmaz letöltése és regisztrálása az Azure Machine Tanulás. Ezzel létrehoz egy új másolatot az adatkészletről, és feltölti azt egy Azure Machine Tanulás-adattárba.
A studio (klasszikus) adathalmaz-típusokat közvetlenül letöltheti.
- Egyszerű szöveg (.txt)
- Vesszővel tagolt értékek (CSV) fejléccel (.csv) vagy anélkül (.nh.csv)
- Tabulátorral elválasztott értékek (TSV) fejléccel (.tsv) vagy anélkül (.nh.tsv)
- Excel-fájl
- Zip-fájl (.zip)
Adathalmazok közvetlen letöltése:
Nyissa meg a Studio (klasszikus) munkaterületet (https://studio.azureml.net).
A bal oldali navigációs sávon válassza az Adathalmazok lapot.
Válassza ki a letölteni kívánt adatkészlet(ek)et.
Az alsó műveletsávon válassza a Letöltés lehetőséget.
Az alábbi adattípusok esetében az adathalmazok letöltéséhez a Konvertálás CSV-modullal kell rendelkeznie.
- SVMLight-adatok (.svmlight)
- Attribútumrelációs fájlformátum (ARFF) adatai (.arff)
- R-objektum vagy munkaterületfájl (. RData)
- Adathalmaz típusa (.data). Az adathalmaz típusa a Studio(klasszikus) belső adattípusa a modul kimenetéhez.
Az adatkészlet CSV-vé alakításához és az eredmények letöltéséhez:
Nyissa meg a Studio (klasszikus) munkaterületet (https://studio.azureml.net).
Hozzon létre egy új kísérletet.
Húzza a vászonra a letölteni kívánt adathalmazt.
Adjon hozzá egy Konvertálás CSV-modullá .
CsatlakozásAlakítsa át CSV bemeneti porttá az adathalmaz kimeneti portjára.
Futtassa a kísérletet.
Kattintson a jobb gombbal a Konvertálás CSV-modulra .
Válassza a Letöltés találatok adatkészlet>lehetőséget.
Az adathalmaz feltöltése az Azure Machine Tanulás
Az adatfájl letöltése után regisztrálhatja adategységként az Azure Machine Tanulás:
Navigálás az Azure Machine Tanulás Studióba
A bal oldali navigációs Eszközök területén válassza az Adatok lehetőséget. Az Adategységek lapon válassza a Létrehozás lehetőséget
Adjon nevet és opcionális leírást az adategységnek. Ezután válassza a Tabular (Táblázatos) lehetőséget a Típus területen, a legördülő lista Adathalmaztípusok szakaszában.
Feljegyzés
Zip-fájlokat adategységként is feltölthet. ZIP-fájl feltöltéséhez válassza a Fájl típushoz lehetőséget a legördülő lista Adathalmaztípusok szakaszában.
Adatforrás esetén válassza a "Helyi fájlokból" lehetőséget az adathalmaz feltöltéséhez.
A fájlválasztáshoz először válassza ki, hogy hol szeretné tárolni az adatokat az Azure-ban. Egy Azure Machine Tanulás-adattárat fog kiválasztani. További információ az adattárakról: Csatlakozás a tárolási szolgáltatásokhoz. Ezután töltse fel a korábban letöltött adathalmazt.
Az adategység adatelemzési beállításainak és sémájának beállításához kövesse az alábbi lépéseket.
Miután elérte a Véleményezés lépést, kattintson a Létrehozás gombra az utolsó oldalon
Adatok importálása felhőforrásokból
Ha az adatok már egy felhőalapú tárolási szolgáltatásban találhatók, és a natív helyen szeretné tárolni az adatokat. Az alábbi lehetőségek egyikét használhatja:
Betöltési módszer | Leírás |
---|---|
Azure Machine-Tanulás-adatkészlet regisztrálása | Adatok betöltése helyi és online adatforrásokból (Blob, ADLS Gen1, ADLS Gen2, Fájlmegosztás, SQL DB). Létrehoz egy hivatkozást az adatforrásra, amelyet futásidőben lazán kiértékel. Ezt a lehetőséget akkor használhatja, ha ismételten hozzáfér ehhez az adatkészlethez, és olyan speciális adatfunkciókat szeretne engedélyezni, mint az adatok verziószámozása és monitorozása. |
Adatimportálási modul | Adatok betöltése online adatforrásokból (Blob, ADLS Gen1, ADLS Gen2, Fájlmegosztás, SQL DB). Az adatkészlet csak az aktuális tervezőfolyamat-futtatásra lesz importálva. |
Feljegyzés
A Studio (klasszikus) felhasználóinak meg kell jegyeznie, hogy a következő felhőforrások natív módon nem támogatottak az Azure Machine Tanulás:
- Hive-lekérdezés
- Azure-tábla
- Azure Cosmos DB
- Helyszíni SQL Database
Azt javasoljuk, hogy a felhasználók az Azure Data Factory használatával migrálják az adataikat egy támogatott tárolási szolgáltatásba.
Azure Machine-Tanulás-adatkészlet regisztrálása
Az alábbi lépésekkel regisztrálhat egy adathalmazt az Azure Machine-Tanulás egy felhőszolgáltatásból:
Hozzon létre egy adattárat, amely összekapcsolja a felhőalapú tárolási szolgáltatást az Azure Machine Tanulás-munkaterületével.
Adathalmaz regisztrálása. Ha a Studio (klasszikus) adatkészletet migrálja, válassza a Táblázatos adathalmaz beállítást.
Miután regisztrál egy adathalmazt az Azure Machine Tanulás, használhatja azt a tervezőben:
- Hozzon létre egy új tervezőfolyamat-vázlatot.
- A bal oldali modulkatalógusban bontsa ki az Adathalmazok szakaszt.
- Húzza a regisztrált adathalmazt a vászonra.
Az Adatok importálása modul használata
Az adatok közvetlenül a tervezőfolyamatba való importálásához kövesse az alábbi lépéseket:
- Hozzon létre egy adattárat, amely összekapcsolja a felhőalapú tárolási szolgáltatást az Azure Machine Tanulás-munkaterületével.
Az adattár létrehozása után a tervező Adatimportálás modulja segítségével adatokat vehet fel belőle:
- Hozzon létre egy új tervezőfolyamat-vázlatot.
- A bal oldali modulkatalógusban keresse meg az Adatok importálása modult, és húzza a vászonra.
- Válassza az Adatok importálása modult, és a jobb oldali panel beállításaival konfigurálja az adatforrást.
Következő lépések
Ebben a cikkben megismerhette, hogyan migrálhat egy Studio (klasszikus) adatkészletet az Azure Machine Tanulás. A következő lépés a Studio (klasszikus) betanítási folyamatának újraépítése.
Tekintse meg a Studio (klasszikus) migrálási sorozatának további cikkeit:
- Migrálás áttekintése.
- Adathalmazok migrálása.
- Studio (klasszikus) betanítási folyamat újraépítése.
- Studio (klasszikus) webszolgáltatás újraépítése.
- Azure Machine Tanulás webszolgáltatás integrálása ügyfélalkalmazásokkal.
- Az R-szkript migrálása.