(Klasszikus) Studio-adathalmaz migrálása az Azure Machine Learningbe

Fontos

Az Azure Machine Tanulás Studio (klasszikus) támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy a dátumig váltson az Azure Machine Tanulás.

2021. december 1-től nem hozhat létre új Machine Tanulás Studio-erőforrásokat (munkaterület- és webszolgáltatás-csomagot). 2024. augusztus 31-ig továbbra is használhatja a machine Tanulás Studio (klasszikus) kísérleteket és webszolgáltatásokat. További információkért lásd:

A Machine Tanulás Studio (klasszikus) dokumentációja kivezetés alatt áll, és előfordulhat, hogy a jövőben nem frissül.

Ebből a cikkből megtudhatja, hogyan migrálhat egy Studio (klasszikus) adatkészletet az Azure Machine Tanulás. A Studióból (klasszikus) való migrálással kapcsolatos további információkért tekintse meg a migrálás áttekintéséről szóló cikket.

Három lehetőség közül választhat, hogy migráljon egy adathalmazt az Azure Machine Tanulás. Olvassa el az egyes szakaszokat, és állapítsa meg, hogy melyik lehetőség a legmegfelelőbb a forgatókönyvhöz.

Hol vannak az adatok? Áttelepítési lehetőség
A Studióban (klasszikus) 1. lehetőség: Töltse le az adathalmazt a Studióból (klasszikus), és töltse fel az Azure Machine Tanulás.
Felhőtárhely 2. lehetőség: Adathalmaz regisztrálása felhőbeli forrásból.

3. lehetőség: Az Adatok importálása modullal lekérheti az adatokat egy felhőbeli forrásból.

Feljegyzés

Az Azure Machine Tanulás az adathalmazok létrehozására és kezelésére szolgáló kódelső munkafolyamatokat is támogatja.

Előfeltételek

Az adathalmaz letöltése a Studióból (klasszikus)

A Studio (klasszikus) adatkészletek Azure Machine-Tanulás való migrálásának legegyszerűbb módja az adathalmaz letöltése és regisztrálása az Azure Machine Tanulás. Ezzel létrehoz egy új másolatot az adatkészletről, és feltölti azt egy Azure Machine Tanulás-adattárba.

A studio (klasszikus) adathalmaz-típusokat közvetlenül letöltheti.

  • Egyszerű szöveg (.txt)
  • Vesszővel tagolt értékek (CSV) fejléccel (.csv) vagy anélkül (.nh.csv)
  • Tabulátorral elválasztott értékek (TSV) fejléccel (.tsv) vagy anélkül (.nh.tsv)
  • Excel-fájl
  • Zip-fájl (.zip)

Adathalmazok közvetlen letöltése:

  1. Nyissa meg a Studio (klasszikus) munkaterületet (https://studio.azureml.net).

  2. A bal oldali navigációs sávon válassza az Adathalmazok lapot.

  3. Válassza ki a letölteni kívánt adatkészlet(ek)et.

  4. Az alsó műveletsávon válassza a Letöltés lehetőséget.

    AScreenshot showing how to download a dataset in Studio (classic).

Az alábbi adattípusok esetében az adathalmazok letöltéséhez a Konvertálás CSV-modullal kell rendelkeznie.

  • SVMLight-adatok (.svmlight)
  • Attribútumrelációs fájlformátum (ARFF) adatai (.arff)
  • R-objektum vagy munkaterületfájl (. RData)
  • Adathalmaz típusa (.data). Az adathalmaz típusa a Studio(klasszikus) belső adattípusa a modul kimenetéhez.

Az adatkészlet CSV-vé alakításához és az eredmények letöltéséhez:

  1. Nyissa meg a Studio (klasszikus) munkaterületet (https://studio.azureml.net).

  2. Hozzon létre egy új kísérletet.

  3. Húzza a vászonra a letölteni kívánt adathalmazt.

  4. Adjon hozzá egy Konvertálás CSV-modullá .

  5. CsatlakozásAlakítsa át CSV bemeneti porttá az adathalmaz kimeneti portjára.

  6. Futtassa a kísérletet.

  7. Kattintson a jobb gombbal a Konvertálás CSV-modulra .

  8. Válassza a Letöltés találatok adatkészlet>lehetőséget.

    Screenshot showing how to setup a convert to CSV pipeline.

Az adathalmaz feltöltése az Azure Machine Tanulás

Az adatfájl letöltése után regisztrálhatja adategységként az Azure Machine Tanulás:

  1. Navigálás az Azure Machine Tanulás Studióba

  2. A bal oldali navigációs Eszközök területén válassza az Adatok lehetőséget. Az Adategységek lapon válassza a Létrehozás lehetőséget Screenshot highlights Create in the Data assets tab.

  3. Adjon nevet és opcionális leírást az adategységnek. Ezután válassza a Tabular (Táblázatos) lehetőséget a Típus területen, a legördülő lista Adathalmaztípusok szakaszában.

    Feljegyzés

    Zip-fájlokat adategységként is feltölthet. ZIP-fájl feltöltéséhez válassza a Fájl típushoz lehetőséget a legördülő lista Adathalmaztípusok szakaszában. Screenshot shows data asset source choices.

  4. Adatforrás esetén válassza a "Helyi fájlokból" lehetőséget az adathalmaz feltöltéséhez.

  5. A fájlválasztáshoz először válassza ki, hogy hol szeretné tárolni az adatokat az Azure-ban. Egy Azure Machine Tanulás-adattárat fog kiválasztani. További információ az adattárakról: Csatlakozás a tárolási szolgáltatásokhoz. Ezután töltse fel a korábban letöltött adathalmazt.

  6. Az adategység adatelemzési beállításainak és sémájának beállításához kövesse az alábbi lépéseket.

  7. Miután elérte a Véleményezés lépést, kattintson a Létrehozás gombra az utolsó oldalon

Adatok importálása felhőforrásokból

Ha az adatok már egy felhőalapú tárolási szolgáltatásban találhatók, és a natív helyen szeretné tárolni az adatokat. Az alábbi lehetőségek egyikét használhatja:

Betöltési módszer Leírás
Azure Machine-Tanulás-adatkészlet regisztrálása Adatok betöltése helyi és online adatforrásokból (Blob, ADLS Gen1, ADLS Gen2, Fájlmegosztás, SQL DB).

Létrehoz egy hivatkozást az adatforrásra, amelyet futásidőben lazán kiértékel. Ezt a lehetőséget akkor használhatja, ha ismételten hozzáfér ehhez az adatkészlethez, és olyan speciális adatfunkciókat szeretne engedélyezni, mint az adatok verziószámozása és monitorozása.
Adatimportálási modul Adatok betöltése online adatforrásokból (Blob, ADLS Gen1, ADLS Gen2, Fájlmegosztás, SQL DB).

Az adatkészlet csak az aktuális tervezőfolyamat-futtatásra lesz importálva.

Feljegyzés

A Studio (klasszikus) felhasználóinak meg kell jegyeznie, hogy a következő felhőforrások natív módon nem támogatottak az Azure Machine Tanulás:

  • Hive-lekérdezés
  • Azure-tábla
  • Azure Cosmos DB
  • Helyszíni SQL Database

Azt javasoljuk, hogy a felhasználók az Azure Data Factory használatával migrálják az adataikat egy támogatott tárolási szolgáltatásba.

Azure Machine-Tanulás-adatkészlet regisztrálása

Az alábbi lépésekkel regisztrálhat egy adathalmazt az Azure Machine-Tanulás egy felhőszolgáltatásból:

  1. Hozzon létre egy adattárat, amely összekapcsolja a felhőalapú tárolási szolgáltatást az Azure Machine Tanulás-munkaterületével.

  2. Adathalmaz regisztrálása. Ha a Studio (klasszikus) adatkészletet migrálja, válassza a Táblázatos adathalmaz beállítást.

Miután regisztrál egy adathalmazt az Azure Machine Tanulás, használhatja azt a tervezőben:

  1. Hozzon létre egy új tervezőfolyamat-vázlatot.
  2. A bal oldali modulkatalógusban bontsa ki az Adathalmazok szakaszt.
  3. Húzza a regisztrált adathalmazt a vászonra.

Az Adatok importálása modul használata

Az adatok közvetlenül a tervezőfolyamatba való importálásához kövesse az alábbi lépéseket:

  1. Hozzon létre egy adattárat, amely összekapcsolja a felhőalapú tárolási szolgáltatást az Azure Machine Tanulás-munkaterületével.

Az adattár létrehozása után a tervező Adatimportálás modulja segítségével adatokat vehet fel belőle:

  1. Hozzon létre egy új tervezőfolyamat-vázlatot.
  2. A bal oldali modulkatalógusban keresse meg az Adatok importálása modult, és húzza a vászonra.
  3. Válassza az Adatok importálása modult, és a jobb oldali panel beállításaival konfigurálja az adatforrást.

Következő lépések

Ebben a cikkben megismerhette, hogyan migrálhat egy Studio (klasszikus) adatkészletet az Azure Machine Tanulás. A következő lépés a Studio (klasszikus) betanítási folyamatának újraépítése.

Tekintse meg a Studio (klasszikus) migrálási sorozatának további cikkeit:

  1. Migrálás áttekintése.
  2. Adathalmazok migrálása.
  3. Studio (klasszikus) betanítási folyamat újraépítése.
  4. Studio (klasszikus) webszolgáltatás újraépítése.
  5. Azure Machine Tanulás webszolgáltatás integrálása ügyfélalkalmazásokkal.
  6. Az R-szkript migrálása.