Betanítási adatok betöltése a Model Builderbe
Megtudhatja, hogyan töltheti be a betanítási adatkészleteket egy fájlból vagy egy SQL Server-adatbázisból, hogy az ML.NET egyik Model Builder-forgatókönyvében használhassa. A Model Builder-forgatókönyvek SQL Server-adatbázisokat, képfájlokat és CSV- vagy TSV-fájlformátumokat használhatnak betanítási adatokként.
A Model Builder csak vesszővel, tabulátorral és pontosvesszővel, PNG- és JPG-képekkel rendelkező TSV-, CSV- és TXT-fájlokat fogad el.
Model Builder-forgatókönyvek
A Model Builder segítségével modelleket hozhat létre a következő gépi tanulási forgatókönyvekhez:
- Adatbesorolás (bináris & többosztályos besorolás): A szöveges adatok besorolása két vagy több kategóriába.
- Érték-előrejelzés (regresszió): Numerikus érték előrejelzése.
- Képbesorolás (mélytanulás): A képek besorolása két vagy több kategóriába.
- Javaslat (javaslat): Egy adott felhasználó számára javasolt elemek listájának létrehozása.
- Objektumészlelés (mélytanulás): Objektumok észlelése és azonosítása képeken. Ez megkereshet egy vagy több objektumot, és ennek megfelelően címkézheti őket.
Ez a cikk szöveges vagy numerikus adatokat, képbesorolást és objektumészlelési forgatókönyveket tartalmazó besorolást és regressziót tartalmaz.
Szöveg vagy numerikus adatok betöltése fájlból
Szöveg- vagy numerikus adatokat tölthet be egy fájlból a Model Builderbe. Vesszőkkel tagolt (CSV) vagy tabulátorral tagolt (TSV) fájlformátumokat fogad el.
A Model Builder adatlépésében válassza a Fájl lehetőséget adatforrástípusként.
Jelölje ki a szövegmező melletti Tallózás gombot, majd a Fájlkezelő használatával tallózzon és jelölje ki az adatfájlt.
Válasszon egy kategóriát az Oszlopban a (Címke) legördülő lista előrejelzéséhez.
Feljegyzés
(Nem kötelező) adatbesorolási forgatókönyvek: Ha a címkeoszlop adattípusa (az "Oszlop előrejelzése (Címke)" legördülő lista értéke logikai (Igaz/Hamis) értékre van állítva, a modell betanítási folyamatában bináris besorolási algoritmust használ. Ellenkező esetben a rendszer egy többosztályos besorolási oktatót használ. A Speciális adatbeállítások segítségével módosíthatja a címkeoszlop adattípusát, és tájékoztathatja a Model Buildert arról, hogy milyen típusú trénert használjon az adatokhoz.
Frissítse az adatokat a Speciális adatbeállítások hivatkozásban az oszlopbeállítások beállításához vagy az adatformázás frissítéséhez.
Elkészült a Model Builder adatforrásfájljának beállításával. A Következő lépés gombra kattintva lépjen a Model Builder következő lépésére.
Adatok betöltése SQL Server-adatbázisból
A Model Builder támogatja az adatok betöltését helyi és távoli SQL Server-adatbázisokból.
Helyi adatbázisfájl
Adatok betöltése SQL Server-adatbázisfájlból a Model Builderbe:
A Model Builder adatlépésében válassza az SQL Servert adatforrástípusként.
Válassza az Adatforrás kiválasztása gombot.
- Az Adatforrás kiválasztása párbeszédpanelen válassza a Microsoft SQL Server-adatbázisfájlt.
- Törölje a jelet a Mindig használja ezt a jelölőnégyzetet, és válassza a Folytatás lehetőséget
- A Csatlakozás ion Properties (Tulajdonságok) párbeszédpanelen válassza a Tallózás lehetőséget, és válassza ki a letöltött elemet. MDF-fájl.
- Kattintson az OK gombra
Válassza ki az adathalmaz nevét a Táblanév legördülő listából.
Az Oszlop (Címke) legördülő listában válassza ki azt az adatkategóriát, amelyre előrejelzést szeretne készíteni.
Feljegyzés
(Nem kötelező) adatbesorolási forgatókönyvek: Ha a címkeoszlop adattípusa (az "Oszlop előrejelzése (Címke)" legördülő lista értéke logikai (Igaz/Hamis) értékre van állítva, a modell betanítási folyamatában bináris besorolási algoritmust használ. Ellenkező esetben a rendszer egy többosztályos besorolási oktatót használ. A Speciális adatbeállítások segítségével módosíthatja a címkeoszlop adattípusát, és tájékoztathatja a Model Buildert arról, hogy milyen típusú trénert használjon az adatokhoz.
Frissítse az adatokat a Speciális adatbeállítások hivatkozásban az oszlopbeállítások beállításához vagy az adatformázás frissítéséhez.
Távoli adatbázis
Adatok betöltése SQL Server-adatbázis-kapcsolatból a Model Builderbe:
A Model Builder adatlépésében válassza az SQL Servert adatforrástípusként.
Válassza az Adatforrás kiválasztása gombot.
- Az Adatforrás kiválasztása párbeszédpanelen válassza a Microsoft SQL Servert.
A Csatlakozás ion Properties (Tulajdonságok) párbeszédpanelen adja meg a Microsoft SQL-adatbázis tulajdonságait.
- Adja meg azt a kiszolgálónevet, amelyhez csatlakozni szeretne.
- Állítsa be a hitelesítést a kiszolgálóra. Ha az SQL Server-hitelesítés van kiválasztva, adja meg a kiszolgáló felhasználónevét és jelszavát.
- Válassza ki, hogy melyik adatbázishoz szeretne csatlakozni a Kiválasztás vagy az Adatbázisnév legördülő listában. Ennek automatikusan fel kell töltenie, ha a kiszolgáló neve és a bejelentkezési adatok helyesek.
- Kattintson az OK gombra
Válassza ki az adathalmaz nevét a Táblanév legördülő listából.
Az Oszlop (Címke) legördülő listában válassza ki azt az adatkategóriát, amelyre előrejelzést szeretne készíteni.
Feljegyzés
(Nem kötelező) adatbesorolási forgatókönyvek: Ha a címkeoszlop adattípusa (az "Oszlop előrejelzése (Címke)" legördülő lista értéke logikai (Igaz/Hamis) értékre van állítva, a modell betanítási folyamatában bináris besorolási algoritmust használ. Ellenkező esetben a rendszer egy többosztályos besorolási oktatót használ. A Speciális adatbeállítások segítségével módosíthatja a címkeoszlop adattípusát, és tájékoztathatja a Model Buildert arról, hogy milyen típusú trénert használjon az adatokhoz.
Frissítse az adatokat a Speciális adatbeállítások hivatkozásban az oszlopbeállítások beállításához vagy az adatformázás frissítéséhez.
Elkészült a Model Builder adatforrásfájljának beállításával. A Következő lépés gombra kattintva lépjen a Model Builder következő lépésére.
Képbesorolási adatfájlok beállítása
A Model Builder elvárja, hogy a képbesorolási adatok JPG- vagy PNG-fájlok legyenek, amelyek a besorolás kategóriáinak megfelelő mappákba vannak rendezve.
Ha képeket szeretne betölteni a Model Builderbe, adja meg egyetlen legfelső szintű könyvtár elérési útját:
- Ez a legfelső szintű könyvtár minden előrejelezendő kategóriához egy almappát tartalmaz.
- Az egyes almappák tartalmazzák a kategóriájához tartozó képfájlokat.
Az alább látható mappaszerkezetben a legfelső szintű könyvtár flower_photos. Az előrejelezni kívánt kategóriáknak öt alkönyvtára van: százszorszép, pitypang, rózsa, napraforgó és tulipán. Ezen alkönyvtárak mindegyike a saját kategóriájához tartozó képeket tartalmazza.
\---flower_photos
+---daisy
| 100080576_f52e8ee070_n.jpg
| 102841525_bd6628ae3c.jpg
| 105806915_a9c13e2106_n.jpg
|
+---dandelion
| 10443973_aeb97513fc_m.jpg
| 10683189_bd6e371b97.jpg
| 10919961_0af657c4e8.jpg
|
+---roses
| 102501987_3cdb8e5394_n.jpg
| 110472418_87b6a3aa98_m.jpg
| 118974357_0faa23cce9_n.jpg
|
+---sunflowers
| 127192624_afa3d9cb84.jpg
| 145303599_2627e23815_n.jpg
| 147804446_ef9244c8ce_m.jpg
|
\---tulips
100930342_92e8746431_n.jpg
107693873_86021ac4ea_n.jpg
10791227_7168491604.jpg
Objektumészlelési képadatfájlok beállítása
A Model Builder elvárja, hogy az objektumészlelési képadatok JSON formátumban legyenek létrehozva a VoTT-ből. A JSON-fájl a vott-json-export mappában található a projektbeállításokban megadott célhelyen .
A JSON-fájl a VoTT-ből létrehozott alábbi információkból áll:
- Minden létrehozott címke
- A képfájl helyei
- A kép határolókeretének adatai
- A képhez társított címke
További információ az adatok objektumészlelésre való előkészítéséről: Objektumészlelési adatok létrehozása a VoTT-ből.
Következő lépések
Az alábbi oktatóanyagokat követve gépi tanulási alkalmazásokat hozhat létre a Model Builderrel:
- Objektumészlelési adatok létrehozása a VoTT-ből
- Árak előrejelzése regresszióval
- Hangulat elemzése egy webalkalmazásban bináris besorolással
Ha kóddal tanít be egy modellt, megtudhatja, hogyan tölthet be adatokat a ML.NET API használatával.
Visszajelzés
https://aka.ms/ContentUserFeedback.
Hamarosan elérhető: 2024-ben fokozatosan kivezetjük a GitHub-problémákat a tartalom visszajelzési mechanizmusaként, és lecseréljük egy új visszajelzési rendszerre. További információ:Visszajelzés küldése és megtekintése a következőhöz: