Darabszámtábla importálása

Fontos

A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.

2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.

A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.

Egy korábban létrehozott darabszámtáblát importál

Kategória: Tanulás számokkal

Megjegyzés

A következőkre vonatkozik: Machine Learning Studio (klasszikus)

Hasonló húzással használható modulok érhetők el Azure Machine Learning tervezőben.

A modul áttekintése

Ez a cikk az Import Count Table (Tábla importálása) modul használatát ismerteti a Machine Learning Studióban (klasszikus).

Az Import Count Table (Tábla importálása) modul célja, hogy lehetővé tegye az olyan ügyfelek számára a kísérlet frissítését, akik a Machine Learning egy korábbi verziójával hoztak létre számalapú statisztikákat. Ez a modul egyesíti a meglévő darabszámtáblákat az új adatokkal.

A darabszámtáblákra és a funkciók létrehozására való létrehozásukra vonatkozó általános információkért tekintse meg a Tanulás a Counts (Darabszámok) táblázatot.

Fontos

Ez a modul kizárólag az elavult Build Count Táblát és az elavult Count Featurizer modulokat használják kísérletek visszamenőleges kompatibilitásához. Javasoljuk, hogy frissítse kísérletét az újabb modulok használatára, hogy kihasználja az új funkciókat.

Javasoljuk, hogy minden új kísérlethez a következő modulokat használja:

Az Importálások száma tábla konfigurálása

  1. A Machine Learning Studióban (klasszikus) nyisson meg egy kísérletet, amely az elavult Build Count Table modullal létrehozott darabszámtáblát tartalmaz.

  2. Adja hozzá az Import Count Table (Tábla importálása ) modult a kísérlethez.

  3. Csatlakozás a Build Count Table (elavult) modul két kimenetét az Import Count Table megfelelő bemeneti portjaihoz.

    Ha egy másik darabszám-adatkészletet szeretne egyesíteni az importált darabszámtáblával, csatlakoztassa azt az Import Count Table (Tábla importálása) modul jobb szélső bemenetéhez.

  4. A Count type (Számolás típusa ) lehetőséggel adhatja meg, hogy hol és hogyan tárolja a count táblát:

    • Adatkészlet: A számlálók felépítéséhez használt adatokat a rendszer adatkészletként menti a Machine Learning Studióban (klasszikus).

    • Blob: A darabszámok felépítéséhez használt adatokat a rendszer blokkblobként tárolja Windows Azure Storage-ban.

    • MapReduce: A darabszámok felépítéséhez használt adatokat a rendszer blobként tárolja Windows Azure Storage-ban.

      Ez a lehetőség általában nagyon nagy adatkészletek esetén ajánlott. A darabszámok eléréséhez aktiválnia kell a HDInsight-fürtöt. A rendszer elindít egy MapReduce-feladatot a számlálás végrehajtásához. Mindkét tevékenység tárolási és számítási költségekkel jár.

      További információ: HDInsight az Azure-on.

    Az adattárolási mód megadása után előfordulhat, hogy további kapcsolati adatokat kell megadnia az adatokhoz, még akkor is, ha a kísérletben korábban az Adatok importálása modult használta az adatok eléréséhez. Ennek az az oka, hogy a Count Featurizer (elavult) modul külön fér hozzá az adattárolóhoz, hogy beolvassa az adatokat, és felépítse a szükséges táblákat.

  5. A Count table type (Táblatípus száma ) lehetőséggel adhatja meg a darabszámok tárolására használt tábla formátumát és tárolási módját.

    • Szótár: Szótárszámtáblát használ.

      A rendszer a kiválasztott oszlopokban lévő összes oszlopértéket sztringként kezeli, és egy legfeljebb 31 bites bittömb használatával kivonatot hoz létre. Ezért minden oszlopértéket nem negatív 32 bites egész szám képvisel.

    • CMSketch: A minimális vázlatszám táblázatban mentett táblát használ.

      Ezzel a formátummal a rendszer több független kivonatfüggetlen, kisebb tartományú függvényt használ a memória hatékonyságának javításához és a kivonatütközések esélyének csökkentéséhez.

    Általában érdemes a Szótár lehetőséget használni kisebb adatkészletek esetén (<1 GB), nagyobb adatkészletek esetén pedig a CMSketch lehetőséget.

  6. Futtassa a kísérletet.

  7. Ha elkészült, kattintson a jobb gombbal az Import Count Table (Tábla importálása) modul kimenetére, válassza a Save as Transform (Mentés átalakításként) lehetőséget, és írja be az átalakítás nevét. Ennek során az egyesített darabszámtáblák és az esetlegesen alkalmazott featurizálási paraméterek egy olyan formátumban lesznek mentve, amely alkalmazható egy új adatkészletre.

Példák

Tekintsen át példákat a számalapú deaturizálásra a következő mintakísérletek használatával a Azure AI Gallery:

Megjegyzés

Ezek a Gallery-kísérletek mind a korábbi, most pedig a Counts modulokkal Tanulás verziójával voltak létrehozva. Amikor megnyitja a kísérletet a Studióban (klasszikus), a rendszer automatikusan frissíti a kísérletet, hogy az újabb modulokat használja.

Várt bemenetek

Név Típus Description
Metaadatok száma Adattábla A darabszámok metaadatai
Count tábla Adattábla A count tábla
Megszámolt adatkészlet Adattábla A megszámláláshoz használt adatkészlet

Modulparaméterek

Név Típus Tartomány Választható Alapértelmezett Description
Számláló típusa CountingType (Számlálótípus) Kötelező A számláló típusa

Kimenetek

Név Típus Description
Számlálási átalakítás ITransform interfész A számláló átalakítása

Kivételek

Kivétel Description
0003-as hiba Kivétel akkor fordul elő, ha egy vagy több bemenet null vagy üres.
0018-as hiba Kivétel akkor fordul elő, ha a bemeneti adatkészlet érvénytelen.

A Studio (klasszikus) moduljaival kapcsolatos hibák listájáért tekintse meg a Machine Learning hibakódokat.

Az API-kivételek listájáért tekintse meg a Machine Learning REST API hibakódokat.

Lásd még

Tanulás a Counts (Darabszámok) számlálással