Share via


Oszlopok kiválasztása az Adathalmaz összetevőben

Ez a cikk az Azure Machine Learning designer egy összetevőjét ismerteti.

Ezzel az összetevővel kiválaszthatja az alsóbb rétegbeli műveletekben használni kívánt oszlopok egy részét. Az összetevő fizikailag nem távolítja el az oszlopokat a forrásadatkészletből; ehelyett az oszlopok egy részhalmazát hozza létre, hasonlóan az adatbázis nézetéhez vagy vetületéhez.

Ez az összetevő akkor hasznos, ha korlátoznia kell az alsóbb rétegbeli műveletekhez rendelkezésre álló oszlopokat, vagy ha csökkenteni szeretné az adathalmaz méretét a szükségtelen oszlopok eltávolításával.

Az adathalmaz oszlopai az eredeti adatokkal megegyező sorrendben jelennek meg, még akkor is, ha más sorrendben adja meg őket.

Használat

Ennek az összetevőnek nincsenek paraméterei. Az oszlopválasztóval kiválaszthatja a belefoglalni vagy kizárni kívánt oszlopokat.

Oszlopok kiválasztása név szerint

Az összetevőben több lehetőség is van az oszlopok név szerinti kiválasztására:

  • Szűrés és keresés

    Kattintson a BY NAME (BY NAME ) lehetőségre.

    Ha olyan adathalmazt csatlakoztatott, amely már fel van töltve, meg kell jelennie az elérhető oszlopok listájának. Ha nem jelennek meg oszlopok, előfordulhat, hogy az oszloplista megtekintéséhez felsőbb rétegbeli összetevőket kell futtatnia.

    A lista szűréséhez írja be a keresőmezőbe. Ha például beírja a betűt w a keresőmezőbe, a lista szűrve jelenik meg azokat az oszlopneveket, amelyek a betűt wtartalmazzák.

    Jelölje ki az oszlopokat, és kattintson a jobb nyíl gombra a kijelölt oszlopok jobb oldali panelen lévő listára való áthelyezéséhez.

    • Az oszlopnevek folyamatos tartományának kiválasztásához nyomja le a Shift + Kattintás gombot.
    • Ha egyes oszlopokat szeretne hozzáadni a kijelöléshez, nyomja le a Ctrl + Kattintás billentyűkombinációt.

    Kattintson a pipa gombra a mentéshez és a bezáráshoz.

  • Nevek használata más szabályokkal kombinálva

    Kattintson a WITH RULES (SZABÁLYOKKAL) lehetőségre.

    Válasszon ki egy szabályt, például egy adott adattípus oszlopait.

    Ezután kattintson az adott típusú oszlopokra név szerint, hogy felvehesse őket a kijelölési listára.

  • Írja be vagy illessze be az oszlopnevek vesszővel tagolt listáját

    Ha az adathalmaz széles, egyszerűbb lehet az indexek vagy a létrehozott névlisták használata ahelyett, hogy külön-külön választanál ki oszlopokat. Feltéve, hogy előre elkészítette a listát:

    1. Kattintson a WITH RULES (SZABÁLYOKKAL) lehetőségre.
    2. Válassza a Nincs oszlop lehetőséget, válassza a Belefoglalás lehetőséget, majd kattintson a szövegmezőbe a piros felkiáltójellel.
    3. Illessze be vagy írja be a korábban érvényesített oszlopnevek vesszővel tagolt listáját. Nem mentheti az összetevőt, ha bármelyik oszlopnak érvénytelen a neve, ezért mindenképpen ellenőrizze előre a neveket.

    Ezzel a módszerrel az oszloplistát is megadhatja az indexértékekkel.

Válasszon típus szerint

Ha a WITH RULES lehetőséget használja, több feltételt is alkalmazhat az oszlopkijelölésekre. Előfordulhat például, hogy csak numerikus adattípusú funkcióoszlopokat kell lekérnie.

A BEGIN WITH beállítás határozza meg a kiindulási pontot, és fontos az eredmények megértéséhez.

  • Ha a MINDEN OSZLOP lehetőséget választja, a rendszer minden oszlopot hozzáad a listához. Ezután a Kizárás lehetőséggel el kell távolítania azokat az oszlopokat, amelyek megfelelnek bizonyos feltételeknek.

    Előfordulhat például, hogy az összes oszlopot elkezdi, majd név vagy típus szerint eltávolítja az oszlopokat.

  • Ha a NINCS OSZLOPOK lehetőséget választja, az oszlopok listája üresen indul. Ezután meg kell adnia a feltételeket, hogy oszlopokat adjon a listához.

    Ha több szabályt alkalmaz, mindegyik feltétel additív. Tegyük fel például, hogy oszlop nélkül kezd, majd hozzáad egy szabályt az összes numerikus oszlop lekéréséhez. Az Automobile price datasetben ez 16 oszlopot eredményez. Ezután kattintson a + jelre egy új feltétel hozzáadásához, majd válassza az Összes funkció belefoglalása lehetőséget. Az eredményül kapott adathalmaz tartalmazza az összes numerikus oszlopot, valamint az összes funkcióoszlopot, beleértve néhány sztringfunkciós oszlopot is.

Választás oszlopindex alapján

Az oszlopindex az eredeti adatkészleten belüli oszlop sorrendjére hivatkozik.

  • Az oszlopok sorszáma sorrendben 1-től kezdődik.
  • Az oszlopok tartományának lekéréséhez használjon kötőjelet.
  • A nyílt végű specifikációk, például 1- a vagy -3 nem engedélyezettek.
  • A duplikált indexértékek (vagy oszlopnevek) nem engedélyezettek, és hibát okozhatnak.

Tegyük fel például, hogy az adathalmaz legalább nyolc oszlopot tartalmaz, az alábbi példák bármelyikébe beillesztheti, hogy több nem összefüggő oszlopot is visszaadjon:

  • 8,1-4,6
  • 1,3-8
  • 1,3-6,4

az utolsó példa nem eredményez hibát; azonban egyetlen oszloppéldányt 4ad vissza.

Oszlopok sorrendjének módosítása

Az Ismétlődő elemek engedélyezése és az oszlopsorrend megőrzése a kijelölésben lehetőség üres listával kezdődik, és név vagy index alapján megadott oszlopokat ad hozzá. A többi beállítástól eltérően, amelyek mindig a "természetes sorrendben" ad vissza oszlopokat, ez a beállítás a név vagy lista szerinti sorrendben adja ki az oszlopokat.

Például egy Col1, Col2, Col3 és Col4 oszlopot tartalmazó adathalmazban megfordíthatja az oszlopok sorrendjét, és kihagyhatja a 2. oszlopot az alábbi listák egyikének megadásával:

  • Col4, Col3, Col1
  • 4,3,1

Következő lépések

Tekintse meg az Azure Machine Learning számára elérhető összetevőket .